synOCR synOCR - GUI für OCRmyPDF

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Ok, wo ist das in Deckung gehen smiley. Danke
 
Zuletzt bearbeitet von einem Moderator:
  • Haha
Reaktionen: peterhoffmann

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
  • Like
Reaktionen: rmayergfx

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Ich habe jetzt die finale Version 1.2.0 scharf geschaltet :)

@Matthieu ist dabei, sie auf cphub einzubasteln (mit der Hoffnung, dass das Sichtbarkeitsproblem in den Paketzentren dann auch behoben ist).

Die Releasenotes sind zum letzten Prerelease unverändert, aber es gab noch ein paar kleiner Bugfixes.

Noch eine Info:
Die Version für DSM6 wird ab jetzt als BETA geführt, was sich lediglich darin begründet, sie gleichzeitig mit der Version für DSM7 auf cphub bereitstellen zu können. Die meisten nutzen ja inzwischen DSM7, weshalb ich da einen Wechsel berechtigt sah.

Hier die beiden Downloads, wer sie manuell laden möchte:
➜ DSM6
➜ DSM7

Viel Spaß damit
 
Zuletzt bearbeitet:

rmayergfx

Benutzer
Mitglied seit
05. Aug 2013
Beiträge
144
Punkte für Reaktionen
17
Punkte
18
Hallo Stephan,
danke, ist aktualisiert, leider nervt:
WARNING: Error loading config file: .dockercfg: $HOME is not defined
Docker test: WARNING: Error loading config file: .dockercfg: $HOME is not defined
immer noch.

Was mir auch noch aufgefallen ist, kann es sein das die erkannten Tags nun alphabetisch sortiert werden?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Gegen diese Meldung habe ich kein Mittel und auch noch nichts Entsprechendes gelesen.

Zur anderen Sache zitiere ich mich mal selbst aus den Releasenotes:
- die Reihenfolge der Tags kann nun festgelegt werden
Kriterium ist die alphabetische Sortierung der Regelnamen in der YAML-Datei @s-tyle @reneh
 
Zuletzt bearbeitet:
  • Like
Reaktionen: s-tyle

rmayergfx

Benutzer
Mitglied seit
05. Aug 2013
Beiträge
144
Punkte für Reaktionen
17
Punkte
18
Entweder ich steh hier gerade auf dem Schlauch oder ich finde die Erklärung dazu nicht. Das Changelog hab ich gefunden und gelesen, aber nicht die Info wie ich das aktiv beeinflussen kann, ein kleines Beispiel wäre hier hilfreich.
Habe ich z.B. den
tagname: Rechnung
tagname: Mediamarkt
tagname: Toyota

Würde ich bei automatischer Sortierung dementsprechend
#MediaMarkt#Rechnung
#Rechnung#Toyota

bekommen. Was nicht so praktisch wäre, denn hier Wäre es für mich sinnvoll das #Rechnung immer vorne steht. (bzw. wünsche ich mir das so)

Gibt es irgendwo eine ausführliche Beschreibung zu YAML und den Parametern?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Kriterium ist die alphabetische Sortierung der Regelnamen in der YAML-Datei (nicht der Tags). So kannst du eine Sortierung erreichen, die nicht unbedingt einer alphabetischen Reihenfolge der Tags entspricht (will man ja vielleicht gar nicht), ist aber dennoch steuerbar.

Die aktuelle Beschreibung der YAML-Datei wird mit in deren Kopf beim Erstellen geschrieben. Eine detailliertere Dokumentation gibt es derzeit nicht. Aber vielleicht hat ja jemand Lust, das für synOCR beizusteuern, damit man es mit in die Hilfeseite aufnehmen kann.
 

synpi

Benutzer
Mitglied seit
29. Jun 2016
Beiträge
280
Punkte für Reaktionen
14
Punkte
18
Mir ist nach dem Öffnen einer konvertierten Datei das hier aufgefallen: was bedeutet das ? Betrifft ja nicht direkt synOCR, aber vielleicht weiß jemand bescheid ?
 

Anhänge

  • Unbenannt.JPG
    Unbenannt.JPG
    27,6 KB · Aufrufe: 31

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.736
Punkte für Reaktionen
1.642
Punkte
314
  • Like
Reaktionen: geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234

synpi

Benutzer
Mitglied seit
29. Jun 2016
Beiträge
280
Punkte für Reaktionen
14
Punkte
18
Die Frage ist doch, was denn an der Datei überhaupt verändert wird beim Speichern. Möglicherweise sollte eine umgewandelte Datei gegen Änderungen gesichert werden. Mal sehen, ob es Parameter dazu gibt...
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Mindestens das Änderungsdatum wird geändert. Vielleicht werden auch einige Metadaten neu geschrieben.
Warum willst du sie denn speichern und nicht nur schließen, wenn nichts geändert wurde?

Es passiert ja auch nichts schlimmes - lediglich der PDF/A Standard geht möglicherweise verloren.

Möglicherweise sollte eine umgewandelte Datei gegen Änderungen gesichert werden. Mal sehen, ob es Parameter dazu gibt...
After OCR is applied, password protection is not permitted on PDF/A documents but the file can be converted to regular PDF. (LINK)
 
Zuletzt bearbeitet:

rmayergfx

Benutzer
Mitglied seit
05. Aug 2013
Beiträge
144
Punkte für Reaktionen
17
Punkte
18
Kriterium ist die alphabetische Sortierung der Regelnamen in der YAML-Datei (nicht der Tags). So kannst du eine Sortierung erreichen, die nicht unbedingt einer alphabetischen Reihenfolge der Tags entspricht (will man ja vielleicht gar nicht), ist aber dennoch steuerbar.

Die aktuelle Beschreibung der YAML-Datei wird mit in deren Kopf beim Erstellen geschrieben. Eine detailliertere Dokumentation gibt es derzeit nicht. Aber vielleicht hat ja jemand Lust, das für synOCR beizusteuern, damit man es mit in die Hilfeseite aufnehmen kann.
Das Problem, die Datei wurde ja auch schon in der alten Version erstellt, d.h. beim Update habe ich den Kopf ja nicht. Wäre ganz hilfreich den aktuellsten Kopf vielleicht doch in der Hilfe abzulegen? Habe nun einfach mal die YAML neu erstellen lassen und finde leider die Info nicht zur Sortierung!

Was ich auch noch nicht verstanden habe. mit # werden doch normalerweise Kommentare markiert. Warum steht dann gleich in der ersten Zeile vor dem Schlüsselwort ein "#" ?
# synOCR_YAMLRULEFILE # keep this line!
# Der nachstehende Pfad ist im gewünschten Profil in das Feld für die Tags einzutragen:
# /volume1/OCR/input/_TagConfig_[profile_Ralf].txt


###############################################################################################################
# #
# BITTE BEACHTE DIESE ANLEITUNG #
# #
# • es ist sehr wichtig, die korrekten Einrückungen einzufügen #
# • verwende keine Tapstops • nur Leerzeichen! #
# • Verwende die genaue Anzahl von Leerzeichen, wie im Beispiel gezeigt #
# • Tipp: copy & paste den Musterblock und passe ihn dann an #
# • verwende keine Windows-Zeilenumbrüche! #
# • das folgende Schlüsselwort muss in der Datei enthalten sein: >synOCR_YAMLRULEFILE< #
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Da hast du mich falsch verstanden. Bzgl. der Sortierung gibt es keine neuen Informationen im Kopf, aber alles Grundsätzliche bzgl. der Regeldatei. Was du für die Sortierung wissen musst, habe ich dir ja geschrieben: Es wird nach den Regelnamen sortiert. Wenn du die Rechnung halt als Erstes haben möchtest, schreibst du halt AA vor den Regelnamen (AARegelRechnung01) 🤷‍♂️

Was ich auch noch nicht verstanden habe. mit # werden doch normalerweise Kommentare markiert. Warum steht dann gleich in der ersten Zeile vor dem Schlüsselwort ein "#" ?
Weil auch das Schlüsselwort kein YAML-Wert ist, aber in der Datei vorkommen muss.
 

rmayergfx

Benutzer
Mitglied seit
05. Aug 2013
Beiträge
144
Punkte für Reaktionen
17
Punkte
18
Ok, korrigiere mich bitte wenn ich wieder falsch liege.
Regelname = #sampletagrulename1 (diesen kann ich frei definierten, gefolgt von einem ":")
Sortierung erfolgt 0-9, a-z, zuerst Zahlen und dann alphabetisch oder nur alphabetisch? Groß und Kleinschreibung wird bei der Sortierung ignoriert?

d.h.
01_Regelname
02_Regelname
AA_Regelname = aa_Regelname oder aA oder Aa
AB_Regelname = ab_Regelname oder aB_Regelname oder Ab_Regelname
BB_Regelname

oder
AA_Regelname
AB_Regelname
BB_Regelname
01_Regelname
02_Regelname
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Sortierung erfolgt 0-9, a-z, zuerst Zahlen und dann alphabetisch oder nur alphabetisch?
Also grundsätzlich sollten Regelnamen nicht mit einer Zahl beginnen (das sollte ich mal noch mit dokumentieren - dachte das wäre schon so).

Um die Sortierung kümmert sich das Programm sort
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat