synOCR synOCR - GUI für OCRmyPDF

wegomyway

Benutzer
Sehr erfahren
Mitglied seit
03. Aug 2022
Beiträge
1.196
Punkte für Reaktionen
517
Punkte
184
War 'nen paar Tage "offline" zur 224+, nun wieder drin/dran und hab mal Dokus eingescannt, wo ich alles eingerichtet habe und auch schon erfolgreich einsortiert wurden. Jetzt werden die erkannt, aber nicht dorthin verschoben, wo sie hin sollen.
Aktuell hab ich synOCR als 1.4.5er drauf, lese hier aktuell nur von einer vorliegenden Beta. Ist meine vorhandene Aktuell?
Werde mal das Monitoring stoppen und wieder neu starten (obwohl ich das im Aufgabenplaner als Script drin habe).
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
Prima, dass dein Netz wieder läuft :)
Die Beta adressiert hauptsächlich ein paar Details in Verbindung mit der Datumssuche. Die Version 1.4.5 ist der aktuelle Release.

Jetzt werden die erkannt, aber nicht dorthin verschoben, wo sie hin sollen.
Da gehe ich mal stark von einem Regelproblem aus.
Benutzt du eine externe YAML-Regeldatei? Kannst du sie mal posten?
Im Loglevel 2 (einzustellen in der GUI ganz unten) werden auch die Matches der einzelnen Regeln geloggt. Das ist sicherlich auch hilfreich beim Ergründen.
 

wegomyway

Benutzer
Sehr erfahren
Mitglied seit
03. Aug 2022
Beiträge
1.196
Punkte für Reaktionen
517
Punkte
184
@geimist, ich kann mich noch erinnern, dass ich wirklich akribisch meine analogen Dokus gesichtet und sortiert habe. Danach entsprechend die "Suchbegriffe" gewählt habe. Dabei erst recht aufgepasst habe, dass ich keinerlei Doppelungen/Zweideutigkeit als "Suchbegriff" nutze. Das hat gedauert, aber hat auch viel gebracht um "halbwegs" zu verstehen wie das aussehen muss. Daher staune ich aktuell doch ein wenig.
Natürlich nutze ich den YAML-Editor, der dann 'ne die *.txt erstellt und die wird dann hochgeladen (im übrigen für mich, wenn man sich damit beschäftigt, fast schon wieder selbsterklärend).
Code:
rule_1075:
#X#X#: die Wohnung
    targetfolder: /volume1/Dokumente/Charlotte_Wohnung
    postscript: mv "${output}" "${output%/*}/$(echo "${output##*/}" | sed 's/ /_/g')"
    condition: all
    subrules:
    - searchstring:
      searchtyp: contains


rule_1076:
#X#X#: die Wohnung
    tagname: §tagname_RegEx
    tagname_RegEx: (?i)(Betriebs- und Heizkostenabrechnung|Einzelabrechnung Energie- und Betriebskosten)
    condition: all
    subrules:
    - searchstring: (?i)(Betriebs- und Heizkostenabrechnung|Einzelabrechnung Energie- und Betriebskosten)
      searchtyp: contains
      isRegEx: true
#X#X#: die Wohnung
    - searchstring: Wohnung
      searchtyp: contains

Ich weiß, es geht einfacher/kürzer. Aber es hat damals und auch zwischendurch funktioniert. Die beiden Begriffe sind 1zu1 als Betreff ordentlich groß und Fett auf den Abrechnungen vorhanden. Immer an gleicher Stelle und immer gleichlautend. Die Begriffe werden ja auch erkannt, aber landen nicht dort wohin. Das Log als PDF, weil sind 'ne Menge Seiten. Selbst das Datum wird jeweils, verglichen mit anderen erfolgreich gescannten, korrekt erkannt.
 

Anhänge

  • log.pdf
    192,6 KB · Aufrufe: 2

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Holger,

ich könnte mir vorstellen, wenn Verzeichnis passt und Du im GUI den Eintrag "Regel basierte Ordner" gewählt hast, dass die Regel 1075 nicht richtig zugeordnet werden kann.

Entweder schreibst Du den targetfolder in die Regel 1076, oder Du ergänzt den Suchstring Wohnung in Regel 1075.

Oder verwendest Du Regel 1075 als pauschale quasi "Verschiebe Routine" in dem kompletten Profil ?
Also ich vermeide solche Sachen, wenn dem so wäre, da das nicht stabil funktioniert, bei mir zumindest nicht. Somit schreibe ich den targetfolder und die postscript Befehle immer in die oberste Regel des Umbenennungsblockes.

Bin gerade dabei hierfür etwas im YAML-Editor zu integrieren, wenn ich den damit mal fertig werde.
Derzeit erstelle ich gerade ein Deutsch / Englisch Version, die schon recht weit ist. Das hat ein wenig Vorrang.

Gruß Karsten

Edit: Schaue mir gerade das LOG an, hatte das übersehen. Und es ist genau wie ich oben schreibe. Also noch einmal

"Entweder schreibst Du den targetfolder in die Regel 1076, oder Du ergänzt den Suchstring Wohnung in Regel 1075."
 
  • Like
Reaktionen: geimist und wegomyway

wegomyway

Benutzer
Sehr erfahren
Mitglied seit
03. Aug 2022
Beiträge
1.196
Punkte für Reaktionen
517
Punkte
184
@geimist und @Struppix, nehme mir das hier zu Herzen und gehe da nochmals, speziell @Struppix nicht nur, die Anmerkungen durch 😌. Heut Abend ist Zeit, nachdem ich ja nun wieder "online" bin.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat