synOCR synOCR - GUI für OCRmyPDF

Andreas Blume

Benutzer
Mitglied seit
23. Jan 2023
Beiträge
8
Punkte für Reaktionen
1
Punkte
3
Lieber Stephan,

- keine Ordnerüberwachung
- kein falsches Profii
- da keine Ordnerüberwachung auch kein inotify
- das Symbol war der grüne Haken

In meiner Verzweiflung habe ich deinstalliert und synOCR_DSM7_local.spk neu installiert und von vorne begonnen.
Ich habe jede einzelne Option wieder eingeführt und bin auf das Problem gestossen.
Meine gescannten Dateien beginnen alle mit ABL_
Sobald ich den Wert in das Feld Suchmuster Quelldateiname eintrage kommt es (bei mir) zu dem Effekt, dass synOCR nach 10 Sekunden fertig ist, aber keine Dateien verarbeitet hat (weil es keine findet?)
1689285757151.png

Lasse ich das mit dem Suchmuster weg, dann funktioniert alles wie es soll.
Und vor allem:
Dateien auf die keine Regel passt werden jetzt mit dem alternativen Dateinamen in das Zielverzeichnis geschrieben!
Die Mühe hat sich also gelohnt und ich habe viel dabei gelernt.

Viele Grüße und vielen Dank

Andreas

@Struppix :
Auf deinen Ansatz werde ich noch zurückkommen, habe ihn allerdings noch nicht ganz verstanden. Im Moment bin ich froh, dass es überhaupt wieder geht.

@geimist
Folgende Fehler erscheinen im Log
----------------------------------------------------------------------------------- | search tags in ocr text: | ----------------------------------------------------------------------------------- source for tags is yaml based tag rule file [/volume1/homes/Andreas/T-Technik/Config/_TagConfig_[profile_Andreas].txt] syntax error in row ERROR at line 902 [value of isRegEx must be only "true" OR "false"] syntax error in row ERROR at line 902 [value of source must be only "content" OR "filename"] syntax error in row ERROR at line 902 [value of searchtype must be only "is" OR "is not" OR "contains" OR "does not contain" OR "starts with" OR "does not starts with" OR "ends with" OR "does not ends with" OR "matches" OR "does not match"] syntax error in row ERROR at line 902 [value of multilineregex must be only "true" OR "false"] syntax error in row ERROR at line 902 [value of apprise_attachment must be only "true" OR "false"] syntax error in row ERROR at line 902 [notify_lang must be only one of this values "chs" "cht" "csy" "dan" "enu" "fre" "ger" "hun" "ita" "jpn" "krn" "nld" "nor" "plk" "ptb" "ptg" "rus" "spn" "sve" "tha" "trk"]
Da meine YAML Datei keine 902 Zeilen hat, muss das woanders auftreten, Aber es geht trotzdem alles
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Andreas,
wenn der fallback von Stephan funktioniert, belasse es dabei. Es ist sicherlich die einfachste und stabilere Variante, zumal die meine wesentlich aufwendiger ist.

Karsten
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Sorry, jetzt auch noch eine Antwort von mir.
Sobald ich den Wert in das Feld Suchmuster Quelldateiname eintrage kommt es (bei mir) zu dem Effekt, dass synOCR nach 10 Sekunden fertig ist, aber keine Dateien verarbeitet hat (weil es keine findet?)
Seltsam. Das kann ich hier nicht nachvollziehen.
Welches Statussymbol wird auf der Übersichtseite angezeigt, wenn du das Suchmuster definierst und eine Datei in den Quellordner legst?

Folgende Fehler erscheinen im Log
Weil die Werte in deiner YAML-Datei nicht entsprechend gesetzt wurden. Ich gebe zu, die Formulierung ist etwas zu hart gewählt. Ich bin schon dabei, das umzuformulieren. Fehlen diese Werte, werden die Defaulteinstellungen verwendet. Diese Meldung wird in Zukunft angepasst, bzw. unterdrückt.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Struppix

GruenerHecht72

Benutzer
Mitglied seit
15. Jul 2015
Beiträge
19
Punkte für Reaktionen
1
Punkte
3
Hallo,

gibt es eigentlich eine Möglichkeit die Regeln zum Verschieben und Umbenennen händisch (für bereits verarbeitete Dokumente) auszuführen? Ich habe einige Hunderte Dokumente gescannt und erst jetzt gesehen, dass ich das Umbenennen via YAML-Regeldatei hätte durchführen können.

Danke!
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo,
lese gerade Deine Frage, und ich muss gestehen ich verstehe Sie nicht.

Sind die Dokumente denn schon umbenannt? Geht es Dir nur um das Verschieben?

Karsten
 

GruenerHecht72

Benutzer
Mitglied seit
15. Jul 2015
Beiträge
19
Punkte für Reaktionen
1
Punkte
3
Hallo Karsten,

ich habe die Dokumente bislang nach einem sehr einfachen Schema umbenannt (§ysource-§msource-§dsource - §tit) und diese auch nicht automatisch verschieben lassen (liegen also alle noch in einem Ausgabeordner). Jetzt würde ich gerne insb. das komplexere Umbenennen nachholen. Verschieben ist nicht unbedingt wichtig.

Danke und Grüße!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Dazu musst du sie nochmal in den Quellordner verschieben. In den OCR Optionen würde ich dir den Schalter -s empfehlen (sollte wohl Standard sein) - der steht für „skip Text“ und führt kein erneutes OCR durch, sofern schon ein Textlayer gefunden wurde.
 
Zuletzt bearbeitet:

tomjons

Benutzer
Mitglied seit
05. Jun 2013
Beiträge
68
Punkte für Reaktionen
4
Punkte
8
Hallo zusammen,

ich habe "leider" letzte Woche auf die aktuellste Version upgedatet. Jetzt klappt leider die Generierung der Dateinamen nicht mehr.
Diese sollte sich aus Bestellnummer_Rechnung_Belegnummer zusammensetzen z.B. 183891_Rechnung_2023-556611.

Aktuell jedoch werden nur folgende Dateinamen erzeugt: _Rechnung_2023-556611

es fehlt quasi die Bestellnummer.

Anbei meine Log-Datei sowie das Profil.

Vielen Dank für eure Unterstützung
 

Anhänge

  • synOCR_2023-07-17_12-31-47.txt.log.zip
    17,2 KB · Aufrufe: 3
  • _TagConfig_[profile_default].zip
    794 Bytes · Aufrufe: 5

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Das Log ist nicht vollständig, sondern du scheinst es während der aktuellen Abarbeitung gespeichert zu haben. Derzeit ist nur der OCR-Prozess geloggt. Die Tagsuche findet erst im Schritt 2 statt.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Bitte korrigierte mal die Zeilen casesensitive: false in deiner Regeldatei. Nach false steht z.T. ein Tabulator und Leerzeichen.
 
  • Love
Reaktionen: tomjons

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Ich hab gleich mal eine Funktion eingebaut, die diesen Fehler in Zukunft abfängt.
 
Zuletzt bearbeitet:

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Du könntest auch den Editor verwenden, der diese Fehler nicht ermöglicht.
@geimist, nicht das Du mich arbeitslos machst ;) :D
ich habe "leider" letzte Woche auf die aktuellste Version upgedatet. Jetzt klappt leider die Generierung der Dateinamen nicht mehr.
Diese sollte sich aus Bestellnummer_Rechnung_Belegnummer zusammensetzen z.B. 183891_Rechnung_2023-556611.

Aktuell jedoch werden nur folgende Dateinamen erzeugt: _Rechnung_2023-556611

es fehlt quasi die Bestellnummer.
Du kannst für Amazon-Rechnungen ja mal diese Variante versuchen. Da ist dann auch ua. Verkäufer, Artikel, Bestellnummer enthalten. Die Rechnungsnummer könnte man leicht ergänzen.

Gruß Karsten
 
  • Love
Reaktionen: geimist

Jesse69

Benutzer
Mitglied seit
22. Aug 2008
Beiträge
60
Punkte für Reaktionen
3
Punkte
8
Neuinstallation (auf ner neuen DS)

die 1.4er hab ich nicht dazu bewegen können, etwas außer dem Datum zu benennen. Daher dann Deinstalliert und die 1.33 drauf.
Selbes Problem.

Ich lad mal meine Log hoch dazu.

neu DS220+ DSM 7.2-64570 Update 1
alt DS216+ DSM 7.2-64570 Update 1
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Was soll den gefunden werden?

Code:
  -----------------------------------------------------------------------------------
  | search tags in ocr text:                                                        |
  -----------------------------------------------------------------------------------

                no tags defined
 
  • Like
Reaktionen: Jesse69

Jesse69

Benutzer
Mitglied seit
22. Aug 2008
Beiträge
60
Punkte für Reaktionen
3
Punkte
8
C
Was soll den gefunden werden?

Code:
  -----------------------------------------------------------------------------------
  | search tags in ocr text:                                                        |
  -----------------------------------------------------------------------------------

                no tags defined
CHECK!

Aber : /volume1/Scan/in/_TagConfig_[profile_Tom69_Basis].txt
da steht das dann ja auch drinne. Die Datei liegt im In-Verzeichnis vor.

Hab ich gerade ne Blockade ?

1689758598958.png
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.532
Punkte für Reaktionen
1.372
Punkte
234
Deine Logdatei wurde von dem Profil default erzeugt. Deine Regeldatei hast du mal mit dem Profil Tom69 erstellt. Das ist auch kein Problem, aber vielleicht ein Indiz dafür, dass du mehrere aktive Profile hast? Das default-Profil kennt die Regeldatei laut Log nicht.
 
  • Like
Reaktionen: Jesse69

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Deine Logdatei wurde von dem Profil default erzeugt. Deine Regeldatei hast du mal mit dem Profil Tom69 erstellt. Das ist auch kein Problem, aber vielleicht ein Indiz dafür, dass du mehrere aktive Profile hast? Das default-Profil kennt die Regeldatei laut Log nicht.
die den gleichen Input Ordner verwenden, richtig?
Interessante Geschichte. Wie lösen das die anderen User hier?

Karsten
 
  • Like
Reaktionen: Jesse69


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat