synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
Ja, du hast Recht!

Ich muss offensichtlich die condition-Prüfung (ab Zeile 755) nochmal überdenken, oder es wie du pauschal für die gesamt Schleife zurücksetzen.

Da werde ich mal in mich gehen - wird aber nicht mehr heute.
Vielen Dank fürs Analysieren!

PS: found ist das endgültige Ergebnis - grepresult ist untergeordnet.
 
  • Like
Reaktionen: gaz72

h11od

Benutzer
Mitglied seit
15. Jul 2020
Beiträge
2
Punkte für Reaktionen
0
Punkte
7
Hallo geimist,

ich bin durch Zufall vor einer Woche über deine Lösung gestolpert und muss sagen wirklich tolles Tool, von dem ich vorher nicht gewusst hab, dass ich es brauch.
Auch die Tags mit der neuen Version über yaml Files einzulesen, finde ich einen sehr guten Schritt.

Allerdings habe ich ein Problem mit den Profilen und ich hoff ich hätte nicht nur besser googlen müssen um die Antwort zu finden.
Laut Beschreibung werden bei jedem Durchlauf alle aktiven Profile benutzt.
Ich habe das so verstanden, dass dann anhand der tags das passende Profil gewählt wird oder eben mehrere.

Bei meinen Tests wurde immer nur das erste aktive Profil genommen und die weiteren Ignoriert, obwohl nur ein Profil wirklich passt.
Wenn das richtige Profil gewählt wurde, dann passt alles (verschieben und umbenennen).

warum ich nicht alles in ein Profil pflege hängt mit meiner Namensgebung zusammen und da ich nicht z.B. 10 Tags im Dateinamen haben möchte.
Bsp
Rechnung allgemein beginnen bei mir mit RN
Rechnung wie Auto mit RN_KFZ
usw

So jetzt zur eigentlich Frage, benutz ich es so richtig? bzw mach ich etwas falsch? oder bin ich einfach nur zu dumm...

Danke und Gruß
Tobi
 

h11od

Benutzer
Mitglied seit
15. Jul 2020
Beiträge
2
Punkte für Reaktionen
0
Punkte
7
Danke für dich schnelle Antwort!

damit hätte ich noch eine kurze Zusatzfrage, könnte ich generell meinen Use Case mit synOCR so abbilden?
 

ulli_um

Benutzer
Mitglied seit
20. Jun 2012
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
@geimist:
Servus!

Jetzt habe ich das setzten der Labels in DS Drive über ein Perl Skript gelöst. d.h. es muss nur das Perl Package auf der DS installiert sein.
Wie willst du es machen? (Ich denke nur die Label setzten als Funktion ist wichtig oder willst du auch Labels abrufen oder sonstige Infos aus dem DS Drive?)
Möglichkeiten:
1) Du rufst das Skript aus deinem SynOCR auf wenn die Labels alle bekannt sind.
2) Ich mach es komplett getrennt und überwache das Ausgangsverzeichnis. Dann muss ich aber wieder den Dateinamen zerlegen... :(
3) Du fügst in dein Skript die Möglichkeit ein das der User ein Post-Skript in deiner UI angeben kann und übergibst dem Skript in einer festen Syntax einfach die Infos die beim SynOCR schon entstehen.

Ich fände die dritte Möglichkeit eigentlich am besten, das wäre am Universalsten.

Wie wäre für dich der geeignete Parametersatz als Übergabe?
SynologyDrive.pl -u <user> -p <password> -l <Labels Komma getrennt?> <File-Path in DS-Drive>)

Viele Grüße,
Ulli
 
Zuletzt bearbeitet:

Nils_

Benutzer
Mitglied seit
25. Okt 2010
Beiträge
39
Punkte für Reaktionen
3
Punkte
8
Moin geimist,

vielen Dank für deine Arbeit an synOCR. Ich nutze es sehr gerne.

Ich habe allerdings das selbe Problem wie OpaHeinz. Bei mir wird bei den ocr'ten PDFs immer ein " (1)" im Titel ergänzt. Dies passiert obwohl die Datei nicht vorhanden ist. Hier der Output-Ordner:

Unbenannt.JPG
Im Logfile sagt er "File name already exists! Add counter (1)". Dies ist aber definitiv nicht korrekt.

Gruß
Nils
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
Sehr interessant … :unsure:
Ist das bei jeder Datei so?
Ich würde dich dennoch einmal um ein Log bitten - kannst du mir ja per PN schicken.
 

tom9865

Benutzer
Mitglied seit
20. Feb 2013
Beiträge
75
Punkte für Reaktionen
0
Punkte
6
Hi, danke für die stetigen Updates und Erweiterungen!
Habe jetzt mit der konvertieren Regeln zu YAML Funktion versucht umzustellen.
Im log erscheint jetzt bei mir jedoch:

parse error: Invalid numeric literal at line 1, column 6

Verarbeitet werden die Dateien, jedoch nicht umbenannt.

Zudem wird mir im Log folgender Fehler gemekldet:
edit metadata ERROR - exiftool not found! Please install it over cphub.net - heißt einfach EEXIFTool als SPK installieren?

Hat jemand dasselbe Problem?

Grüße,
Tom
 

gaz72

Benutzer
Mitglied seit
23. Okt 2019
Beiträge
7
Punkte für Reaktionen
0
Punkte
1
„parse error: Invalid numeric literal at line 1, column 6“ hatte ich am Anfang auch. Bei mir lag es daran, dass der Regelname mit einer Zahl anfing. Sonderzeichen (bei mir . - @) mochte er auch nicht.
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Hey @geimist,
laut Release Notes sollte die yaml-Datei die bestehenden Rules konvertieren und als Beispiel einfügen. Das passiert bei mir allerdings nicht.
In der yaml-txt befindet sich "nur" die Beschreibung der keywords, aber leider kein Beispiel und auch nicht meine kovertierten Regeln. Nur anhand der keyword-Beschreibung tue ich mich leider recht schwer eine neue yaml-Config from scratch zu erstellen. Könntest du ggf. ein Sample hier posten?

EDIT:
Hab das Sample im Source Code gefunden. Damit kann ich was anfangen. Hät ich auch mal früher drauf kommen können.
 
Zuletzt bearbeitet:

Tillerbach

Benutzer
Mitglied seit
05. Jul 2020
Beiträge
11
Punkte für Reaktionen
0
Punkte
7
Hallo Stephan,

viel Erfolg mit dem Point release! Das ist wirklich ein sehr nützliches Stück Software.
Tatsächlich habe ich seit der Version 1.0 ein seltsames Problem.

Die Dateien werden gescannt und in den Backup-Ordner verschoben. Im Log kann man sehen, dass die PDF's gescannt und bearbeitet wurden, entsprechend werden auch neue Ordner werden, entsprechen der Konfigurationsdatei, angelegt. Alles wunderbar.

Lediglich die Dateien fehlen. Die bearbeiteten Dateien werden nicht in den Ordnern abgelegt, sondern "verschwinden" im Nirvana.
Benötigt evtl. ein bestimter Benutzer oder Systemuser Berechtigungen auf dem bzw. den Ordnern?

Vielen Dank und beste Grüße
Peter
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
laut Release Notes sollte die yaml-Datei die bestehenden Rules konvertieren und als Beispiel einfügen. Das passiert bei mir allerdings nicht.
In der yaml-txt befindet sich "nur" die Beschreibung der keywords, aber leider kein Beispiel und auch nicht meine kovertierten Regeln.
Hier würde mir das Log-File weiterhelfen.
Evtl. hast du einen Inputordner für verschiedene Profile?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
Lediglich die Dateien fehlen. Die bearbeiteten Dateien werden nicht in den Ordnern abgelegt, sondern "verschwinden" im Nirvana.
Benötigt evtl. ein bestimter Benutzer oder Systemuser Berechtigungen auf dem bzw. den Ordnern?
synOCR läuft unter root - das sollte nicht das Problem sein.
Siehst du die Zieldateien evtl. in der Filestation, aber nicht auf dem Client (Netzwerkfreigabe / Drive-Sync ect.)?
Hab das Sample im Source Code gefunden. Damit kann ich was anfangen.
Und diese Zeilen fehlen in deinem automatisch erstellen YAML-File?
Wo endet es?
Das Log würde ich mir auch hier gern einmal ansehen.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
parse error: Invalid numeric literal at line 1, column 6

Verarbeitet werden die Dateien, jedoch nicht umbenannt.
Bitte auch hier ein Log schicken.
Zudem wird mir im Log folgender Fehler gemekldet:
edit metadata ERROR - exiftool not found! Please install it over cphub.net - heißt einfach EEXIFTool als SPK installieren?
Das ist optional. Sofern das Exiftool installiert ist (der einfachste Weg über cphub.net), werden die Tags in die Metadaten geschrieben
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.488
Punkte für Reaktionen
1.325
Punkte
234
„parse error: Invalid numeric literal at line 1, column 6“ hatte ich am Anfang auch. Bei mir lag es daran, dass der Regelname mit einer Zahl anfing. Sonderzeichen (bei mir . - @) mochte er auch nicht.
Danke für das Feedback. Das hilft enorm weiter! Ich schaue es mir an.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat