synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Bei mir werden PDFs welche in Tagordner einsortiert werden sollen, einfach gelöscht bzw. der Ordner wird nicht angelegt, wenn die Variable "Tags im Dateinamen kennzeichnen" leer ist. … Wenn ich # drinnen lasse, dann heisst der Ordner "%23abc".

Bugfix ist auf dem Weg …
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
Hallo zusammen,
Habe mir gerade eine Tagliste in Excel erstellt. Damit kann ich die Reihenfolge der Tags festlegen (z.B. zuerst die Tags mit den Absendern, dann die mit den Empfängern, dann Inhalttags).

Ich bastel auch immer an Tags und will alles und mehr + x :)

Ich verstehe Deinen "Excel Ansatz" nicht. Klingt aber interessant. Evtl. kann ich was lernen. Kannst Du bitte näher erklären was Du damit machst?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Ich hatte synOCR upgedatet und ein paar Tage später fiel mir auf, dass manche frische Dateien ein merkwürdiges Dateidatum (z.B. 20.08.2082) hatten.
Da lebe ich bestimmt nicht mehr. ;)

Den Übeltäter habe ich schnell gefunden. Es war die neue Option "Dateidatum korrigieren", die auf "gefundenes OCR-Datum" stand (nie ausgewählt).

Ich finde neue Funktionen wirklich toll, ohne Frage, aber dann sollten sie beim Update nicht eingeschaltet sein, sondern erst mal den Zustand von vor dem Update weiterhin durchführen.
Vielleicht wäre es auch möglich die Prüfung vom Datum auf Schlüssigkeit zu prüfen. Das Jahr 2082 ist ja eher nicht so schlüssig um es für das Dateidatum zu übernehmen.

Nach aller Kritik noch eine Tonne Lob: :)
Das Tool ist absolut klasse. Ich verneige und bedanke mich in aller Form beim Programmierer (User geimist). Wenn ich etwas für die Synology und auf dem Weg zum papierlosen Büro empfehlen kann, dann ist es dieses Tool.
 

tom9865

Benutzer
Mitglied seit
20. Feb 2013
Beiträge
75
Punkte für Reaktionen
0
Punkte
6
Hi,

danke erstmal für das super Tool. Leider funktioniert es bei mir seit dem letzten update nicht mehr.
Input Settings - also Scan Einstellungen habe ich nicht verändert...

Kann mir evtl jemand helfen?

Danke und Gruß,
Tom

hier mal der Auszug des letzten Logs:

PROCESSING: ? Scan_20200310_0001.pdf (Tue Mar 10 19:02:59 CET 2020)
temp. target file: /tmp/tmp.tNC9ygatR7/Scan_20200310_0001.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Using Tesseract OpenMP thread limit 2
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)

PROCESSING: ? Scan_20200303_0007.pdf (Tue Mar 10 19:07:21 CET 2020)
temp. target file: /tmp/tmp.PwKoeOvZlL/Scan_20200303_0007.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Start processing 2 pages concurrent
WARNING - 1: [tesseract] lots of diacritics - possibly poor OCR
ERROR - GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_vDHdiH
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript PDF/A rendering failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
?? move to ERRORFILES

PROCESSING: ? Scan_20200303_0008.pdf (Tue Mar 10 19:10:56 CET 2020)
temp. target file: /tmp/tmp.DdmjHtu18U/Scan_20200303_0008.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Using Tesseract OpenMP thread limit 2
WARNING - 1: 1: [tesseract] took too long to OCR - skipping
ERROR - GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_cGe70i
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript PDF/A rendering failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
?? move to ERRORFILES

PROCESSING: ? Scan_20200303_0001.pdf (Tue Mar 10 19:16:08 CET 2020)
temp. target file: /tmp/tmp.UEB1rroFqm/Scan_20200303_0001.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Start processing 2 pages concurrent
ERROR - GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_1Mzi80
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript PDF/A rendering failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Das sieht mir nach einem Fehler im OCRmyPDF-Container aus. Kannst du das Image mal in Docker löschen, bzw. ein anderes wählen?
 

tom9865

Benutzer
Mitglied seit
20. Feb 2013
Beiträge
75
Punkte für Reaktionen
0
Punkte
6
Danke vielmals, jetzt hat sich die Fehlermeldung zumindest verändert... :)
Noch eine Idee?

PROCESSING: ? Scan_20200310_0002.pdf (Tue Mar 10 19:54:02 CET 2020)
temp. target file: /tmp/tmp.WcJXfhafjZ/Scan_20200310_0002.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Start processing 2 pages concurrent
ERROR - 2: GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_eA4J73
GPL Ghostscript 9.27: Could not open the scratch file /tmp/gs_eA4J73.
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript rasterizing failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
?? move to ERRORFILES

PROCESSING: ? Scan_20200303_0001.pdf (Tue Mar 10 19:56:03 CET 2020)
temp. target file: /tmp/tmp.A8P1pV1Ait/Scan_20200303_0001.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Start processing 2 pages concurrent
ERROR - GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_pXG6R0
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript PDF/A rendering failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
?? move to ERRORFILES

PROCESSING: ? Scan_20200303_0002.pdf (Tue Mar 10 20:00:39 CET 2020)
temp. target file: /tmp/tmp.orJvriQoay/Scan_20200303_0002.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Using Tesseract OpenMP thread limit 2
WARNING - 1: 1: [tesseract] took too long to OCR - skipping
ERROR - GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_Nrodll
**** Unable to open the initial device, quitting.

ERROR - SubprocessOutputError: Ghostscript PDF/A rendering failed
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Auch hier ist die Fehlermeldung innerhalb des Dockercontainers. Ich kann hier keinen Zusammenhang zu synOCR sehen.
Evtl. mal mit minimalen Parametern versuchen :confused:
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
Danke vielmals, jetzt hat sich die Fehlermeldung zumindest verändert... :)
Noch eine Idee?

PROCESSING: ? Scan_20200310_0002.pdf (Tue Mar 10 19:54:02 CET 2020)
temp. target file: /tmp/tmp.WcJXfhafjZ/Scan_20200310_0002.pdf

? OCRmyPDF-LOG:
INFO - reading file from standard input
INFO - Start processing 2 pages concurrent
ERROR - 2: GPL Ghostscript 9.27: **** Could not open temporary file /tmp/gs_eA4J73

evtl. die Rechte mit denen der Container läuft? Keine Schreibrechte auf /tmp Ordner?
 

turrax

Benutzer
Mitglied seit
12. Mrz 2020
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Hallo bei meiner ds218j funktioniert leider die App nicht.. dort steht das mein armv7l nicht unterstützt wird.. Obwohl bei cphub steht für alle Architekturen..

Wäre nett wenn da vielleicht ein Bugfix heraus kommen würde
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Das Paket baut auf Docker auf, was wiederum nur auf Geräten mit Intel 64Bit CPUs läuft.
… Obwohl bei cphub steht für alle Architekturen …
Es gibt kompatible Geräte, die seitens Synology das Dockerpaket nur inoffiziell installieren können - also offiziell nicht unterstützt werden. Um diesen Geräten dennoch die Installation zu ermöglichen, gibt es derzeit keine Architekturbeschränkung. Aber du hast Recht: vielleicht sollte ich es nochmal versuchen etwas genauer zu spezifizieren.
 

turrax

Benutzer
Mitglied seit
12. Mrz 2020
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Sie könnte es doch auch ohne Docker entwickeln,
sicherlich ist Docker ein saubere , sichere Sache, aber die Sicherheit fängt doch nicht erst bei ihrer Erweiterung an
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Von mir stammt lediglich die GUI für OCRmyPDF. Mit OCRmyPDF selbst habe ich nichts zu tun. Sollte jemand OCRmyPDF nativ auf einer ARM-DS zum Laufen bekommen, dann wird die GUI das kleinste Problem sein.
 

Nybass

Benutzer
Mitglied seit
27. Mai 2010
Beiträge
93
Punkte für Reaktionen
3
Punkte
8
Hallo zusammen,

ich bin gerade dabei das Tool in Betrieb zu nehmen. Zuerst hatte ich das synOCR installiert und gesehen, dass Docker nicht gefunden wird. Der Docker war bereits installiert aber gestoppt....Nach dem Starten des Dockers war die Infomeldung bei synOCR verschwunden und ich habe das ganze konfiguriert (vor allem die Quell und Ziel Ordner). Auf der Startseite wird nun auch angezeigt, dass ein Dokument gefunden wurde. Beim manuellen Starten wird folgende Logdatei mit einem Fehler erstellt. Kann mir jemand weiterhelfen?
In meinem Docker taucht unter Abbild oder COntainer nichts neues auf - müsste er dort nichts etwas installieren?

Danke und Grüße
Timo

-----------------------------------
| ==> Installationsinfo <== |
-----------------------------------

synOCR-user: root
synOCR-Version: 0.16.3
Architecture: x86_64
DSM-build: 15101
Device: 3615xs (3762341579)
current Profil: Drucker
DB-version: 2
Error: No such image or container: jbarlow83/ocrmypdf:latest
used image (created): jbarlow83/ocrmypdf:latest ()
used ocr-parameter: -srd -l deu
replace search prefix: no
renaming syntax: §yocr_§mocr_§docr §tit
Symbol for tag marking: #
source for filedate: ocr
Docker Test: OK
Loglevel: extended
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume2/drucker/input/
Target directory: /volume2/drucker/output/
BackUp directory: /volume2/drucker/backup/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------

PROCESSING: ? 20200301scan0028.pdf (Sat Mar 14 08:28:47 CET 2020)
temp. target file: /tmp/tmp.FdxpvrBSGC/20200301scan0028.pdf

? OCRmyPDF-LOG:
flag provided but not defined: -log-driver
See '/usr/local/bin/docker run --help'.
? OCRmyPDF-LOG-END

?? failed! (target file is empty or not available)


-----------------------------------
| ==> synOCR ENDE <== |
-----------------------------------
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Du kannst mal in Docker das entsprechende Image (jbarlow83/ocrmypdf:latest) manuell über die Registrierung herunterladen und dann nochmal testen.

P.S.: Du hast ein sehr veraltetes DSM installiert - nutzt du xpenology?
 

Nybass

Benutzer
Mitglied seit
27. Mai 2010
Beiträge
93
Punkte für Reaktionen
3
Punkte
8
HI Stephan,
danke für die schnelle Antwort.
Wie du bereits vermutest hast, nutze ich Xpeonology...
Das entsprechende Docker Image habe ich heruntergeladen. Leider gleiches Ergebnis.
Beim manuellen Starten von ocrmypdf habe ich festgestellt, dass dieses mit einem Fehler beendet wird: "Docker-Container: jbarlow83-ocrmypdf1 wurde unerwartet gestoppt."
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Es ist normal, der der Container nicht dauerhaft läuft. Er wird nur für die Verarbeitung einzelner PDFs temporär gestartet und anschließend wieder gelöscht. Was mich noch etwas wundert ist die Meldung:
Rich (BBCode):
? OCRmyPDF-LOG:
flag provided but not defined: -log-driver
See '/usr/local/bin/docker run --help'.
? OCRmyPDF-LOG-END
Möglicherweise ist deine Dockerversion veraltet …
Kannst du das Dockerpaket aktualisieren?
 

Nybass

Benutzer
Mitglied seit
27. Mai 2010
Beiträge
93
Punkte für Reaktionen
3
Punkte
8
Bei mir ist der Docker auf dem aktuellsten Stand.
Wenn ich deine Docker Datei manuell installieren will, dann kommt die Meldung, dass ich mindestens DSM 6.1 benötige.
Dann liegt es wohl an der veralteten DSM Version?!

Muss ich mir doch mal die Mühe machen und das System neu aufsetzen - wollte ich eigentlich erst nach meinem Umzug ;)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Du hast ja schon DSM 6.1, aber scheinbar eine der ersten Versionen. Vielleicht hilft es schon, die Updates einzuspielen.
 

Nybass

Benutzer
Mitglied seit
27. Mai 2010
Beiträge
93
Punkte für Reaktionen
3
Punkte
8
Stimmt. 6.1-15101 habe ich und 6.1-15163 erwartet deine Docker Datei.
Ich war bisher immer vorsichtig mit den UZpdates ... nicht, dass der Bootloader dann das System nicht mehr startet
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat