synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Ich selbst nutze auch nur nach Jahren sortierte Ordner.
Auch das schreibe ich mir mit auf, aber das wird (vielleicht) irgendwann einmal.
 

tiaa

Benutzer
Mitglied seit
28. Mai 2013
Beiträge
7
Punkte für Reaktionen
3
Punkte
53
Hallo Stephan,
Im Nachhinein denke ich auch das es bereits genügen würde wenn die Struktur "nur" das jeweilige Jahr als Stufe hätte. Danke jedenfalls für die Aufnahme auf deine Liste.

Gruss tiaa
 

ramsesderzweite

Benutzer
Mitglied seit
21. Okt 2011
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Hallo Stephan

Ich nutze synOCR auf der Beta von DSM 7.0 und obwohl mir eineFehlermeldung im Paketzentrum angezeigt wird und sogar der Sicherheitsberater synOCR als Schadprogramm einstuft, werden gescannte PDFs trotzdem OCR-isiert. Gespannt warte ich auf eine DSM 7 kompatible Version und freue mich bereits darauf!

Als Beta-Tester von DSM 7 hatte ich ein Problem mit dem Ressourcenmanager und dieses mit Synology diskutiert. Es ging darum, dass dieser auf einmal nicht mehr läuft, respektive nicht mehr darauf verbunden werden kann. Das Widget auf dem Desktop zeigt dann einfach 0% für alle Werte an und die Ressourcenmanager-Applikation startet nicht mehr mit dem Verweis, dass das Netzwerkinterface nicht verfügbar ist.

Die Analyse dieses Problems scheint gemäss Synology Development aber irgendwo einen Zusammenhang zwischen dem synosnmpcd und synOCR zu haben. Jedenfalls lautet der Feedback von Synology wie folgt (wahrscheinlich wurde der Text mit Google Translate aus dem Chinesischen übersetzt, daher holpert der Text etwas...):

----- Start der Nachricht von Synology -----
Regarding the problems you encountered, there is now a guess:

-From the log point of view, a large number of docker logs with Failed to delete conntrack state for <ip-address>: invalid argument appeared. This log our own test is generated when the container is closed.
-You have used synOCR, from the environment and source code (https://geimist.eu:30443/geimist/synOCR/src/branch/branch_1.0/APP/synOCR.sh#L415)
This will scan the pdf file specified by the user every day from 7 am to 23 am.
-Scan a document, synOCR will open a docker container, that is, a new network interface will be generated, and it will be closed after scanning.
-The more files scanned, the higher the chance that synosnmpcd will not respond, causing the resource monitor to fail to respond.

You mentioned that synOCR is temporarily unavailable in 7.0, and my actual installation will indeed be blocked.

However, in your environment, the synOCR command can be found under /etc/crontab.

This must be confirmed by you that it is not a normal state , If it’s not possible please handle it manually, or discuss with the author/community of synOCR.

In addition, it also helps to confirm how many pdfs the you have to scan.

Looking at the log, your DSM has been switched on and off the container for almost an hour and 60 minutes, indicating that there may be too many files, which may cause the scan to be unfinished in an hour.

Has been in a state of being unable to respond.
----- Ende der Nachricht von Synology -----

Ich hatte tatsächlich einige Dokumente gescannt und mit synOCR verarbeitet. Den Zusammenhang mit synosnmpcd kann ich aber leider nicht beurteilen oder kommentieren.

Ich dachte, ich schicke dir diese Nachricht einfach mal weiter. Habe keine Ahnung, ob dir das was hilft in der Anpassung von synOCR für DSM 7, aber vielleicht trägt es ja irgendetwas dazu bei, synOCR bald wieder kompatibel zu bekommen.

Beste Grüsse und viel Erfolg!
Daniel
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Das ist schon eigenartig. Es wird für jedes Dokument ein temporärer Container erstellt und nach Abschluss wieder verworfen.

Wie sehen denn die Logs von synOCR aus?
Werden Dokumente ordnungsgemäß nach angemessener Zeit (wenige Minuten) fertiggestellt? Ich weiß nicht, warum es da zu einer Art Schleife kommen sollte.
Kannst du beim Abarbeiten ein auffälliges Verhalten des synOCR-Containers in der Docker-GUI beobachten?

Es gibt ja nur die eine Zeile Code, die für die Interaktion mit dem Dockercontainer ocrmypdf zuständig ist. Ich weiß nicht, was ich da noch ändern könnte … Vielleicht hat unser Dockerspezialist @haydibe eine Idee?

Ich weiß auch nicht, warum jeder Start eine eigene Netzwerkschnittstelle erzeugen sollte. Der Container läuft bei mir im Bridge-Mode.
 

ramsesderzweite

Benutzer
Mitglied seit
21. Okt 2011
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Hallo Stephan
Die Logs von synOCR sehen absolut unverdächtig aus! Der Vorgang für ein Dokument dauert ca. 20 Sekunden und es wird keinerlei Fehlermeldung ausgegeben.
Auch der Docker-Container zeigte bis anhin keine Auffäilligkeiten, die Dokumente wurden ja sauber konvertiert. Der Container läuft bei mir übrigens ebenfalls im Bridge-Mode.
Um Fehlerquellen ausschalten zu können habe ich OCRmyPDF im Docker disabled und warte nun auf ein DSM7 kompatibles Package.
Danke und Grüsse
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234

haydibe

Benutzer
Sehr erfahren
Mitglied seit
12. Apr 2016
Beiträge
1.519
Punkte für Reaktionen
404
Punkte
103
Die Analyse des Supports ist ja spannend. Ich entnehme dem: das System hat Probleme mit einer hohen Anzahl angelegter und gelöschter Netzwerk-Interfaces.. wenn das Wahr ist wird Docker unter DSM7 ein grundlegendes Problem haben.. unschön

@geimist: soweit ich mich erinnere sollten keine Netzwerkzugriffe bei der Verarbeitung von myOCRpdf stattfinden, sprich Du solltest hier mit --network none das Problem zumindest für den OCR Container aushebeln können.
 

haydibe

Benutzer
Sehr erfahren
Mitglied seit
12. Apr 2016
Beiträge
1.519
Punkte für Reaktionen
404
Punkte
103
Die Aussage vom Support, das mit einem Container jedes Mal ein Interface (und entsprechende iptables regeln) angelegt wird ist schon richtig, Mit dem Parameter --network none kann man das, wie schon geschrieben, verhindern. Nach meiner Einschätzung wird das Problem durch den häufigen Starten des myOCRpdf Container zwar sichtbar, ist aber nicht die eigentliche Ursache.

Docker ist in weiten Teilen ein cleverer Komfort-Adapter um Linux-Standard Werkzeuge und Bibliotheken, die es einfach "nur" geschickt miteinander kombiniert. Ich vermute die Ursache eher im Netzwerkstack, vielleicht bei irgendeinem Puffer, der Einträge von gelöschten Docker-Netzwerken nicht (schnell genug?!) löscht. Die Ursache kann eine Einstellung/Bug auf Kernel-, Library- oder gar Docker-Ebene sein, wobei ich letzteres eher für unwahrscheinlich halte, da die Docker-Version nach wie vor unverändert ist. Falls von iptables auf nftables umgestellt wurde, könnte das ein sehr guter Kandidat für die Ursache sein... Das offizielle Docker-Forum ist voll mit Problem zu nftables.

Das Problem kann genauso gut mit jedem anderen Container auftreten oder wenn ein Container mit --restart always beim Starten abbricht und so in einer Start-Loop hängt. Insgesamt ist das kein gutes Zeichen für Docker unter DSM7. Insbesondere, wenn der Support lieber am Auslöser des Symptoms rumdoktert, als an der eigentlich Ursache...
 

RogerR

Benutzer
Mitglied seit
12. Dez 2019
Beiträge
48
Punkte für Reaktionen
7
Punkte
8
Hallo!
Ich kann synOCR leider nicht mehr nutzen. Wenn ich es öffne, dann bekomme ich lediglich eine Fehlermeldung angezeigt: "Es tut uns Leid, die von Ihnen gesuchte Seite konnte nicht gefunden werden."
Ich habe schon versucht, das Problem zu beheben, durch Deinstallation und Neuinstallation. Leider ändert sich dadurch nichts.
Der Speicher scheint auch nicht voll zu sein (was bei o.g. Fehlermeldung meist als Ursache deklariert wird).
Alle anderen Dienste laufen wie gewohnt.

DSM-Version: DSM 6.2.3-25426 Update 3

Wo könnte die Ursache liegen, wie kann ich das Problem weiter einkreisen?
 

Anhänge

  • Bildschirmfoto 2021-01-12 um 08.03.27.png
    Bildschirmfoto 2021-01-12 um 08.03.27.png
    45 KB · Aufrufe: 4
  • Bildschirmfoto 2021-01-12 um 08.04.46.png
    Bildschirmfoto 2021-01-12 um 08.04.46.png
    28,5 KB · Aufrufe: 4

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
  • Like
Reaktionen: RogerR

losREDBULLos

Benutzer
Mitglied seit
05. Mai 2015
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo,

vor kurzem bin ich auf dieses grandiose Paket gestossen. Jetzt würde ich gerne meine vorhandenen Dokumente nachträglich OCRen lassen. Dazu habe ich mein Dokumenten Rootverzeichnis als Input angegeben. Allesdings werden keine PDS's gefunden. Gibt es da irgendwie die Möglichkeit einen Ordner incl. Unterordner durchlaufen zu lassen und vielleicht sogar in dieser Struktur in Output ausgeben zu lassen?

Gruß losREDBULLos
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Nein, es wird nicht rekursiv gesucht. Die App ist ja für den kontinuierlichen Workflow ausgelegt. Du kannst also nur alle PDFs in den Quellordner legen.
 

RogerR

Benutzer
Mitglied seit
12. Dez 2019
Beiträge
48
Punkte für Reaktionen
7
Punkte
8
Danke. Die ersten beiden Punkte - wie beschrieben - ja.
Der Haken für "zum Schutz von Cross-Site-Request-Forgery-Attacken" war gesetzt. Auch ohne Haken bekomme ich die Meldung.
Der Docker Container scheint eine Macke zu haben... Der Status wechselt ständig zu "Neustart erfolgt". Oder ist das normal? Als Systemereignis kommt ständig die Meldung "Docker Container wurde unerwartet gestoppt".
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Der Haken für "zum Schutz von Cross-Site-Request-Forgery-Attacken" war gesetzt.
So soll das sein. Du kannst es natürlich auch mit deaktivierter Einstellung testen.
Der Docker Container scheint eine Macke zu haben... Der Status wechselt ständig zu "Neustart erfolgt".
Nein, der Container wird nur temporär für jedes einzelne PDF erstellt. Du brauchst dort nichts anzupassen oder zu starten. Die GUI hat auch nichts mit dem Container zu tun.
  • Hat der eingeloggte User die Anwendungsberechtigung für synOCR?
  • Wie verhalten sich die Pakete UltimateBackup, LogAnalysis oder Ultimate Search? (bitte mal eins davon testen)
 
  • Like
Reaktionen: RogerR

RogerR

Benutzer
Mitglied seit
12. Dez 2019
Beiträge
48
Punkte für Reaktionen
7
Punkte
8
Ach wie dumm! Danke! #kopftisch
Ich war mit einem Domainnutzer angemeldet. Mit dem lokalen Admin geht es. Danke für den Hinweis!!
Mit der entsprechenden Berechtigung für den Domainnutzer (Systemsteuerung > Domain/LDAP > Domainbenutzer) geht es allerdings nicht. Dort habe ich synOCR angehakt (beim Benutzer und einer der zugehörigen Gruppen). Ist jetzt nicht weiter schlimm, sofern wir das nicht lösen - ich kann die Einstellungen jetzt mit dem Admin vornehmen.

Was aber seit heute nervt: Die Meldungen vom Dockercontainer: Jede Minute kommt die Meldung "Docker-Container jbarlow83-ocrmypdf1 wurde unerwartet gestoppt.". Lässt sich das wenigstens abschalten? Oder kommt das, weil noch nichts weiter konfiguriert ist?
 

Anhänge

  • Bildschirmfoto 2021-01-12 um 13.49.06.png
    Bildschirmfoto 2021-01-12 um 13.49.06.png
    62,3 KB · Aufrufe: 4
  • Like
Reaktionen: s3b0r

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Was hast du denn in Docker gemacht?
Falls vorhanden, solltest du den Container "synOCR" in der Docker GUI löschen.

Für die andere Sache kann ich dir leider keine schnelle Lösung anbieten ????
 

RogerR

Benutzer
Mitglied seit
12. Dez 2019
Beiträge
48
Punkte für Reaktionen
7
Punkte
8
Ich hatte den Container lediglich gestoppt (erzwungen).
Es gibt nur einen Container und der heißt nicht "synOCR". (siehe Screenshot)
 

Anhänge

  • Bildschirmfoto 2021-01-12 um 14.28.58.png
    Bildschirmfoto 2021-01-12 um 14.28.58.png
    85,6 KB · Aufrufe: 6
  • Bildschirmfoto 2021-01-12 um 14.34.13.png
    Bildschirmfoto 2021-01-12 um 14.34.13.png
    48,9 KB · Aufrufe: 6
  • Bildschirmfoto 2021-01-12 um 14.38.04.png
    Bildschirmfoto 2021-01-12 um 14.38.04.png
    51,8 KB · Aufrufe: 6

RogerR

Benutzer
Mitglied seit
12. Dez 2019
Beiträge
48
Punkte für Reaktionen
7
Punkte
8
Kann es evtl. sein, dass der Zeitplaner hier Murks macht? Irgendwo muss doch die Aufgabe angestoßen werden?
Im Aufgabenplaner ist nichts zu sehen. Aber evtl. wurde ja ein CronJob angelegt oder nicht sauber gelöscht...?
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Zuletzt bearbeitet:


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat