synOCR synOCR - GUI für OCRmyPDF

geimist/ocrmypdf-polyglot:latest
Habs aber auch mit dem geimist/ocrmypdf-polyglot_fast:latest noch ein paar mal probiert und krieg keinen erfolgreichen run mehr hin.
Hatte vorhin mal die Vermutung es liegt an der Leerseiten-Entfernung aber die habe ich auch schon wieder deaktiviert, ohne Erfolg.
Hab auch die logs von vorhin alle mal durchsucht und es ist immer genau der Fehler aus meinem vorigen Post.
 
Die Images sind alle vom selben Stand. Könntest du es mal mit jbarlow83/ocrmypdf:12.7.2 probieren? Das ist fest in der Auswahl hinterlegt. Oder fehlt dir da eine Sprache?
Ideal wäre es, wenn du mir das Dokument zukommen lassen könntest.
 
jbarlow83/ocrmypdf:12.7.2 funktioniert.
Danach hab ich wieder auf geimist/ocrmypdf-polyglot_fast:latest umgestellt und auch das funktioniert wieder. Jetz bin ich vollends verwirrt.
Das Dokument kann/möchte ich dir eher nicht zur Verfügung stellen. Da sind mir zu viele persönliche als auch Versicherungs-Daten drauf.
 
Das ist für mich schwierig einzugrenzen. Ich hatte jetzt schon manchmal das Gefühl (bei Problemen anderer), dass die Ausgabe von OCRmyPDF z.T. fehlerhaft war (auch in der Version 1.4.5, die ja schon seit 2023 läuft).

Die Synology sagt mir auch, dass der Container unerwartet beendet wurde.
Das ist leider ein Fehler des aktuellen Containermanagers und betrifft bei mir auch viele andere Container, die ich temporär erstelle und nutze. Im Docker-Log ist kein Fehler zu sehen und die Container werden mit exit 0 (also ohne Fehler) beendet.
 
Klar, verstehe ich. Das Fehlerbild ist leider nicht konsistent und nachvollziehbar. Wie gesagt, mit derselben Datei klappt es jetzt auch plötzlich wieder.
Ich werd das mal weiter beobachten. Da ich letztens meine yaml-files und source-Ordner komplett auf links gedreht habe, prüfe ich derzeit sowieso wieder jedes File einzeln. Von daher würde es mir auffallen wenn es ein größeres Probleme gäbe.
 
Das file_processing.log sollte dir hier ja hilfreich sein. Und die Quelldatei wird ab dem letzten Build immer in den Ordner ERRORFILES verschoben, wenn es keine Zieldatei gibt. Damit solltest du save sein.
Bitte melde dich gerne bei neuen Erkenntnissen. Vielleicht dann erstmal per PN um das in Ruhe zu ergründen.
 
Das file_processing.log sollte dir hier ja hilfreich sein. Und die Quelldatei wird ab dem letzten Build immer in den Ordner ERRORFILES verschoben, wenn es keine Zieldatei gibt.
Komischerweise war das processing ja successful. Zumindets von synOCR-Seite. Obwohl das log einen Error-hatte, konnte das output-file scheinbar von synOCR gelesen werden. Es wurden sogar teils (nicht alle) Tags erkannt und das file in den richtigen Target-Ordner verschoben. Aber kein PDF-Reader war in der Lage das file danach zu öffnen.
Ich behalts im Auge und melde mich per PN sobald ich wieder was sehe.
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat