Hallo zusammen, ich muss leider auch noch einmal nerven...
ich hole ein kleines bißchen aus, um möglichst ins Szenario zu holen und die ersten vier Rückfragen, damit man das nachvollziehen kann direkt zu erledigen.
Ich habe mich eigentlich sehr gut mit dem ganzen System eingelebt:
-> brother Multifunkti-Gerät scant pdf auf Fritz-Box Speicher (weil 24/7 verfügbar)
-> DS720+ schaut wenn sie läuft auf dem Fritz-Speicher mit Aufgabenplaner-Skript regelmäßig nach neuen Dateien und schiebt diese in den OCR-Einrang
-> synOCR schaut wenn die DS läuft mit Aufgabenplaner-Skript regelmäßig und verarbeitet Eingang zu Ausgang incl. Tagging
=> Drehung von Querformat habe ich mal als Thema gehabt, bin da aber nicht so richtig zu Rande gekommen, da sehr seltene Anwendungsfälle habe ich da aber auch wenig Leidenschaft reingelegt...
Soweit, so gut! ??
Jetzt wollte ich den "nächsten Schritt" im Kampf dem Papier machen und habe einen Dokumentenscanner gekauft. Der Plan war eigentlich recht einfach: schlicht vorne den Scanvorgang "austauschen", danach weiter verarbeiten wie bisher... Auf diese Weise sollten auch die Ordner mit Unterlagen aus Seminaren usw. aus dem Regal verschwinden, der Scanner schafft sich seinen Standplatz sozusagen selber ;-)
Wenn es einfach wäre, könnte es ja jeder...das Gerät ist eingerichtet, es Scannt auch PDF an die Fritz Box. Das Abhol-Skript holt diese PDF auch in den SRC-Ordner. Die Dateien haben aber nun einen anderen Präfix im Quelldateinamen. Den alten Scanner gibt es aber weiter, schon alleine, weil Bücher schlecht durch einen ADF passen... Ich habe nicht gefunden, ob man auch mehrere Präfixe im entsrechenden synOCR-Feld eingeben kann und deshalb das Profil geklont und dann den Präfix geändert. Das hat auch funktioniert, die DokScanner PDF sind verarbeitet worden und lagen im Ausgabeordner. (Altes Gerät in dieser Zeit nicht verwendet.)
Der zweite Seminar-Ordner war dann aber -tadaaa- fast ausschließlich im Querformat. Da waren Sie wieder meine alten Probleme. Ich habe dann hier nochmal durchgeschaut und versucht, dem Herr zu werden, letztlich hat
Code:
-srd -l deu --rotate-pages --rotate-pages-threshold 1
durchaus zu einer Rotation der Seiten geführt (ich habe mehrere Werte ausprobiert, 2 / 1 / 0.8 / 0.5 / 0.1).
Als zweites habe ich verschiedene Quell-Qualitäten ausprobiert (immer 300dpi, 200 war mir zu grob, aber dann mal s/w, mal Graustufen) um mit Dateigrößen und OCR-Qualität zu schauen (Textboxen in Graphiken usw.).
Ich kann leider nicht sagen warum, aber es tut sich nun einfach nichts mehr. synOCR arbeitet schlicht nicht mehr. Die Dateien kommen in den Quellordner, in Übersicht/Status werden auch entsprechend Dateien zu bearbeiten angezeigt, aber ein Aufgabenplaner-Durchlauf nach Timer, über "Ausführen" oder in synOCR selbst ein manueller Start führen nicht mehr zur Verarbeitung. Ich habe dann zur Probe mal in den alten Scanner gelegt, auch diese Datei wird nicht verarbeitet. DS Neustart (zweimal) ebenfalls ohne Veränderung.
Die Log-Datei schmeisst dazu folgendes, mit dem Profil vom neuen Scanner:
Code:
----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
ERROR at line 1241: pagecount_new=$(( $(get_key_value ./etc/counter pagecount) + $pagecount_latest))
ERROR at line 1242: ocrcount_new=$(( $(get_key_value ./etc/counter ocrcount) + 1))
ERROR at line 1243: pagecount_ID_new=$(( $(get_key_value ./etc/counter pagecount_ID${profile_ID}) + $pagecount_latest))
ERROR at line 1244: ocrcount_ID_new=$(( $(get_key_value ./etc/counter ocrcount_ID${profile_ID}) + 1))
PROCESSING: ? ADS-2800W_20210815_002991.pdf (Sun Aug 15 14:04:08 CEST 2021)
temp. target file: /tmp/tmp.nAUgOUhcYw/20210815_002991.pdf
? OCRmyPDF-LOG:
WARNING: The requested image's platform (linux/arm64) does not match the detected host platform (linux/amd64) and no specific platform was requested
standard_init_linux.go:230: exec user process caused: exec format error
? OCRmyPDF-LOG-END
?? failed! (target file is empty or not available)
-----------------------------------
| ==> synOCR ENDE <== |
-----------------------------------
Und mit dem Profil vom alten Scanner:
Code:
----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
ERROR at line 1241: pagecount_new=$(( $(get_key_value ./etc/counter pagecount) + $pagecount_latest))
ERROR at line 1242: ocrcount_new=$(( $(get_key_value ./etc/counter ocrcount) + 1))
ERROR at line 1243: pagecount_ID_new=$(( $(get_key_value ./etc/counter pagecount_ID${profile_ID}) + $pagecount_latest))
ERROR at line 1244: ocrcount_ID_new=$(( $(get_key_value ./etc/counter ocrcount_ID${profile_ID}) + 1))
PROCESSING: ? MFC-5895CW_003799.pdf (Sun Aug 15 14:06:02 CEST 2021)
temp. target file: /tmp/tmp.jyEEza1UjD/003799.pdf
? OCRmyPDF-LOG:
WARNING: The requested image's platform (linux/arm64) does not match the detected host platform (linux/amd64) and no specific platform was requested
standard_init_linux.go:230: exec user process caused: exec format error
? OCRmyPDF-LOG-END
?? failed! (target file is empty or not available)
-----------------------------------
| ==> synOCR ENDE <== |
-----------------------------------
Ich sehe da nur Abweichung bzgl. Platform (arm64 vs. amd64), wüsste aber nicht, wo ich da etwas verändert haben sollte...
Habt Ihr hier das Problem bereits einmal gehabt oder kennt trotzdem eine Lösung?