OCRmyPDF in Docker zum Laufen kriegen

Tuck

Benutzer
Mitglied seit
06. Feb 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo liebe Community,

ich habe mir vor kurzem eine DS220+ gekauft und würde gerne mein papierloses Büro u.a. mit OCRmyPDF vorantreiben. SynOCR kenne ich, habe aber mittlerweile schon die DSM 7, weshalb das vorerst nicht klappt.

Seit 2 Tagen lese ich die Dokumentation von OCRmyPDF und ich schaffe es nicht, den Container zum Laufen zu kriegen. An sich brauche ich nur einen Input- & Output-Ordner, umbenennen soll OCRmyPDF gar nicht. Leider finde ich nirgends die Information, welche Pfade, Ports etc. angelegt werden müssen, um das Dienstprogramm zu starten.

Als Alternative habe ich es auf dem Mac über Homebrew halb ans Laufen gebracht, habe aber kein funktionierendes Script gefunden, welches einen Ordner automatisiert, daher leider keine gute Alternative. :/

Über eure Hilfe, wie ich den Container zum Laufen kriege, wäre ich unglaublich dankbar!

Liebe Grüße
Tuck
 

Der Paul

Benutzer
Mitglied seit
04. Feb 2014
Beiträge
131
Punkte für Reaktionen
26
Punkte
28
Du kannst es übers Terminal (ssh auf die DS (ssh admin@NameDeinerDS), dann sudo -i) recht einfach konfigurieren. In meinem Beispiel schreibt der Scanner nach /volume1/temp und das fertige PDF wird nach /volume1/scanner geschoben. Den Wert für PUID ersetzt Du mit der ID eines Users, der Rechte auf die Verzeichnisse hat (Befehl dazu id <Benutzername>)

docker run -d --name OCRmyPDF --restart unless-stopped -v /volume1/temp:/input -v /volume1/scanner:/output -e OCR_ON_SUCCESS_DELETE=1 -e OCR_JSON_SETTINGS='{"rotate_pages": true, "skip_text": true, "language": "deu+eng+fra", "output_type":"pdf"}' -e PYTHONUNBUFFERED=1 -e PUID=1040 -e PGID=100 -e TZ=Europe/Berlin -it --entrypoint python3 jbarlow83/ocrmypdf:latest watcher.py
 
  • Like
Reaktionen: Tuck

Tuck

Benutzer
Mitglied seit
06. Feb 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo Der Paul,

lieben Dank dafür! Ich werde mich gleich dransetzen und Rückmeldung geben, ob es geklappt hat.
 

Tuck

Benutzer
Mitglied seit
06. Feb 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo Der Paul,

es funktioniert! Ich habe nur die Pfade abgeändert.

Aber ein komisches Phänomen habe ich da noch. In der File Station bewegen sich die Dateien in den Output, die Input-Dateien werden gelöscht. Mit meinem Drive-Client auf dem Desktop ändert sich da tatsächlich nichts. Ich sehe also noch die nicht OCR-ten PDFs, während der Output leer bleibt. Idee, wie man da Abhilfe schaffen kann?
 

Mischalski

Benutzer
Mitglied seit
03. Dez 2021
Beiträge
1
Punkte für Reaktionen
1
Punkte
53
Hallo Tuck,

ich habe das gleiche Problem wie du mit dem Drive-Client und gerade herausgefunden, dass es an dem Besitzer der Dateien liegt und der bei mit root und nicht der user des drive client ist. (Rechtsklick und Eigenschaften in der File Station öffnet das Menü.)

Hast du schon eine Lösung für dein Problem gefunden? Ich habe jetzt gesehen, dass synOCR mit GUI auch für DSM 7 verfügbar ist und mich nicht mehr mit der direkten Implementierung von OCRmyPDF beschäftigt.
In diesem Post gibt es alle Informationen dazu, falls dir das hilft: https://www.synology-forum.de/threads/synocr-gui-fuer-ocrmypdf.99647/post-974246
 
  • Like
Reaktionen: geimist


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat