naja, MIR würde helfen, wenn ich ein Flag setzen könnte a'la nodubs=1. Ist es in einem Ordner bereits abgelegt, keine weiteren Ablagen. Dann bist nicht Du "schuld".Sofern sich die Dateien auf dem gleichen Volume wie der Outputordner befinden, werden lediglich Hardlinks gesetzt. Natürlich gibt es mehrere Zieldateien, sofern auch mehrere Regeln erfüllt sind. Ich würde mir aber nicht anmaßen, hier per Software zu definieren, welcher Zielordner jetzt wichtiger wäre, um so auf ein 'Duplikat' verzichten zu können.
jbarlow83/ocrmypdf:v12.7.2
--pdf-renderer hocr
Dinkelmehl
suche, finde ich nur die Ausgabedatei von synOCR, nicht aber das Original). Meiner Meinung nach sollte UniversalSearch hier besser arbeiten. Vielleicht ist das ein Bug von UniversalSearch.WARNING: Error loading config file: .dockercfg: $HOME is not defined
./synOCR.sh: line 1779: /dev/ttyS1: Permission denied ERROR at line 1779: echo 2 > /dev/ttyS1
INFO: (PushBullet-TOKEN not set)
Das heisst aber, dass bei Dir synOCR auch mit diesem File korrekt arbeitet. . Bei mir sind die synOCR outputs, sowohl der Textlayer als auch das resultierende PDF, nicht zu gebrauchen: der Textlayer, wie gesagt, 1 Byte gross und das PDF eher wie in Image, d.h. per find im Dokument Viewer wird gar nichts mehr gefunden und ich kann z.B. mittels Doppelklick kein Wort mehr markieren.finde ich nur die Ausgabedatei von synOCR, nicht aber das Original)
Verwendest du permanent diesen Parameter, so kann das dazu führen, dass die Dokumente größer werden.Wenn-f
/--force-ocr
angegeben wird, werden alle Seiten in Bilder gerastert, wobei jeglicher verborgene OCR-Text verworfen und jeglicher druckbare Text gerastert wird. Dies ist nützlich, um OCR wiederherzustellen, OCR-Text mit einer beschädigten Zeichentabelle zu reparieren (Text ist auswählbar, aber nicht durchsuchbar) und geschwärzte Informationen zu zerstören. Alle Formulare und Vektorgrafiken werden ebenfalls gerastert.
-f
anzugebenSuper Stephan, vielen Dank, das ist für uns die Lösung, funktioniert perfekt. Ich habe jetzt wieder auf -s und das :latest Image umgestellt, alles i.O.PDF nicht direkt von der Seite herunterlädst, sondern in ein PDF druckst, könnte
Das ist ein anderer PDF-Renderer. War ein Versuch wert bei dir (kannst du auch so lassen).Was erreicht man mit dem Parameter --pdf-renderer hocr ?
Nein - mach am Besten einen eigenen Thread dazu auf.Onlyoffice auf Nextcloud auf meiner Synology. … Du bist nicht per Zufall auch ein Crack in diesem Thema?
start
erweitert werden (auch stop
wird ausgewertet, sofern mal benötigt)/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh start
inotify.log
parallel in jedem Logverzeichnis).Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.
Als Dankeschön schalten wir deinen Account werbefrei.