ocrmypdf --output-type pdf -l deu+eng --rotate-pages --rotate-pages-threshold 2.0
Mit einem Präfix oder Suffix, den du entfernen lässt (Schalter in der GUI) kannst du auch den Inputordner als Outputordner verwenden. Wenn die Dateien erneut abgearbeitet werden, hast du möglicherweise noch ein weiteres Profil aktiv.Zum einen werden mit SynoOCR die Dateien nicht inplace überschrieben, auch wenn ich das Umbennenungsmuster entferne, zum anderen wird OCR ausgeführt bei Dateien die schon von ocrmypdf behandelt wurden.
Hier den Snapshotbuild laden.Im Changelog ist schon die Version 1.3 zu finden mit inotify support. Gibt es schon eine Beta oder ähnliches?
start
ausführen:/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh start
Passen die Einstellungen so? Das scheint jetzt auch zu klappen mit dem Überschreiben.Mit einem Präfix oder Suffix, den du entfernen lässt (Schalter in der GUI)
Y:\Scans>ocrmypdf --output-type pdf -l deu+eng --rotate-pages --rotate-pages-threshold 2.0 SCN_0001.pdf SCN_0001.pdf
Scanning contents: 100%|███████████████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 62.44page/s]
OCR: 0%| | 0.0/1.0 [00:00<?, ?page/s]
PriorOcrFoundError: page already has text! - aborting (use --force-ocr to force OCR; see also help for the arguments --skip-text and --redo-ocr
➜ OCRmyPDF-LOG:
WARNING: Error loading config file: .dockercfg: $HOME is not defined
reading file from standard input
PriorOcrFoundError: page already has text! - aborting (use --force-ocr to force OCR; see also help for the arguments --skip-text and --redo-ocr
← OCRmyPDF-LOG-END
file count total: ➜ 53 PDF's / 223 Pages processed up to now
URRENT FILE: ➜ SCN_0004.pdf
temp. target file: /tmp/tmp.v2ke1K0HUV/SCN_0004.pdf
-----------------------------------------------------------------------------------
| processing PDF @ OCRmyPDF: |
-----------------------------------------------------------------------------------
➜ OCRmyPDF-LOG:
WARNING: Error loading config file: .dockercfg: $HOME is not defined
reading file from standard input
Start processing 4 pages concurrently
4 [tesseract] Too few characters. Skipping this page
4 [tesseract] Error during processing.
4 page is facing ⇧, confidence 0.00 - no change
6 [tesseract] Too few characters. Skipping this page
6 [tesseract] Error during processing.
6 page is facing ⇧, confidence 0.00 - no change
PriorOcrFoundError: page already has text! - aborting (use --force-ocr to force OCR; see also help for the arguments --skip-text and --redo-ocr
← OCRmyPDF-LOG-END
┖➜ failed! (target file is empty or not available)
Nein. Die Originaldateien brauchen z.B. einen Präfix, d.h. nur die Dateien mit diesem Muster werden verarbeitet. Dadurch, dass du dieses Muster entfernst, werden sie nicht erneut verarbeitet. Ein Beispiel: Dein Scanner beginnt jeden Datei mit dem Begriff SCAN_ und dann eine laufende Nummer, z.B.Passen die Einstellungen so? Das scheint jetzt auch zu klappen mit dem Überschreiben.
SCAN_01234.pdf
. Nach dem Verarbeiten heißst sie dann nur noch 012345.pdf
synOCR übernimmt das komplette Dateihandling. Das läuft ein wenig anders, also nativ mit OCRmyPDF.Das war vorher bei meiner Ausführung in Windows nicht so.
Kann ich auch die original Datei löschen lassen? Und wenn ja wie?kannst du auch den Inputordner als Outputordner verwenden
Alle Originaldateien werden in das Backupverzeichnis verschoben. Lass einfach das Backupverzeichnis leer oder verwende als Ziel den Papierkorb.Kann ich auch die original Datei löschen lassen? Und wenn ja wie?
Hallo @Gthorsten, hattest du schon Gelegenheit dir das anzuschauen?Nein das reicht erstmal. Melde mich Sonntag abend wenn ich mehr weiß
Hallo @sub2010,- Umwandlung von Bildern in PDF Dokumente
- E-Mail Anhang Export incl OCR Erkennung
- Benachrichtigung via Chat (Domänen User)
Vielen Dank für dein Leidenschaft, wo kann ich dir ein Bier ausgeben?
Einfach drüber installieren. Ein Backup kannst du auch mit HyperBackup durchführen. Damit ist die Rücksicherung einfacher. Ich würde dir empfehlen, gleich die aktuelle Beta zu verwenden. Darin ist eine Updatebenachrichtigung implementiert, weil cphub ja keine Updates mehr liefert.wie gehe ich denn am besten bei einem Update auf eine neue Version vor?
Danke, die Beta funktioniertHallo @sub2010,
Punkt 1 geht ab dem nächsten Release. Du kannst daher gerne die BETA (den snapshotbuild) verwenden
Dann stelle ich einen Feature RequestPunkt 2 & 3 stehen derzeit nicht auf der Liste
Das kühle Blonde müsste angekommen seinZur letzten Frage gibt es auch eine Antwort unter vorherigen Link oder auf der Hilfeseite in der GUI
Da ging auch schon eine Email raus - vielen DankDas kühle Blonde müsste angekommen sein
Wenn du PushBullet nutzt, kannst du dort deinen API-Token hinterlegen. So wirst du dann via Push informiert.Den Punkt PushBullet-Token verstehe ich nicht. In deiner Hilfe Datei habe ich dazu nichts gefunden.
Normalerweise lief das immer prima über cphub.net. Leider scheint das Projekt in den letzten Atemzügen zu liegen. Dazu ist dort die synOCR-Paketkonfiguration auch noch defekt und ich komme nicht ran.Wo werden Releases angekündigt?
Hallo syngen,Hallo Thorsten,
alles klar. Ich habe gerade auch noch 2 weitere Dokumente mit gleichem Problem gefunden falls du noch mehr Beispiele benötigst.
Danke schon mal.
Gruß
Artur
Den Feature Request mit dem E-Mail Anhang Export finde ich super!Danke, die Beta funktioniert
Dann stelle ich einen Feature Request
- E-Mail Anhang Export incl OCR Erkennung
- Benachrichtigung via Chat (Domänen User)
/var/log/synoscgi.log
/var/log/packages/synOCR.log
/tmp/synOCR.history
cp /usr/syno/synoman/webman/3rdparty/synOCR/etc/synOCR.sqlite "/volume…/pfad/deiner/wahl/synOCR.sqlite"
Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.
Als Dankeschön schalten wir deinen Account werbefrei.