synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Wenn eine Datei georct wurde, wird die Ausgabedatei auf Gültigkeit geprüft (vorhanden und nicht leer). Wird die Prüfung nicht bestanden, wird der weitere Ablauf für diese Datei abgebrochen.

sagte beim manuellen Durchlauf auch "Verzeichnis angelegt"
  1. Auch bei einem erneuten Aufruf?
  2. Aufruf über GUI oder Shell/Aufgabenplaner?
  3. Als welcher User?
  4. Welche synOCR Version?
  5. DSM6 oder DSM7?
  6. Bitte mal Pfad des Zielordners posten, so wie er eingetragen ist.
 

Maniac72

Benutzer
Mitglied seit
23. Mrz 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Tja, beim ersten Duchlauf hatte es mir Ordner unter /home/ angelegt..
Anwenderfehler
Die sehe ich natürlich nicht, nur auf der Konsole via SSH
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
Hallo in die Runde.
Eine kurze Frage. Die Frage tat sich mindestens schon einmal auf.
Weil hier kürzlich über das finden von Datum geschrieben wurde.
Manche Dokumentenersteller (spontan fällt mir Amazon ein) schreiben ja im Datum z.B. 20 März 2022 oder ähnliches.

Habt ihr da eigentlich eine brauchbare Möglichkeit im Auge wie das auch erkannt wird (als bei meinem Beispiel als 20.03.2022)?

Aktuell habe ich in der Konfiguration "Dateidatum korrigieren" auf "Datum der Quelldatei verwenden" und finde das als Lösung auch total gut. Merkwürdigerweise findet der bei Amazon-Rechnungen oft angeblich den 01.01.1970 und mir ist nicht wirklich klar woher das kommt. Hab das zumindest nicht erkennen können im Vorfeld.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Manche Dokumentenersteller (spontan fällt mir Amazon ein) schreiben ja im Datum z.B. 20 März 2022 oder ähnliches.
Um ausgeschriebene Monate erkennen zu können, arbeitet @Gthorsten bereits fleißig an einer Lösung.

Merkwürdigerweise findet der bei Amazon-Rechnungen oft angeblich den 01.01.1970 und mir ist nicht wirklich klar woher das kommt.
Du verwendest also nicht das OCR-Datum, sondern lediglich das Datum der Quelldatei?
Könntest du mir diese privat zur Verfügung stellen? (Bitte vorher zippen / Uploadlink in meiner Signatur)
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
Du verwendest also nicht das OCR-Datum, sondern lediglich das Datum der Quelldatei?
Ich habe die Einstellung so verstanden das hier das Datei-Datum nur verwendet wird, wenn kein OCR-Datum gefunden wird. Somit meine ich das ich schon ein OCR-Datum benutze, aber falls keins gefunden wird, dann wird das Dateidatum benutzt. Liege ich da in der Annahme falsch?

Mit privat zur Verfügung stellen meinst du ein PDF, oder die exportierte Konfiguration?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Das hast du in der Tat falsch verstanden. Hierfür musst du auf das OCR-Datum umstellen. Da gibt es dann das Fallback auf das Dateidatum der Quelldatei, sofern kein OCR-Datum gefunden wurde.

Ich meinte die Quelldatei. Die müsste ja in dem Fall bereits von Amazon das Datum 1.1.70 haben. Bei einem Scanner könnte ich es mir vorstellen, wenn er kein korrekt konfiguriertes Datum hat.
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
dummerweise hat der Lauf die Datei gelöscht. Weil die Dokument im Backupordner auf "nur" 14 Tage aufbewahren stehen.
Da das Datum aber auf 01.01.1970 gestellt wurde ist die Datei dann folgerichtig gelöscht worden.

Im Log habe ich folgendes gefunden:

Using date format: 1 (1 = dd mm [yy]yy; 2 = [yy]yy mm dd; 3 = mm dd [yy]yy)
Using date format: 2 (1 = dd mm [yy]yy; 2 = [yy]yy mm dd; 3 = mm dd [yy]yy)
Using date format: 3 (1 = dd mm [yy]yy; 2 = [yy]yy mm dd; 3 = mm dd [yy]yy)
Date not found in OCR text - use file date:
day: 01
month:01
year: 1970
➜ renaming:
apply renaming syntax ➜ 1970-01-01_#Domscheit#Michael#Rechnung

Ich habe noch eine Idee wieso das vielleicht aufgetreten ist. Ich glaube das ich die Datei direkt aus der Amazon-App abgerufen habe und dann via Teilen in DS File in mein Eingangsverzeichnis gespeichert. Vielleicht kommt daher das Dokumentendatum.

Nachtrag:
Das war es. Mein Teilen vom Handy direkt in DS File hat das Datum offenbar auf 01.01.1970 gestellt und da aufgrund des Datumsformats von Amazon kein OCR-Datum erkannt werden konnte verstehe ich das Problem nun.
Manchmal muss man nur mal drüber sprechen. sobald das "blöde" ausgeschriebene Datumsformat gefunden wird, darf ich auch wieder über DS File teilen. :)
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Ja, das ist nur konsequent ...
Kommst du nochmal an die Rechnung heran? Ich finde es schon seltsam.
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
ja über Amazon nochmal runterladen. Aber da ich ja wie in meinem Beitrag bearbeitet habe das nun nachvollziehen konnte reicht mir das.
Danke das ich dank einfach drüber labern auf die Erkenntnis kommen konnte. :)
 
Zuletzt bearbeitet von einem Moderator:

ctks

Benutzer
Mitglied seit
06. Apr 2022
Beiträge
4
Punkte für Reaktionen
2
Punkte
53
Hallo,
versuche gerade synocr zum laufen zu bekommen.
1. Habe den docker installiert
2. unter docker / Image das jbarlow83/ocrmypdf latest (603mb) runtergeladen
3. dann auf starten, es bricht stoppt aber sofort
4. Unter docker Container ist es eingetragen aber gestoppt
5. syocr 1.20.1. installiert
6. konfig eingestellt
7. aufgabenplaner erstellt und gestartet
8. findet pdf 1 wandelt aber nicht.
9. log datei kommt
10. der Fehler der wichtig scheint:
PROCESSING: ➜ Test-scan.pdf (Wed Apr 6 20:10:03 CEST 2022)
temp. target file: /tmp/tmp.Bo1xmlkNBs/Test-scan.pdf

-----------------------------------------------------------------------------------
| processing PDF @ OCRmyPDF: |
-----------------------------------------------------------------------------------

➜ OCRmyPDF-LOG:
WARNING: Error loading config file: .dockercfg: $HOME is not defined
docker: Got permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Post "http://%2Fvar%2Frun%2Fdocker.sock/v1.24/containers/create?name=synOCR": dial unix /var/run/docker.sock: connect: permission denied.
See 'docker run --help'.
← OCRmyPDF-LOG-END

┖➜ failed! (target file is empty or not available)
purge logfiles ...


Vermutlich etwas mit den rechten, aber da fehlt mir gerade das Fachwissen.

Danke wenn jemand helfen kann...

Gruß Marco
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Hallo @ctks und herzlich willkommen im Forum :)

3. dann auf starten, es bricht stoppt aber sofort
Das braucht man nicht (sollte eigentlich auch beim Installieren darauf hingewiesen worden sein, weil das immer wieder für Verwunderung sorgt). Nur Docker muss installiert sein, den Rest macht synOCR.

Vermutlich etwas mit den rechten, aber da fehlt mir gerade das Fachwissen.
Hast du das Startskript im Aufgabenplaner auch wirklich als root eingetragen und gestartet (teilweise muss man das mehrmals tun)?
 

ctks

Benutzer
Mitglied seit
06. Apr 2022
Beiträge
4
Punkte für Reaktionen
2
Punkte
53
ja ist es, die log datei landet auch im log.
habe im NAS unter systemsteuerung -> Aufgabenplanung -> den Task heute noch 2 x gestartet.

Wenn ich das log richtig lese, braucht ocrmypdf noch rechte oder?.

Aus dem log:
Error: attempt to write a readonly database

Wo kann ich die einstellen?

Gibt es eigentlich eine neuere Anleitung wie man bei einer Synology mit DSM 7 in der richtigen Reihenfolge docker und ocrmypdf und synocr als GUI installiert? Sonst würde ich das mal machen, da ich ja eine neue Synology habe... Evtl mit Unterstützung beim Korrekturlesen... ;-)
 

Anhänge

  • synOCR_2022-04-07_08-30-22-.txt
    3,3 KB · Aufrufe: 5
Zuletzt bearbeitet von einem Moderator:

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Es ist kein Unterschied ob dsm 7 oder dsm6. Bei mir hat es genauso geklappt wie in der Anleitung beschrieben.
Wichtig. Bei mir hat es es beim ersten Mal auch nicht geklappt. Die Ursache bei mir war das im Planer der ausführende User nicht root war. Nachdem ich das geändert hatte ging alles super
 

ctks

Benutzer
Mitglied seit
06. Apr 2022
Beiträge
4
Punkte für Reaktionen
2
Punkte
53
Kannst du nochmal den Link der Anleitung posten die du benutzt hast ? dann werde ich die nochmal durchgehen

Gerade geschaut, unter aufgabenplanung rechte taste eigenschaften ist da der admin eingetragen.. sollte auch so sein. Gibt es eine logdatei die der Aufgabenplaner schreibt und ich somit sehe ob das script überhaupt richtig durchläuft ?
 
Zuletzt bearbeitet von einem Moderator:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Gerade geschaut, unter aufgabenplanung rechte taste eigenschaften ist da der admin eingetragen.. sollte auch so sein.
DORT MUSS ROOT REIN‼️😉

(Anleitung findest du in Wiki meiner Signatur)
 
  • Like
Reaktionen: Gthorsten

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Hatte ihm parallel schon per pn erklärt was er einstellen muss
 

ctks

Benutzer
Mitglied seit
06. Apr 2022
Beiträge
4
Punkte für Reaktionen
2
Punkte
53
jepp, vor 2 Minuten begriffen das mein Admin und root 2 Verschiedene sind....

Änderung durchgeführt und siehe da es funktioniert....

DANKE auch an Gthorsten... ;-)
 
  • Like
Reaktionen: geimist und Gthorsten


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat