synOCR synOCR - GUI für OCRmyPDF

MacHolgi

Benutzer
Mitglied seit
30. Dez 2019
Beiträge
14
Punkte für Reaktionen
2
Punkte
3
@s-tyle hat das selbe Problem. Es scheint an dem Ordnermount zu liegen. Er behilft sich mit einem Kopierskript und arbeitet nicht direkt im Remoteordner.
Kann ich denn in synOCR statt des Remote-Ordners auch einen direkten Pfad zum Scan-Verzeichnis des USB-Sticks der Fritz!box angeben?
Edit: den Inhalt der Remote-Ordner kann ich sowohl vom PC als auch über die File Station direkt auf der Synology löschen. Dann müßte theoretisch ja auch syOCR die entsprechenden Rechte haben.
 
Zuletzt bearbeitet:

MacHolgi

Benutzer
Mitglied seit
30. Dez 2019
Beiträge
14
Punkte für Reaktionen
2
Punkte
3
Beenden und dann manuell starten führt zum Todeskreisel... "Bitte warten, bis die Dateien abgearbeitet wurden." Nach 20 Minuten ist aber keine einzige im Zielordner angekommen...
Oha, jetzt wo ich Deine Beiträge so lese und Stephan mich drauf hinweißt: Ich habe exakt das gleiche Problem wie Du!
Mit dem Unterscheid, dass es bei mir bis vor kurzem problemlos funktioniert hat - da hatte ich noch eine Fritz!Box 7390 im Einsatz.
Nun mit dem Wechsel auf die 7490 habe ich exakt die gleichen Probleme, wie Du sie beschreibst...
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
Du schriebst auch das:
… Außerdem in der Fritz!Box 7490 SMB1 aktiviert. Ansonsten wurde nichts verändert.
Lässt sich damit mal etwas probieren? Allerdings wüsste ich nicht, warum es Auswirkungen haben sollte.
 

MacHolgi

Benutzer
Mitglied seit
30. Dez 2019
Beiträge
14
Punkte für Reaktionen
2
Punkte
3
Du schriebst auch das:

Lässt sich damit mal etwas probieren? Allerdings wüsste ich nicht, warum es Auswirkungen haben sollte.
SMB1 deaktivieren ändert auch nichts: Beim nächsten Durchgang hat er wieder nur eine Datei verarbeitet - allerdings sieht jetzt das Log etwas anders aus...
 

Anhänge

  • synOCR_2020-12-17_20-53-52.log.txt
    2,4 KB · Aufrufe: 6

MacHolgi

Benutzer
Mitglied seit
30. Dez 2019
Beiträge
14
Punkte für Reaktionen
2
Punkte
3
Guck mal in die Docker-GUI. Da scheint noch ein temporärer Container aktiv zu sein. Den mal bitte beenden.
Hab ich gemacht und noch mal manuell gestartet: die erste PDF mit der Namensendung 340 hat er bearbeitet, aber nicht gelöscht.
Bei der nächsten Datei mit der Endung 338 hängt er - siehe log
 

Anhänge

  • synOCR_2020-12-17_21-00-02.log.txt
    2,4 KB · Aufrufe: 5
  • synOCR_2020-12-17_21-02-07.log.txt
    2,3 KB · Aufrufe: 2

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
Ich habe keine Ahnung, woran das hängt. Zu gegebener Zeit werde ich das mal nachstellen. Bis dahin müsstest du dir mit einem Kopierskript abhelfen - sorry :confused:
 

MacHolgi

Benutzer
Mitglied seit
30. Dez 2019
Beiträge
14
Punkte für Reaktionen
2
Punkte
3
Ich habe keine Ahnung, woran das hängt. Zu gegebener Zeit werde ich das mal nachstellen. Bis dahin müsstest du dir mit einem Kopierskript abhelfen - sorry :confused:
Trotzdem Danke schon mal!
Wenn ich zwischendurch mal Zeit habe, hänge ich die 7390 noch mal als zweite Box mit rein und lass die Scans darüber laufen - das ging ja ohne Probleme. Wenn es dann wieder gehen sollte, hat AVM wohl irgendwas an der Fritz!Software geändert..
@s-tyle welche Fritz!Box nutzt Du denn?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
AVM wohl irgendwas an der Fritz!Software geändert..
Ja, dass jetzt SMB > 1 nutzbar ist.

Wenn du Lust hast, kannst du auch mal den aktuellen Build testen - ggf. mit Loglevel 2 (in der synOCR GUI einzustellen). Diese Version hilft nicht bei deinem Problem, hat aber ein verbessertes Logging.

(zur Sicherheit Einstellungen mit HyperBackup sichern).
 
  • Like
Reaktionen: MacHolgi

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
Ich habe jetzt mal noch etwas herumprobiert. Mit einem Remoteordner zu einer anderen DS funktioniert es wie gewünscht. Mit einem Remoteordner zur FritzBox funktioniert es nicht. Ich kann nicht einmal die Quelldatei kopieren. Es wird auch kein Fehler produziert - es kommt lediglich zu einem Timeout. Es ist schon eigenartig. Aber in Anbetracht der kürzlichen SMB-Änderungen in Fritz!OS sehe ich hier einen Bug als wahrscheinlich.
 

s-tyle

Benutzer
Mitglied seit
30. Nov 2020
Beiträge
28
Punkte für Reaktionen
3
Punkte
3
Hallo zusammen. Ich verwende eine FRITZ!Box 6490 Cable (lgi) FRITZ!OS: 07.20
Daran steckt tatsächlich gar kein USB-Stick (das war beim vorherigen Router so, schande über mein Haupt), sondern der interne Speicher wird als NAS genutzt (Speicher-(NAS)-Funktion von FRITZ!Box 6490 Cable (lgi) aktiv | Zugriff über ein Netzlaufwerk (SMB) aktiv | Unterstützung für SMBv1 aktivieren (also nicht aktiv) | Zugriff über FTP aktiv) und dieser wird vom MFC Brother als Scan Ziel genutzt.

Ich war mir der Unterstützung für SMBv1 aktivieren Option in der FB tatsächlich gar nicht bewusst, ist die seit dem 7.20 Update erst oder war die vorher auch schon da? Ich hatte SMB1 in den Windows Einstellungen extra aktiviert, weil ich dachte, dass da der Haken ist, aber logisch betrachtet ist beim Arbeiten FritzBox<->Synology gar kein Windows Notebook beteiligt...:sneaky:

Ich müsste also nochmal mit in der FritzBox aktiviertem SMBv1 prüfen, ob das direkte verarbeiten des Remote-Ordners dann geht... Obgleich der Sync auf meine funktionierende Lösung schon so funktioniert, dass rsync da auch die Dateien von der Fritz löscht, wenn Sie auf den Synology-OCR-Quellordner kopiert sind, ein zugriff also aktuell durchaus geht.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
Ich war mir der Unterstützung für SMBv1 aktivieren Option in der FB tatsächlich gar nicht bewusst, ist die seit dem 7.20 Update erst oder war die vorher auch schon da?
Sicherlich erst damit - vorher gab es ja nur SMB1 auf der FritzBox.
dass rsync da auch die Dateien von der Fritz löscht, wenn Sie auf den Synology-OCR-Quellordner kopiert sind, ein zugriff also aktuell durchaus geht.
Ich verstehe es auch nicht. Mit cp /volume1/FRITZ.NAS/test.pdf /volume1/downloads/ hat es nicht funktioniert. Rsync hatte ich jetzt nicht probiert.
 

s-tyle

Benutzer
Mitglied seit
30. Nov 2020
Beiträge
28
Punkte für Reaktionen
3
Punkte
3
Ich verstehe es auch nicht. Mit cp /volume1/FRITZ.NAS/test.pdf /volume1/downloads/ hat es nicht funktioniert. Rsync hatte ich jetzt nicht probiert.
wie im anderen Thread bereits kundgetan, ich habe ein Script angelegt, das funktioniert für mich, @MacHolgi vielleicht versuchst Du es mal damit, auch wenn das die eigentliche Frage nicht auflöst, aber zumindest die Funktion könnte es wieder herstellen:
#!/bin/sh

if [ "$1" = "-n" ]
then
DRY_RUN=-n
else
DRY_RUN=""
fi

rsync ${DRY_RUN} -ahP --exclude='@eaDir' --exclude='/OLD/' --remove-source-files /volume1/scan/fritz/ /volume1/scan/SRC/
.../scan/fritz/ ist der CIFS bereitgestellte Remote-Ordner, der den Fritz.NAS Ordner in die Syno auf .../scan/SRC/ spiegelt.
Von da arbeitet synOCR weg, durch den Remote ist es hinterher auch auf der Fritz weg...
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
Auch rsync funktioniert hier nicht. Ebenso in der FileStation funktioniert das Dateihandling nicht wie gewünscht (Timeout). Vielleicht hat jemand mal Lust sich da an AVM zu wenden.
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Kann man mit der Fritzbox nicht loggen? Da war doch mal was mit einem Servicemenü... *grübel*
 

vistalba

Benutzer
Mitglied seit
21. Dez 2020
Beiträge
12
Punkte für Reaktionen
0
Punkte
1
Hallo

Ich bin gerade dabei SynOCR einzurichten. Absolut cooles Programm!

Ich bin bisher zwei "Problemen" begegnet, wofür ich noch keine Lösung gefunden habe.

1) Ich möchte gerne anhand von Kategorien meine PDFs in Unterordner verschieben lassen. Das funktioniert soweit auch ganz gut. Was mir irgendwie fehlt, ist die Möglichkeit Prioritäten für einzelne Kategorien zu hinterlegen. Ich mache Mal ein Beispiel:

Firma1: Prio 4
Firma2: Prio 4
Firma3: Prio 4
Firma4: Prio 4
Rechnungen: Prio 3
Lieferscheine: Prio 2
Diverses: Prio 1

Was ich damit erreichen möchte:
Grundsätzlich sind die Kategorien "Rechnungen", "Lieferscheine" oder "Diverses" Sammelkategorien, wo ich all das zeug einsortieren will, wo sonst nirgendwo reinpasst. Für Firma1-4 möchte ich aber dass er die Dokumente in diesesn Ordner verschiebt (und in keinem anderen Ordner sichtbar sind).

Wenn ich also nun ein PDF habe mit einem Match auf "Firma2" und "Rechnung", dann möchte ich das PDF nur im Ordner "Firma2" haben.

Ich habe mir die erweiterten Rules angeschaut. Damit scheint es zu funktionieren indem ich für "Rechnung" alle Firma1-4 mit weiteren Subrules "is not" ergänze. Das ist aber sehr umständlich, habe ich doch trotzdem ca. 15 Firmen explizit aufgelistet, welche ich dann jeweils nachführen muss.

Gibt es da irgend eine einfachere Möglichkeit?

2) Immer Mal wieder kommt es vor, dass ich im Output-Folder Dateien habe, welche ich nicht öffnen und auch nicht löschen kann. Lösche ich dieses PDF, dann erscheint es ein paar Sekunden später wieder. Das File ist z.B. 87KB gross (gibt aber Unterschiede) aber anscheinend läuft hier noch ein Prozess, der das File immer wieder generiert. Auch nach 30min noch das gleiche Problem.
Hat das sonst noch wer? Kann man das beheben oder mache ich etwas falsch?


Danke für eure Hilfe/Antworten
vistalba
 

genki

Benutzer
Mitglied seit
21. Dez 2020
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo,

Danke für das tolle Programm!

1)
in den Kommentaren zu OCRmyPDF steht im Oktober:
"Eine Installation des Programms auf DSM 7 Beta ist leider (noch) nicht möglich. Es wird nur die folgende Fehlermeldung angezeigt."Installation fehlgeschlagen. Das Paket sollte mit einer geringeren Berechtigungsstufe ausgeführt werden. Wenden Sie sich an den Paketentwickler, um die Berechtigungseinstellungen zu ändern." Auf DSM 6 funktioniert das Programm einwandfrei. Vielen Dank für das sehr gute und nützliche Programm."

Ist das bekannt / inzwischen behoben? Wäre ein Grund nicht auf DSM7 umzusteigen :)

2)
Ich experimentiere mit der Synology-API und habs geschafft, Tags an Files zu hängen. Am liebsten wäre mir in der GUI eine zusätzliche Option Tags zu setzen. (Tags sind ja so wie "vituelle" Ordner und man kann beliebig viele davon haben. Funktioniert dann prima mit Synology Drive.)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.508
Punkte für Reaktionen
1.344
Punkte
234
1) … Was mir irgendwie fehlt, ist die Möglichkeit Prioritäten für einzelne Kategorien zu hinterlegen.
Ja, da sehe ich nur die erweiterten Tags. Du könntest aber evtl. mit einem weiteren Profil (separater Input-Ordner) arbeiten. Vielleicht kannst du es ja schon beim Scannen vorsortieren. In diesem Fall kannst du eine eigene Regeldatei anwenden.

2) Immer Mal wieder kommt es vor, dass ich im Output-Folder Dateien habe, welche ich nicht öffnen und auch nicht löschen kann. Lösche ich dieses PDF, dann erscheint es ein paar Sekunden später wieder.

Ich kenne das Verhalten nicht. Wie heißt denn diese Datei? Läuft der Dockercontainer "synOCR" noch? Ob synOCR noch läuft, erkennst du auch daran, wenn du unter "Übersicht" in der GUI einen manuellen Programmlauf anstößt. In dem Fall wird der laufende Task gemeldet.
 
Zuletzt bearbeitet:

vistalba

Benutzer
Mitglied seit
21. Dez 2020
Beiträge
12
Punkte für Reaktionen
0
Punkte
1
  1. Ja, da sehe ich nur die erweiterten Tags. Du könntest aber evtl. mit einem weiteren Profil (separater Input-Ordner) arbeiten. Vielleicht kannst du es ja schon beim Scannen vorsortieren. In diesem Fall kannst du eine eigene Regeldatei anwenden.

Schade, dann werde ich wohl um das hochkomplizierte YAML File nicht herumkommen. :(
Wäre schön gewesen, wenn man einem Tag/Kategorie zumindest sagen könnte: "nur wenn sonst keine Rule matched" ... also quasi so zum Schluss eine "Catch all" Rule.

Ich werde mir das mit den separaten Scan-Profilen Mal überlegen. War aber eigentlich bisher nicht angedacht. Macht das ganze auf dem kleinen Scanner-Display auch nicht wirklich übersichtlicher.

2. Ich kenne das Verhalten nicht. Wie heißt denn diese Datei? Läuft der Dockercontainer "synOCR" noch? Ob synOCR noch läuft, erkennst du auch daran, wenn du unter "Übersicht" in der GUI einen manuellen Programmlauf anstößt. In dem Fall wird der laufende Task gemeldet.

Nein, der läuft nicht mehr. Ist alles abgeschlossen. Lustigerweise scheint es immer bei den gleichen Dateien zu passieren.
Der Filename eines der betroffenen Files ist z.B.: "Invoice_1892018_3302609987102017.pdf"
Wenn ich das Logfile anschaue, sehe ich nicht spezielles. Alles was er bei anderen Files auch ausgibt welche funktionieren.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat