synOCR synOCR - GUI für OCRmyPDF

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.179
Punkte für Reaktionen
1.012
Punkte
224
Das ist dann einfacher als gedacht. Habe das Blatt einmal gescannt, geschaut was er findet und es funktioniert wie geplant ☺️ Danke Dir!
 
  • Like
Reaktionen: geimist

stainless89

Benutzer
Mitglied seit
11. Nov 2019
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Bitte mal diese Version installieren, einmal die Originaldatei verarbeiten lassen und anschließend mir das Log wieder hochladen. Diese Datei enthält lediglich ein spezifisches Logging, weil ich dein Problem überhaupt noch nicht nachvollziehen kann.

Download
Hey, alles erledigt. Jetzt ist die OCR Version auch vollständig. Ich habe die das aktuelle Log nochmal hochgeladen. Vielen vielen Dank.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.505
Punkte für Reaktionen
1.343
Punkte
234
Prima - das freut mich. :)

@all:
Es war die gleiche Ursache, wie wir sie schon einmal hatten.
Es gibt ja verschiedene Dateiaktionen, die mit Inotify überwacht werden können. Derzeit werden diese beiden Aktionen ausgewertet: moved_to und close_write. In diesem Fall sowie damals war es so, dass diese Art Scanner das Schreiben der Datei nach der 1. Seite abschließt (close_write), sie aber für jede weitere Seite remote wieder öffnet. Letztendlich wird eine unfertige Datei von synOCR verarbeitet. Damals war es dieser Scanner: Canon MB5150.

Abhilfe schafft dieser Zwischenschritt: https://www.synology-forum.de/threads/synocr-gui-fuer-ocrmypdf.99647/post-1024562
 
  • Like
Reaktionen: Crashandy

Crashandy

Benutzer
Mitglied seit
14. Mai 2014
Beiträge
291
Punkte für Reaktionen
99
Punkte
28
Letztendlich wird eine unfertige Datei von synOCR verarbeitet. Damals war es dieser Scanner: Canon MB5150.
Ich habe genau dasselbe Problem mit meinem Canon MAXIFY GX7050. syncOCR holt sich diese Datei bevor der Scanner fertig ist. Das passiert nur bei mehr als zwei doppelseitigen Scans und ich vermute, dass der interne Speicher von Canon nicht groß genug ist.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.505
Punkte für Reaktionen
1.343
Punkte
234
Ich sehe aber keine andere Möglichkeit, das mit Inotify abzufangen. Der Canon öffnet die Datei halt erneut. Vielleicht hilf es auch, mal ein anderes Protokoll zu nutzen (FTP statt SMB oder umgekehrt).

ich vermute, dass der interne Speicher von Canon nicht groß genug ist.
Ich vermute da eher die Ursache in der Implementierung.
Zum Test: Scanne ein mehrseitiges Dokument in 72 DPI und 1 Bit Farbtiefe (schwarzweiß) und zum Vergleich dasselbe in 1200 DPI und Farbe. Wenn schon beim 1. Probleme auftauen, sollte der Speicher gar nicht für die 1. Seite des zweiten Versuchs reichen.
 
Zuletzt bearbeitet:

Crashandy

Benutzer
Mitglied seit
14. Mai 2014
Beiträge
291
Punkte für Reaktionen
99
Punkte
28
Okay, ich danke Dir.
Ich werde mir den Zwischenschritt mit dem Aufgabenplaner einrichten. Das hatte ich leider nicht vorher über die Suche gefunden.
 

stainless89

Benutzer
Mitglied seit
11. Nov 2019
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Prima - das freut mich. :)

@all:
Es war die gleiche Ursache, wie wir sie schon einmal hatten.
Es gibt ja verschiedene Dateiaktionen, die mit Inotify überwacht werden können. Derzeit werden diese beiden Aktionen ausgewertet: moved_to und close_write. In diesem Fall sowie damals war es so, dass diese Art Scanner das Schreiben der Datei nach der 1. Seite abschließt (close_write), sie aber für jede weitere Seite remote wieder öffnet. Letztendlich wird eine unfertige Datei von synOCR verarbeitet. Damals war es dieser Scanner: Canon MB5150.

Abhilfe schafft dieser Zwischenschritt: https://www.synology-forum.de/threads/synocr-gui-fuer-ocrmypdf.99647/post-1024562
Na Mensch, das passt ja gut, ich habe nämlich den Canon MB5155. Ich werde dann auch den Zwischenschritt über einen temp Ordner machen. Vielen Dank
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
880
Punkte für Reaktionen
179
Punkte
63
Hallo Leute,

wie im YT Channel angekündigt möchte ich interessierten Usern den neuen YAML-Konfigurator zum Testen als Beta Version zur Verfügung stellen.
Leider bin ich mangels Zeit und einfach von VBA "zu wenig Ahnung" noch weit vom Ziel entfernt. Es gibt noch viele Sachen die noch nicht richtig funktionieren, und ich kämpfe noch mit dem AddIn, um dessen Funktionalität wirklich nutzen zu können. Vielleicht findet sich ja ein Mitstreiter der hier etwas unterstützen könnte.

Derzeit sind nur ein paar Regelblöcke zum Testen inbegriffen. Diese sind noch zu ergänzen, und genau da braucht es Euer Feedback.
Es wäre für uns sehr hilfreich, wenn die Freiwilligen
- Funktionalität,
- Stabilität,
- user-friendliness,
- Fehler,
- und natürlich die Regelblöcke selbst testen und bewerten könnten.

Ein Hinweis: Derzeit sind die Regeln multiple-choice mäßig aufgebaut, sodaß in einer Regel schon mal 10-15 Suchbegriffe auftauchen. Hier entscheidet die Reihenfolge. Nimmt man die Begriffe einzeln, sind die vermutlich 300 Suchbegriffe schon ne ganze Menge. Man kann diese auch als Einzelbegriffe darstellen, was natürlich recht unübersichtlich wäre aber ginge.

Was habt Ihr spontan für Ideen, wenn Ihr die Beta testet. Lasst es mich bitte wissen. Ich bin für jeden Hinweis dankbar.

Im Download ist eine Installationsanweisung und eine Kurzanleitung beinhaltet.
Hier der Download

Gruß
Karsten
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
880
Punkte für Reaktionen
179
Punkte
63

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.179
Punkte für Reaktionen
1.012
Punkte
224
@geimist Musste gerade nach selbstverschuldetem „Stromausfall“ ein Volume neu erstellen, auf dem unter anderen synOCR läuft und freue mich gerade sehr darüber, dass die Einstellungen über Hyper Backup in kürzester Zeit wiederhergestellt werden können, sodass sich die „Arbeit“ bei der Wiederherstellung und vorhandenem Backup als sehr gering erweist. Danke nochmal dafür!
 
  • Like
Reaktionen: geimist und Struppix

racinggoat

Benutzer
Mitglied seit
30. Dez 2014
Beiträge
211
Punkte für Reaktionen
45
Punkte
28
Meine ersten "Gehversuche" waren erfolgreich. Zunächst erst einmal VIELEN DANK 🤝🍻 an die fleißigen Helfer und Sichauskenner. Ihr seid der Hammer! Danke.

Nun will ich natürlich mehr. Habe synOCR DSM7 Version 1.4.4. mit inotify-tools 3.22.6.0-3 am laufen.

Frage 1) zum Verständnis
Durch inotify-tools läuft die NAS durch, weil das Programm - für mich verständlich ausgedrückt - auf Eingaben "lauert". Von daher immer in Bereitschaft. Da mein Scanaufkommen nicht laufend stattfindet, sondern im Stapel in engem Zeitrahmen muss ich vermutlich inotify-tools wieder abschalten, so dass dann die HDD der DS zur Ruhe kommen. RICHTIG? Andere Aufgaben außer Backup laufen derzeit nicht.
Die DS müsste ja beim Scanvorgang angesprochen werden und erwachen. Kann man irgendwie bewerkstelligen, dass die synOCR-Verarbeitung dann startet und nach - weiß ich nicht - 10 Minuten Nichtbeschäftigung wieder stoppt, so dass die NAS dann wieder "zur Ruhe" kommt?

Frage 2)
Die Ablage in Unterordner kann ja auch automatisiert werden - Stichwort YAML. Ich bin immer noch im Ordnerdenken, der Rest meiner NAS-Nutzer vermutlich auch. Derzeit sollen den Zugriff auf die abgelegten Papiere auch alle haben. Kann jemand mir eine Beispiel YAML-Datei zur Verfügung stellen, anhand derer ich die Systematik ich dann nachvollziehen und durchhangeln kann (Ordner mit Unterordner; Ablage anhand von Schlagworten [Bank, Versicherung [HUK, Allianz, ...], ...)? Danke.
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
880
Punkte für Reaktionen
179
Punkte
63
Kann jemand mir eine Beispiel YAML-Datei zur Verfügung stellen, anhand derer ich die Systematik ich dann nachvollziehen und durchhangeln kann (Ordner mit Unterordner; Ablage anhand von Schlagworten [Bank, Versicherung [HUK, Allianz, ...], ...)? Danke.
Probiere doch mal die Beta des YAML-Editors 2 Beiträge weiter oben. Er bietet genau das in Windeseile als Templates. Und die von Dir gesuchten Beispiele sind auch dabei.
Im Übrigen kann die Beta alles was die final Version auch kann.
Gruß Karsten
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.505
Punkte für Reaktionen
1.343
Punkte
234
Frage 1) zum Verständnis
Inwieweit Inotify den Ruhezustand der Festplatte verhindert, kann ich nicht beurteilen. Es geht aber über ein reines Lesen eines Ordners hinaus. So weit mir bekannt, arbeitet Inotify sehr Kernel nah, weshalb ich die Hoffnung hätte, dass es die HDDs nicht aufweckt. (Ich bin vom HDD-Ruhezustand eh kein Freund, weil man den HDDs damit keinen Gefallen tut.)
Die Alternative wäre, synOCR über einem festen Intervall im Aufgabenplaner aufzurufen (der Aufruf, aber ohne dem Parameter start). Aber das würde die HDDs garantiert aufwecken, weil dann jedes Mal aktiv gelesen wird.
 

racinggoat

Benutzer
Mitglied seit
30. Dez 2014
Beiträge
211
Punkte für Reaktionen
45
Punkte
28
@Struppix: bin mit Libre-Office unter ubuntu unterwegs, das läuft nicht (Makros), oder ich bin wieder einmal zu ... Zumindest kommen Fehlermeldungen.

@geimist: Danke, werde mal testen, beobachten und berichten
 

racinggoat

Benutzer
Mitglied seit
30. Dez 2014
Beiträge
211
Punkte für Reaktionen
45
Punkte
28
Überlegung: ..könnte man mein YAML-Problem vielleicht mit einer Windows-VM auf der NAS lösen? Bräuchte ich da eine Seriennummer won WIndows?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.505
Punkte für Reaktionen
1.343
Punkte
234

racinggoat

Benutzer
Mitglied seit
30. Dez 2014
Beiträge
211
Punkte für Reaktionen
45
Punkte
28
Am RAM sollte es nicht mangeln (64GB), ja aber M$-Officce hängt ja auch noch dran. Ganz vergessen. Also Plan B.

Musterdatei?, Anleitung? Wer kann helfen?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Hier hat sich ein User in stundentagelanger Kleinarbeit hingesetzt und für Office was gezaubert.
Ganz ehrlich, das ist schon mehr als man erhoffen kann, geschweige erwarten darf.
 
  • Like
Reaktionen: Monacum

racinggoat

Benutzer
Mitglied seit
30. Dez 2014
Beiträge
211
Punkte für Reaktionen
45
Punkte
28
Das hast Du schon Recht - sehr ehrenswert. Und tagelang wird weit untertrieben sein.

Nur, dass "meine" Basis unbuntu (LibreOffice) kein MS-Office, bzw. die ausführbaren Teile davon unterstützt. Ist halt eine andere Plattform.

Oder liege ich da falsch? Dann sagt mir bitte 🙏, wie ich den yaml-Editor unter unbuntu / NAS zum Arbeiten überreden kann!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.505
Punkte für Reaktionen
1.343
Punkte
234
Bitte das Wiki auch nicht vergessen. Dort hat @Struppix alles auch schon schön erklärt. Einfache YAML-Regeln sind schnell erstellt. Du kannst auch in der GUI ein paar Begriffe wie Rechnung;Versicherung;Lohnbescheinigung definieren und dir dann erstmalig über den entsprechenden Button die YAML-Datei erstellen lassen. Die Regeln lassen sich dann ja beliebig verfeinern.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat