synOCR synOCR - GUI für OCRmyPDF

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Nabend Stephan, funktioniert unter 1.2.0.1 schon die Ordnerüberwachung oder kommt das wie in den FAQs angegeben erst mit 1.3.0? Ich finde dazu nix in meinen Einstellungen…
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Ja, in Version 1.2.0.1 ist das eingebaut. Es gibt da nicht viel zu konfigurieren. Die inotify-tools müssen installierte sein und das Startskript muss über den zustätzlichen Parameter start aufgerufen werden (u.a. auch nach einem Systemneustart oder einer Änderung der Quellordner).

Version 1.3.0 wird das nächste Release. Die Version 1.2.0.1 ist lediglich eine Snapshotversion, wo das aber schon eingebaut ist.

Hier ist das Nötige beschrieben (was du wahrscheinlich schon kennst).
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Ah, jetzt hab ichs, ist installiert und läuft super. Danke Dir!
 

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
GUI läuft, zum testen habe ich eine Rechnung eingescannt und auch die Regeln geschrieben. Auf der ersten Seite ist Rechnung schriftlich geschrieben normalerweise müsste doch die Datei als Rechnung umbenannt werden.

Quittung_72:
tagname: Quittung
targetfolder:
condition: any
subrules:
- searchstring: Quittung
searchtyp: contains
isRegEx: false
source: content
casesensitive: true
Rechnung_73:
tagname: Rechnung
targetfolder:
condition: any
subrules:
- searchstring: Rechnung
searchtyp: contains
isRegEx: false
source: content
casesensitive: true


Hier der Log

search by tag rule: "Rechnung_73" ➜
➜ condition: any
➜ tag: Rechnung
➜ destination:
>>> Rule is not satisfied


Wo ist der Fehler, der Plan ist wenn ich Rechnungen einscann das die Datei dann Datum- Rechnung heißt
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Öffne mal die fertige PDF in einem PDF-Viewer und suche nach dem Begriff auf der ersten Seite.
Wird er da gefunden?

Du kannst mir gern auch ein vollständiges Log hochladen (gern mit Quelldokument). Link findest du in meiner Signatur.
 

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
Quelldokument habe ich hochgeladen sowie die Logs, leider finde ich im PDF Viewer auch nicht Rechnungen wenn ich auf Suche klicke...kann es aber sehen, GUI bearbeitet es und verschiebt es auch in den Output Ordner
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Zwei Dinge sind mir aufgefallen:
  1. im Dokumente steht RECHNUNG, du suchst aber laut Regeldatei nach Rechnung und das casesensitiv. Das solltes du vielleicht auf false stellen
  2. Ich gehe davon aus, dass es sich hier nicht um einen Scan handelt, sondern um ein digital erstelltes Dokument. Da hilft es ggf., wenn man im OCR-Parameter s (=skip text) durch f (=force-ocr) ersetzt.
Bitte mal probieren und wieder melden.
 

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.247
Punkte für Reaktionen
70
Punkte
68
Guten Morgen!

kann mich jemand bei der Installation des Docker Containers ocrmypdf unterstützen?
Finde dazu leider keine brauchbare Doku :(

Wenn ich es richtig verstanden habe, brauche ich ocrmypdf nicht installieren - das übernimmt synOCR?
Bildschirmfoto 2022-05-05 um 10.42.13.png


Leider wird aber nach der Installation kein ocrmypdf container angezeigt - o.ä.
Habe eine DS718+ mit DSM 7.1-42661 Update 1 im Einsatz.
synOCR 1.2.0 installiert.
 
Zuletzt bearbeitet:

Kachelkaiser

Benutzer
Sehr erfahren
Mitglied seit
22. Feb 2018
Beiträge
1.877
Punkte für Reaktionen
749
Punkte
134

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Hallo zusammen.

Ihr braucht in Docker nichts zu konfigurieren. Der Container wird eh nur temporär für jedes PDF erstellt und anschließend verworfen (also nicht wundern, dass er sich nicht starten lässt oder nicht permanent läuft). In der GUI von synOCR kann man wählen, welches Image geladen und genutzt werden soll (in der Regel reicht der Defaultwert).

Macht es euch nicht zu schwer. SynOCR war genau aus dem Grund entstanden, nichts frickeln zu müssen, sondern eine einfache GUI-Lösung bereitstellen zu können. :cool:
 
  • Like
Reaktionen: Kachelkaiser

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.247
Punkte für Reaktionen
70
Punkte
68
Klappt bei mir auch mittlerweile ;)
Aber, wenn ich fragen darf: Warum wird der Container JEDES mal erstellt?
Wäre es aus perfomance Gründen nicht besser, den Container einmal zu erstellen und dann es dabei zu belassen?
 
  • Like
Reaktionen: geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Wäre es aus perfomance Gründen nicht besser, den Container einmal zu erstellen und dann es dabei zu belassen?
Das Design stammt von OCRmyPDF.
Letztendlich wäre die permanente Nutzung des RAMs und zusätzlich laufender Prozesse sicherlich unperformanter. Ich weiß nicht, ob es das genau trifft, aber ein laufender Container beschreibt ja am ehesten ein gestartetes Image äquivalent zu einem Programm.
 

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.247
Punkte für Reaktionen
70
Punkte
68
da hast du auch wieder Recht! :)
Dann werde ich mir ein Script schreiben, welches minütlich in den Input Ordner schaut und WENN dort eine Datei exisiert -> starte synOCR :)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.515
Punkte für Reaktionen
1.351
Punkte
234
Das brauchst du doch auch nicht. Entweder du erstellst dir eine Aufgabe im Aufgabenplaner mit deinem gewünschten Intervall (das geht ja schon minütlich), oder du willst die aktuelle Beta nutzen. Die kann auch die intify-tools (zu installieren von synocommunity) zugreifen, um eine Odnerüberwachung laufen zu lassen.
 
  • Haha
Reaktionen: peterhoffmann

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.247
Punkte für Reaktionen
70
Punkte
68
habe bereits eine Aufgabe erstellt, die minütlich läuft.
Aber würde hierbei nicht jede Minute auch der Container erstellt werden? oder wird hier auch schon geprüft: Wenn Ordner leer, mach nix?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Leerer Ordner => Script beendet (kein Container erstellt)

Das belastet deine DS718+ überhaupt nicht.
 

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.247
Punkte für Reaktionen
70
Punkte
68
Frage am Rande:
Gibt es eine Möglichkeit, meine bestehenden PDF Dateien durch synorc laufen zu lassen, ohne die bestehende Dateistruktur zu beeinflussen?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat