synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
  • Hast du beim Quellverzeichnis in der GUI auch einen grünen Haken?
  • Stimmt der Pfad?
  • Gerne passiert das auch mal, wenn noch ein unkonfiguriertes Profil existiert …
 

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
ja grünen Haken habe ich, Pfad habe ich aus Eigenschaften kopiert.
root bei Aufgabenplaner habe ich auch gemacht.
Irgendwelche Berechtigungen noch?
 

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
Gibt es eine vorgefertigte Liste die man benutzen kann, hab jetzt schon über 70 Tags eingegeben das er die Umbenennung vornimmt.
#Rechnung
#Angebot
#Steuer
#Versicherung

Ich hätte gerne danach #Rechnung_FIRMA immer die Firma aber kann nicht jede Firma in die Tags mit einbinden oder wie macht ihr das?
z.B #Rechnung_Media-markt

das er Rechnung erkennt und automatisch nach der Firma schaut ? Bin mir noch nicht so richtig sicher wie ich mir die Umbenennung mache

Oder gibt es eine einfache vorgehensweiße ? Möchte einfach die Post aufmachen, in den Scanner und der scannt es ab und benennt es was es ist
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
Vorgefertigt gibt es da nichts, da zu individuell.
Nutzt du die Tags in der GUI oder über eine externe YAML-Datei? Für den zweiten Fall wäre vielleicht ein Weg über RegEx möglich. Guck mal HIER (in Bezug auf RegEx gibt es bestimmt kompetentere Ratgeber als mich).
 

cristi_petre

Benutzer
Mitglied seit
04. Sep 2014
Beiträge
60
Punkte für Reaktionen
0
Punkte
6
Hallo zusammen.
Ich hoffe ich werde nicht gesteinigt aber ich verstehe das ganze nicht so ganz.

Würde gerne mit meinem Scanner (Epson ES-580W) Durchsuchbare PDFs erstellen. Das geht ja nicht nun bin ich auf SynOCR gestossen.

Ich habe nun alles soweit auf der DS (918+) eingerichtet.

Meine Frage ist wie kann ich nun einrichten das wenn ich Kassenbelege, Rechnungen, Bons etc. scanne in ein gewissen Ordner verschoben wird und wenn möglich auch ein entsprechender Dateiname vergeben wird zum Beispiel Saturn Rechnung auch im Dateinamen Saturn steht?

Und die anderen Dokumente je nachdem was man scannt auch entsprechend in Unterverzeichnissen abgelegt wird zum Beispiel Verträge zu Verträge, Rezept zu Rezepte und nicht kategorisierterbare Sachen in ein Ordner kommen wo es keine Kategorie gibt. In den Input Ordner soll nach der Behandlung dann nichts mehr drin sein.

Hab mir die einige Sachen angeschaut leider kann ich sie für mich nicht umsetzen weil ich nicht genau weiß wie ich das genau umsetzen soll.


Damit zum Beispiel nicht Rechnungen, Belege und oder Bons in den Ordner Dokumente abgelegt werden müsste ich das zum Beispiel so schrieben?


rule_01:

tagname: Dokumente

targetfolder: /Volume1/Scans/Dokumente/

condition: none

subrules:

- searchstring: Beleg

- searchstring: Rechnung

- searchstring: Kassenbon
 

Anhänge

  • Bildschirm­foto 2022-10-29 um 14.16.35.png
    Bildschirm­foto 2022-10-29 um 14.16.35.png
    157,8 KB · Aufrufe: 7
  • Bildschirm­foto 2022-10-29 um 14.17.17.png
    Bildschirm­foto 2022-10-29 um 14.17.17.png
    100,8 KB · Aufrufe: 7
  • Bildschirm­foto 2022-10-29 um 14.20.29.png
    Bildschirm­foto 2022-10-29 um 14.20.29.png
    119,3 KB · Aufrufe: 7
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
Wo hakt es denn? Auf den ersten Blick scheint die Konfiguration (auch die Regeldatei) bereits korrekt zu sein. Wenn du eine konkrete Datei hast, die nicht wie gewünscht funktioniert, kannst du mir gern auch ein Log schicken (Link in meiner Signatur).
 

cristi_petre

Benutzer
Mitglied seit
04. Sep 2014
Beiträge
60
Punkte für Reaktionen
0
Punkte
6
Wow du bist ja echt super Schnell. Danke für die schnelle Antwort Stephan

Noch hab ich es nicht ausgeführt. Wollte erst mal sicher gehen das ich das soweit richtig konfiguriert habe.

Wie gesagt ich möchte das Rechnungen und Belege zusammen in den Ordner Belege verschoben werden.

Die anderen Dokumente zum Beispiel Rezepte in den Ordner Rezepte.

Andere Sachen auf die keine Regel zutrifft sozusagen in den Ordner Dokumente verschoben wird.


Kann ich das so in die Konfiguration schreiben? Hier würde er ja alle Dateien die nicht Rechnung, Beleg, Kassenbons sind in den Ordner Dokumente verschieben oder habe ich da ein Fehler im denken?

rule_01:

tagname: Dokumente

targetfolder: /Volume1/Scans/Dokumente/

condition: none

subrules:

- searchstring: Beleg

- searchstring: Rechnung

- searchstring: Kassenbon
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
Probieren geht über Studieren 😇
Wichtig: fang erst einmal mit einzelnen Dokumenten an, bevor du hunderte in dein Quellverzeichnis legst oder scannst.
Kann ich das so in die Konfiguration schreiben? Hier würde er ja alle Dateien die nicht Rechnung, Beleg, Kassenbons sind in den Ordner Dokumente verschieben oder habe ich da ein Fehler im denken?
Laut deinem ersten Post nicht. Alles, wo keine Regel greift, verbleibt einfach in deinem Zielverzeichnis. Einen Prioritätsmechanismus, der das Erfülltsein zwischen den Regel reguliert (z.B. was passiert, wenn keine Regel erfüllt ist), gibt es derzeit noch nicht.
 

cristi_petre

Benutzer
Mitglied seit
04. Sep 2014
Beiträge
60
Punkte für Reaktionen
0
Punkte
6
Habs ausgeführt. So wies aussieht kopiert er die Rechnungen und Belege etc. in den Belege Ordner allerdings auch falsche Sachen wie "Berechnung". Ich müsste jetzt also sicherstellen das er wirklich nur auf die Wörter achtet.

Anbei auch ein Log.


Gibt es eine Beispiel Regel Datei wo man das mehr oder minder noch individualisieren kann?



Die Versandbestätigung hat er in Belege kopiert weil darin das Wort Rechnung auftaucht kann ich das vermeiden?
 

Anhänge

  • synOCR_2022-10-29_14-41-01.txt
    1,4 MB · Aufrufe: 3
  • 29-03-2022_#Rechnung#Quittung_Scan 29032022 133946 0001.pdf
    244,9 KB · Aufrufe: 2
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
allerdings auch falsche Sachen wie "Berechnung".
Dann setze casesensitive auf true. So wird nur Rechnung gefunden.
Du kannst auch weitere Subrules mit unerwünschten Begriffen erstellen und darin den Wert für searchtyp auf does not contain setzen.
Möglich wäre auch, den searchtyp in der subrule für Rechnung auf is zu setzen. Einfach mal probieren. Für die Regeln muss man sich einfach bisschen Zeit nehmen und experimentieren.

EDIT: Das WIKI kennst du?
 
Zuletzt bearbeitet:

cristi_petre

Benutzer
Mitglied seit
04. Sep 2014
Beiträge
60
Punkte für Reaktionen
0
Punkte
6
Sorry das ich nerve wie kann man "IDENTITY CARD" als Beispiel suchen und in ein Ordner verschieben lassen? Wenn ich nur ein Wort das 'Identity eingebe funktioniert es wenn ich ein 2. Searchstring einfüge mit card schiebt er es wieder in den Outputordner
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.511
Punkte für Reaktionen
1.347
Punkte
234
Na so:

YAML:
Regel_mit_kombiniertem_Suchbegriff:
    tagname: IDENTITY CARD
    condition: all
    subrules:
    - searchstring: IDENTITY CARD
      searchtyp: contains
      isRegEx: false
      source: content
      casesensitive: false
 

cristi_petre

Benutzer
Mitglied seit
04. Sep 2014
Beiträge
60
Punkte für Reaktionen
0
Punkte
6
Habs versucht nun einzufügen leider macht er das nicht mit "condition all" wenn ich dort any schriebe gehts.

Ich weiß nicht was ich nicht richtig mache
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat