synOCR synOCR - GUI für OCRmyPDF

wagawaga

Benutzer
Mitglied seit
13. Mrz 2012
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Den hier? synOCR/synOCR_master_latest_(2021-01-26_12-46)_2349439.spk

Den habe ich drüberinstalliert und noch mal einen Versuch unternommen. Die Ergebnisse mit Logs hänge ich hier an. Die Tags wurden alphabetisch sortiert und nicht in der Reihenfolge der Ruleabarbeitung.

Oder habe ich etwas falsch gemacht beim installieren des obigen Builds?
 

Anhänge

  • synOCR_searchfile_Test1.txt
    45 Bytes · Aufrufe: 3
  • synOCR_searchfile_Test2.txt
    34 Bytes · Aufrufe: 3
  • synOCR_searchfile_Test3.txt
    22 Bytes · Aufrufe: 2
  • synOCR_2021-02-03_13-34-58.txt
    26,1 KB · Aufrufe: 3

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Die Tagregeln werden rückwärts aufgebaut, d.h. ein neu gefundener Tag wird VOR den bereits gefundenen gesetzt. Du musst also die Reihenfolge umkehren.
 

wagawaga

Benutzer
Mitglied seit
13. Mrz 2012
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Perfekt! Passt und funktioniert!!! Einfach den Präfix des Rulenames entsprechend von aaa auf ccc nun kommen die Ergebnisse so raus, wie ich es mir erhofft hatte.

1000 Dank für das schnelle Feedback!
 

wagawaga

Benutzer
Mitglied seit
13. Mrz 2012
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Vielleicht noch eine Frage...

Im Augenblick kann ich ja nur auf der Ebene einer Rule eine Condition: all, any, none festlegen.

Kann ich denn auch gewissermaßen eine Verschachtelung machen? Also Subrule1 muss erfüllt sein und für die Subrules 2 - 4 gilt, dass eine (also any) erfüllt sein muss.
 

wagawaga

Benutzer
Mitglied seit
13. Mrz 2012
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Mir schiessen nur gerade so ein paar Ideen durch den Kopf. Es ist ja schon ein gewisser Aufwand Regeln für alle Dokumente zusammenzustellen und dabei fehlerhafte Trigger zu vermeiden.

Wäre es denn denkbar, die Bearbeitung einer Rule davon abhängig zu machen, ob eine andere Rule satisfied worden ist oder nicht?

Gerade Kontoauszüge erzeugen ja eine Menge Probleme. Da tauchen in den Buchungstexten so ziemlich alle Trigger auf, die man sich so vorstellen kann.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Es ist ja schon ein gewisser Aufwand Regeln für alle Dokumente zusammenzustellen und dabei fehlerhafte Trigger zu vermeiden.
Meinst du, die entsprechende Logik zu programmieren, ist einfacher ;)
Gerade Kontoauszüge erzeugen ja eine Menge Probleme. Da tauchen in den Buchungstexten so ziemlich alle Trigger auf, die man sich so vorstellen kann.
Kannst du dir da nicht mit searchtyp: is not helfen? (das hilft natürlich nicht bei jeder condition)
YAML:
sampletagrulename1:
    tagname: Bausparvertrag
    targetfolder:
    condition: all
    subrules:
    - searchstring: LBS
      searchtyp: contains
      isRegEx: false
      source: content
      casesensitive: true
    - searchstring: Kontoauszug
      searchtyp: is not
      isRegEx: false
      source: content
      casesensitive: false
 

dreamdealer

Benutzer
Mitglied seit
29. Nov 2009
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Meines Wissens musst du das mit dem Parameter --rotate-pages verbinden.
Also: --rotate-pages --rotate-pages-threshold 5
Die Änderung hat leider keinerlei Effekt.

Bei den OCR options
-srd -l deu --rotate-pages --rotate-pages-threshold 5
besteht das Problem genau so weiterhin.

Kann es ggf. sein dass es an nem AutoUpdate des Dockerimages liegt? Ich habe keinerlei Einstellungen verändert und die Scans vom 04.01. sind ok, bei denen vom 26.01. ist es mir zum ersten mal aufgefallen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Dein Problem betrifft ausschließlich OCRmyPDF direkt. Du kannst natürlich mal an anderes Image in der Dockergui ziehen und dann in der GUI auswählen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
:unsure:
sehr eigenartig - da habe ich gerade keine Idee. Kannst du mal ein anderes Communitypaket testen (z.B. synOTR oder Ulitmate Backup [gerne eines der beiden, da sie eine gleich aufgebaute GUI haben])
 

polonus

Benutzer
Mitglied seit
01. Sep 2008
Beiträge
30
Punkte für Reaktionen
2
Punkte
8
:unsure:
sehr eigenartig - da habe ich gerade keine Idee. Kannst du mal ein anderes Communitypaket testen (z.B. synOTR oder Ulitmate Backup [gerne eines der beiden, da sie eine gleich aufgebaute GUI haben])
Ich denke somit wird klarer, was ich meine (siehe Screenshots). Ich verstehe schon, dass ihr auch "Basic Fragen". Ich nutze Synology Server seit über 12 Jahren (sei DS207+ der Renner war ;)). Bis jetzt habe ich auch keine Community Apps verwendet. Eigentlich ist für mich SynOCR eine Ausnahme. Die App ist aber so genial, dass ich einfach schwach wurde...DSM_Menue.pngSynOCR_installed.pngSynOCT_OCR_installed.pngonly_uninstall_auto_update.png
 
  • Like
Reaktionen: peterhoffmann

polonus

Benutzer
Mitglied seit
01. Sep 2008
Beiträge
30
Punkte für Reaktionen
2
Punkte
8
:unsure:
sehr eigenartig - da habe ich gerade keine Idee. Kannst du mal ein anderes Communitypaket testen (z.B. synOTR oder Ulitmate Backup [gerne eines der beiden, da sie eine gleich aufgebaute GUI haben])
Hallo geimst, bei Interesse könnte ich gerne im screensharing (Zoom/Skype for business oder Microsoft Teams) kurz zeigen ...
 

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
Hallo, das Programm läuft super!!!
Eine Frage:
Ist es möglich das er den Namen der Firma erkennt? Ich kann nicht alle Tages schreiben, wie MediaMarkt,Satur,OBI...es gibt ja immer neue Firmen.

Also das Datum, dann Rechnung und danach die FIRMA....
Datum, Rechnung wird schon erkannt...sonst habe ich nur Dateien mit Rechnungen....
 

polonus

Benutzer
Mitglied seit
01. Sep 2008
Beiträge
30
Punkte für Reaktionen
2
Punkte
8
Ja, aber nur wenn der die Namen nicht als Logo sondern als Text erscheinen. Du musst nur entsprechende Regeln definieren. Das hat bei mir echt gut funktioniert.
 
Zuletzt bearbeitet von einem Moderator:
  • Like
Reaktionen: driftkingisback

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63

driftkingisback

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
122
Punkte für Reaktionen
4
Punkte
18
Ja, aber nur wenn der die Namen nicht als Logo sondern als Text erscheinen. Du musst nur entsprechende Regeln definieren. Das hat bei mir echt gut funktioniert.
Ich kann doch nicht alle Firmen wissen wie die heißen und wo ich demnächst einkaufe.
Deichmann, Rewe,Netto,Liddle,Jack&Jones

wie mache ich das am besten? Ein Beispiel wäre hilfreich
 

vasw

Benutzer
Mitglied seit
04. Jan 2021
Beiträge
11
Punkte für Reaktionen
0
Punkte
1
Hallo,
bräuchte kurz Hilfe...
möchte das dieses Regex (123.?456.?789) "nicht gefunden" wird
funktioniert irgendwie nicht - kann das stimmen?

YAML:
    - searchstring: 123.?456.?789
      searchtyp: does not contain
      isRegEx: true
      source: content
      casesensitive: false
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat