synOCR synOCR - GUI für OCRmyPDF

Hallo Stefan,

das geht sowohl in einer wie auch in 2 (mehreren) Regeln.

Hier ein Vorschlag (ungetestet, da schon im Büro):
YAML:
rule_101:
    tagname: 2_§yocr4§mocr§docr_DL_§tagname_RegExEURO
    targetfolder: /volume1/privat/_M
    tagname_RegEx: (?i)(?:(?<=Endsumme\s))(?:\d*[\,\.]\d{2})(?=\s(?:€|EUR|EURO))
    condition: all
    subrules:
    - searchstring: Drescher + Lung
      searchtyp: contains


rule_102:
    tagname: 5_§yocr4§mocr§docr_Therapie³_§tagname_RegExEURO
    targetfolder: /volume1/privat/_M
    tagname_RegEx: (?i)(?:(?Rechnungsbetrag\s))(?:\d*[\,\.]\d{2})(?=\s(?:€|EUR|EURO))
    condition: all
    subrules:
    - searchstring: Osteopathie
      searchtyp: contains

Nicht vergessen
unter "Leerzeichen bereinigte Suche" auf "Leerzeichen bereinigen" schalten.

Wenn Dir die Variante mit dem Komma im Betrag nicht gefällt, können wir dies per Postscript entfernen oder die Euro bzw. Cent Beträge auf 2 Regeln aufteilen.

Gruß Karsten
 
  • Like
Reaktionen: geimist
Danke dir, passt so.
In der zweiten Regel ist ein Fehler drin
Code:
(?Rechnungsbetrag\s))
gehört so:
(?<=Rechnungsbetrag\s))

Damit funktioniert es, außer bei der letzten, die ich gerade durch laufen lassen habe.
Da hat er aus 6,72 €
6,72€# (# = Leerzeichen!)
gemacht und hat Leerzeichen und Euro Zeichen vertauscht.

Wenn er das alle 100 mal macht, kann ich mit leben.

Grüße Stefan
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Struppix
Damit funktioniert es, außer bei der letzten, die ich gerade durch laufen lassen habe.
Hallo Stefan,
ersetze mal in beiden Regeln das letzte '\s' durch ein '\D+'. Damit sollte es funktionieren.
Karsten
 
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat