synOCR synOCR - GUI für OCRmyPDF

Hallo @BlackAlpha,
  1. die Reihenfolge der gefundenen Tags kann man über die alphabetische Reihenfolge der Regelnamen steuern (WiKi)
  2. ja, der Wunsch nach einer Art Priorisierung kam auch schon mehrmals. Da die Regeln halt nicht starr der Reihe nach abgearbeitet werden, funktioniert dein Vorschlag nicht sicher. Letztendlich hat sich noch kein richtiges Konzept in meinem Köppl entwickelt. Mal gucken …
    Bis dahin könntest du dir evtl. mit Ausschlusskriterien weiterhelfen 🤷‍♂️
 
Das mit den Regeln könnte man ja durch Logik steuern.
Also Beispiel :
If Rechnung and Firma xy then use this tag
If Rechnung an not Firma xy or forms xz then use this tag.

@stephan da müsste man eine rule schaffen, die dann auf diese Logik reagiert.
Ich hätte da schon ein paar Ideen 😁
 
Ich für meinen Teil würde da eine andere Idee vorschlagen.
Was hälst du davon das du einfach eine Regel definierst
Regel_1:
tagname: Rechnung
subrules:
- searchstring: Rechnung

Regel_2:
tagname: Firma XY
condition: all
subrules:
- searchstring: Rechnung
- searchstring: Firma XY

Somit würdest du erkennen. Überall wo im Tag "nur" Rechnung vorkommt wurde die Firma nicht erkannt (ergo unbekannt)
Und wenn die Firma XY erkannt würde, wäre sowohl Tag Rechnung und Firma XY im Tag.

Vielleicht reicht dir das schon an Erkennungsmerkmal.

Viel Spaß weiterhin.

Aber das zusammenbauen der richtigen Regeln die am Besten für jeden passen ist letztlich der größte Knackpunkt an dem tollen Tool. Aber es ist dann so schön wenn man wieder etwas verbessern konnte. :)
 
Hi @geimist,
  1. die Reihenfolge der gefundenen Tags kann man über die alphabetische Reihenfolge der Regelnamen steuern (WiKi)
Das mit den Regelnamen hatte ich versucht, hat bei mir aber komischerweise nicht funktioniert. Ich werde es aber nachher auf jeden Fall nochmal testen. Nicht, dass ich da etwas übersehen habe...

ja, der Wunsch nach einer Art Priorisierung kam auch schon mehrmals. Da die Regeln halt nicht starr der Reihe nach abgearbeitet werden, funktioniert dein Vorschlag nicht sicher. Letztendlich hat sich noch kein richtiges Konzept in meinem Köppl entwickelt. Mal gucken …
Bis dahin könntest du dir evtl. mit Ausschlusskriterien weiterhelfen 🤷‍♂️
Vielleicht wirklich einfach die Regeln "von oben nach unten" abarbeiten? Ich finde, das macht es bei der Erstellung der Regeldateien auch deutlich einfacher, als wenn man die Alphabetische Reihenfolge im Hinterkopf haben muss.


Hi @Gthorsten,
Das mit den Regeln könnte man ja durch Logik steuern.
Also Beispiel :
If Rechnung and Firma xy then use this tag
If Rechnung an not Firma xy or forms xz then use this tag.
Das würde auch nur funktionieren, wenn es nur eine Firma XY gäbe. In meinem Fall war das mit der Firma jedoch nur ein Beispiel. In Wirklichkeit hätte ich bei vollem Ausbau später sicherlich 50 oder mehr Firmen in der Liste, dann würde ein "if not Firma XY" extrem lang und unübersichtlich werden. Daher mein Vorschlag mit dem optionalem Abbruch der Regelbearbeitung für das aktuelle Dokument.
 
Ich für meinen Teil würde da eine andere Idee vorschlagen.
Was hälst du davon das du einfach eine Regel definierst
Regel_1:
tagname: Rechnung
subrules:
- searchstring: Rechnung

Regel_2:
tagname: Firma XY
condition: all
subrules:
- searchstring: Rechnung
- searchstring: Firma XY

Somit würdest du erkennen. Überall wo im Tag "nur" Rechnung vorkommt wurde die Firma nicht erkannt (ergo unbekannt)
Und wenn die Firma XY erkannt würde, wäre sowohl Tag Rechnung und Firma XY im Tag.
Hi @gunfran ,

das würde leider auch nur bedingt funktionieren, da dies den Namen "RechnungFirma XY.....pdf" generieren würde. Leider kann man kein Trennzeichen zwischen den einzelnen Tags angeben. Auch das wäre doch vielleicht noch ein Verbesserungsvorschlag - oder nicht @geimist ? ;)
Wobei man den tagname ja um ein " - " ergänzen könnte und somit die Darstellung "Rechnung - Firma XY.....pdf" bekäme. :unsure: Muss ich später mal durchtesten. :)
 
Hi @BlackAlpha
Ich habe vor jedem Tag ein Zeichen (# bei mir). Damit kann ich die Tags ganz gut auseinander halten.
Ich guck gleich nochmal, wo da die Einstellung ist.
 
Die Einstellung kenne ich, bringt mich bei der Benennung der Dokumente nach meinem seit Jahren genutzten Schema leider nicht weiter. Bei mir lauten die Dateien z.B. Rechnung - Mustermann - 2022-03-21 - Dienstleistung XY.pdf.

Ist quasi mein privates DMS im normalen Dateisystem des NAS. Natürlich müsste ich im Fall einer Rechnung den Grund (Dienstleistung, Artikel oder was auch immer) von Hand nachpflegen, aber wenn der vordere Teil bereits fertig ist, wäre das eine enorme Erleichterung.
 
Bin jetzt gerade unterwegs. Ich melde mich später nochmal und Versuche es dann besser zu erklären. ;)
 
Könnte ich, das stände dann jedoch auch vor dem ersten Tag also - Rechnung - Mustermann.....pdf.
 
Stimmt. Das sieht natürlich auch blöd aus. Es bleibt spannend.
 
Zuletzt bearbeitet von einem Moderator:
Hallo liebe Gemeinde, leider kann ich Synocr nicht downloaden. gibt es eine Schritt für schritt anleitung?
 
Hallo @geimist,

ich habe gerade ebenfalls versucht SynOCR herunterzuladen und erhalte die Meldung "SynOCR_DSM7_v1.2.0.spk Dateien haben ein ungültiges Format".

Diesen Link habe ich genutzt: https://geimist.eu/synOCR/synOCR_DSM7_latest.html

Sorry, bin aber relativ neu in Sachen NAS unterwegs.

Gruß, EuroPC
 
Zuletzt bearbeitet:
Hallo Stephan, ich bräuchte da wahrscheinlich noch ein wenig mehr Erklärungen zu. Ich weiss nicht was ich mit den Datein, die ich da für DSM7 runterladen kann, anfangen soll. Muss ich die irgendwie in meine synology NAS schieben? So auf dem Rechner kann ich die mit keinem Programm öffnen..sorry für die wahrscheinlich extremen Anfängerfragen
 
  • Like
Reaktionen: EuroPC
@EuroPC & @Reco86

Paketzentrum ➜ Button "manuelle Installation"

Bildschirmfoto 2022-04-30 um 16.32.49.png

PS:
Synology Paket "Docker" muss installiert sein.

PPS:
Schaut auch ruhig mal ins Wiki für die nächsten Schritte
 
  • Like
Reaktionen: EuroPC
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat