synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Hallo @BlackAlpha,
  1. die Reihenfolge der gefundenen Tags kann man über die alphabetische Reihenfolge der Regelnamen steuern (WiKi)
  2. ja, der Wunsch nach einer Art Priorisierung kam auch schon mehrmals. Da die Regeln halt nicht starr der Reihe nach abgearbeitet werden, funktioniert dein Vorschlag nicht sicher. Letztendlich hat sich noch kein richtiges Konzept in meinem Köppl entwickelt. Mal gucken …
    Bis dahin könntest du dir evtl. mit Ausschlusskriterien weiterhelfen 🤷‍♂️
 

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Das mit den Regeln könnte man ja durch Logik steuern.
Also Beispiel :
If Rechnung and Firma xy then use this tag
If Rechnung an not Firma xy or forms xz then use this tag.

@stephan da müsste man eine rule schaffen, die dann auf diese Logik reagiert.
Ich hätte da schon ein paar Ideen 😁
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
Ich für meinen Teil würde da eine andere Idee vorschlagen.
Was hälst du davon das du einfach eine Regel definierst
Regel_1:
tagname: Rechnung
subrules:
- searchstring: Rechnung

Regel_2:
tagname: Firma XY
condition: all
subrules:
- searchstring: Rechnung
- searchstring: Firma XY

Somit würdest du erkennen. Überall wo im Tag "nur" Rechnung vorkommt wurde die Firma nicht erkannt (ergo unbekannt)
Und wenn die Firma XY erkannt würde, wäre sowohl Tag Rechnung und Firma XY im Tag.

Vielleicht reicht dir das schon an Erkennungsmerkmal.

Viel Spaß weiterhin.

Aber das zusammenbauen der richtigen Regeln die am Besten für jeden passen ist letztlich der größte Knackpunkt an dem tollen Tool. Aber es ist dann so schön wenn man wieder etwas verbessern konnte. :)
 

BlackAlpha

Benutzer
Mitglied seit
10. Jan 2018
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Hi @geimist,
  1. die Reihenfolge der gefundenen Tags kann man über die alphabetische Reihenfolge der Regelnamen steuern (WiKi)
Das mit den Regelnamen hatte ich versucht, hat bei mir aber komischerweise nicht funktioniert. Ich werde es aber nachher auf jeden Fall nochmal testen. Nicht, dass ich da etwas übersehen habe...

ja, der Wunsch nach einer Art Priorisierung kam auch schon mehrmals. Da die Regeln halt nicht starr der Reihe nach abgearbeitet werden, funktioniert dein Vorschlag nicht sicher. Letztendlich hat sich noch kein richtiges Konzept in meinem Köppl entwickelt. Mal gucken …
Bis dahin könntest du dir evtl. mit Ausschlusskriterien weiterhelfen 🤷‍♂️
Vielleicht wirklich einfach die Regeln "von oben nach unten" abarbeiten? Ich finde, das macht es bei der Erstellung der Regeldateien auch deutlich einfacher, als wenn man die Alphabetische Reihenfolge im Hinterkopf haben muss.


Hi @Gthorsten,
Das mit den Regeln könnte man ja durch Logik steuern.
Also Beispiel :
If Rechnung and Firma xy then use this tag
If Rechnung an not Firma xy or forms xz then use this tag.
Das würde auch nur funktionieren, wenn es nur eine Firma XY gäbe. In meinem Fall war das mit der Firma jedoch nur ein Beispiel. In Wirklichkeit hätte ich bei vollem Ausbau später sicherlich 50 oder mehr Firmen in der Liste, dann würde ein "if not Firma XY" extrem lang und unübersichtlich werden. Daher mein Vorschlag mit dem optionalem Abbruch der Regelbearbeitung für das aktuelle Dokument.
 

BlackAlpha

Benutzer
Mitglied seit
10. Jan 2018
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Ich für meinen Teil würde da eine andere Idee vorschlagen.
Was hälst du davon das du einfach eine Regel definierst
Regel_1:
tagname: Rechnung
subrules:
- searchstring: Rechnung

Regel_2:
tagname: Firma XY
condition: all
subrules:
- searchstring: Rechnung
- searchstring: Firma XY

Somit würdest du erkennen. Überall wo im Tag "nur" Rechnung vorkommt wurde die Firma nicht erkannt (ergo unbekannt)
Und wenn die Firma XY erkannt würde, wäre sowohl Tag Rechnung und Firma XY im Tag.
Hi @gunfran ,

das würde leider auch nur bedingt funktionieren, da dies den Namen "RechnungFirma XY.....pdf" generieren würde. Leider kann man kein Trennzeichen zwischen den einzelnen Tags angeben. Auch das wäre doch vielleicht noch ein Verbesserungsvorschlag - oder nicht @geimist ? ;)
Wobei man den tagname ja um ein " - " ergänzen könnte und somit die Darstellung "Rechnung - Firma XY.....pdf" bekäme. :unsure: Muss ich später mal durchtesten. :)
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
Hi @BlackAlpha
Ich habe vor jedem Tag ein Zeichen (# bei mir). Damit kann ich die Tags ganz gut auseinander halten.
Ich guck gleich nochmal, wo da die Einstellung ist.
 

BlackAlpha

Benutzer
Mitglied seit
10. Jan 2018
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Die Einstellung kenne ich, bringt mich bei der Benennung der Dokumente nach meinem seit Jahren genutzten Schema leider nicht weiter. Bei mir lauten die Dateien z.B. Rechnung - Mustermann - 2022-03-21 - Dienstleistung XY.pdf.

Ist quasi mein privates DMS im normalen Dateisystem des NAS. Natürlich müsste ich im Fall einer Rechnung den Grund (Dienstleistung, Artikel oder was auch immer) von Hand nachpflegen, aber wenn der vordere Teil bereits fertig ist, wäre das eine enorme Erleichterung.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234

BlackAlpha

Benutzer
Mitglied seit
10. Jan 2018
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Bin jetzt gerade unterwegs. Ich melde mich später nochmal und Versuche es dann besser zu erklären. ;)
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
@geimist , das ist ja leider ein Prefix, aber kein Trennzeichen.
Dieser "Prefix" ist allerdings vor jedem gefundenem Tag. Demzufolge trennt es die jeweiligen Tags voneinander. Da könnte man das im Grunde auch als Trennzeichen benennen. Theoretisch könntest du da vermutlich auch "-" als Trennzeichen einsetzen.
 

BlackAlpha

Benutzer
Mitglied seit
10. Jan 2018
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Könnte ich, das stände dann jedoch auch vor dem ersten Tag also - Rechnung - Mustermann.....pdf.
 

gunfran

Benutzer
Mitglied seit
25. Nov 2014
Beiträge
31
Punkte für Reaktionen
17
Punkte
58
Stimmt. Das sieht natürlich auch blöd aus. Es bleibt spannend.
 
Zuletzt bearbeitet von einem Moderator:

Reco86

Benutzer
Mitglied seit
30. Apr 2022
Beiträge
12
Punkte für Reaktionen
1
Punkte
3
Hallo liebe Gemeinde, leider kann ich Synocr nicht downloaden. gibt es eine Schritt für schritt anleitung?
 

EuroPC

Benutzer
Mitglied seit
05. Jan 2020
Beiträge
135
Punkte für Reaktionen
16
Punkte
18
Hallo @geimist,

ich habe gerade ebenfalls versucht SynOCR herunterzuladen und erhalte die Meldung "SynOCR_DSM7_v1.2.0.spk Dateien haben ein ungültiges Format".

Diesen Link habe ich genutzt: https://geimist.eu/synOCR/synOCR_DSM7_latest.html

Sorry, bin aber relativ neu in Sachen NAS unterwegs.

Gruß, EuroPC
 
Zuletzt bearbeitet:

Reco86

Benutzer
Mitglied seit
30. Apr 2022
Beiträge
12
Punkte für Reaktionen
1
Punkte
3
Hallo Stephan, ich bräuchte da wahrscheinlich noch ein wenig mehr Erklärungen zu. Ich weiss nicht was ich mit den Datein, die ich da für DSM7 runterladen kann, anfangen soll. Muss ich die irgendwie in meine synology NAS schieben? So auf dem Rechner kann ich die mit keinem Programm öffnen..sorry für die wahrscheinlich extremen Anfängerfragen
 
  • Like
Reaktionen: EuroPC

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
@EuroPC & @Reco86

Paketzentrum ➜ Button "manuelle Installation"

Bildschirmfoto 2022-04-30 um 16.32.49.png

PS:
Synology Paket "Docker" muss installiert sein.

PPS:
Schaut auch ruhig mal ins Wiki für die nächsten Schritte
 
  • Like
Reaktionen: EuroPC


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat