synOCR synOCR - GUI für OCRmyPDF

TJ.

Benutzer
Mitglied seit
29. Apr 2021
Beiträge
40
Punkte für Reaktionen
3
Punkte
14
Nee, das funktioniert noch weniger. Warum auch immer. Habe jetzt schon viele Variationen ausprobiert. Die Dokumente ohne ":" werden einfach nicht verarbeitet. Ich werde mir jetzt nochmal deine Videos angucken und das Wiki studieren. Vielleicht finde ich ja noch einen Hinweis.

Dank dir, habe ich ja schonmal eine Übergangslösung mit den zwei separaten Regeln, die ja funktionieren.
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Also das muss funktionieren.
Sind die beiden Regeln gleich, bis auf die RegEx?
Was gibt denn das Log aus?
Code:
(?i)\b(?!LfdNr)(\d+)\b
Code:
(?i)\b(LfdNr\D*)\K(\d+)\b
Code:
(?i)\b(?!LfdNr\D*)(?:\d+)\b

Dann der nächste Versuch. Nicht gleich aufgeben... Bei mir funktionieren alle.

Karsten
 
  • Like
Reaktionen: TJ.

TJ.

Benutzer
Mitglied seit
29. Apr 2021
Beiträge
40
Punkte für Reaktionen
3
Punkte
14
Nee, aufgeben tue ich nicht. Versuche es aber auch selber zu verstehen, was wir hier machen...:ROFLMAO:

Heute schaffe ich es aber nicht mehr was zu testen. Werde mich morgen Abend erst wieder damit beschäftigen können. Dann schaue ich auch nochmal genauer ins Log.
 

TJ.

Benutzer
Mitglied seit
29. Apr 2021
Beiträge
40
Punkte für Reaktionen
3
Punkte
14
Hi @Struppix

Code:
(?i)\b(LfdNr\D*)\K(\d+)\b

So, dieser Code scheint zuverlässig zu funktionieren! Habe jetzt noch weitere ältere Dokumente verarbeitet. Das Erkennen der LfdNr funktioniert zuverlässig, solange beim ocr'n nicht noch ein zusätzlicher Buchstabe hineininterpretiert wird oder sogar mitten drin eine neue Zeile gesetzt wird. Ich hoffe, dass das bei den zukünftigen Dokumenten Ausnahmen bleiben. Solche zufälligen Fehler beim ocr'n werden sicher nicht mit RegEx kompensiert werden können. Bin aber so schon echt happy. Alles Weitere muss ich jetzt mit den zukünftigen Dokumenten beobachten. TOP (y)
 
  • Like
Reaktionen: geimist

Kaestorfer

Benutzer
Mitglied seit
14. Jun 2021
Beiträge
13
Punkte für Reaktionen
3
Punkte
3
Das heißt der Fehler: 1 Error: /rangecheck in readorigxref

liegt an meiner Version? Ist nämlich nen WORD Dokument, das ich eingescannt habe...
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Das ist ein Fehler direkt in OCRmyPDF. Ich würde dir empfehlen, mal die ältere Version jbarlow83/ocrmypdf:12.7.2 zu versuchen (in der GUI auszuwählen, ggf. vorher im ContainerManager herunterladen).
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Hallo Leute,

heute möchte ich Euch die neueste, für mich erst mal finale Version des YAML-Editors (mit dem neuen Konfigurator) zum Download zur Verfügung stellen.
Leider gab es ja zur Beta vor 2 Wochen kein Feedback. Das ist etwas schade, gerade im Bezug auf Ideen zu neuen Regeln oder Suchbegriffen (Tags) für neue / zusätzliche Templates. Denn immerhin sind die ja für Euch. Ich habe schon noch ein paar Ideen, aber ich konstruiere mir nur Beispiele zurecht. Also wäre es sehr hilfreich, wenn Ihr Euch mal ein paar Sekunden Zeit nehmen könntet, gerne auch per Privater Nachricht.

Im Download ist eine Installationsanweisung und eine Kurzanleitung beinhaltet.
Hier der Download oder in meiner Signatur

Außerdem hier die html Versionen der Erläuterungen und der Änderungen aus dem Editor.

Und hier noch ein Video mit einer Hilfestellung zu Installation und Funktionsweise.

Viel Spaß Karsten
 
Zuletzt bearbeitet:

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Hallo Leute,

von einem User wurde mir mitgeteilt, dass der Editor nicht zu funktionieren scheint.
Die Vermutung ist nun, dass sich Excel / Office in manchen Fällen den Speicherort des AddIn zu merken scheint, und / oder eine Kopie angelegt hat. Somit wird beim Starten das falsche AddIn geladen.
Einziger Weg hierzu scheint, dass neue AddIn händisch in den entsprechenden Ordner zu kopieren. Ich habe hierzu den Download aktualisiert und um ein kurze Anleitung ergänzt. Das AddIn ("synOCR_YAML_Editor.xlam") ist jetzt im Paket beinhaltet.
Bitte nutzt den Download aus meiner Signatur.

Aufgetreten ist das Problem bei Office 2021 und 365. Dort konnte ich das eben nachstellen und durch das "Hinein Kopieren" erfolgreich fixen.
Könnte das mal jemand bitte bestätigen oder sagen ob es bei Euch funktioniert. Vielen Dank

Karsten


Im Übrigen: Es war im vorherigen Post wieder einmal ein falschen Download Link (alte Editor Variante) drin. Sorry Leute, ladet Euch das Paket bitte über meine Signatur erneut herunter.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234

mards918

Benutzer
Mitglied seit
24. Apr 2023
Beiträge
2
Punkte für Reaktionen
1
Punkte
53
Guten Morgen,
nach de, manuellen Installieren von SynOCR über Synology Paketmanager (> manuelle Installation / ich bin eingeloggt als User mit Admin-Rechten in der Weboberfläche) bekomme ich nach der Installation der Version 1.4.5 nur folgende Fehlermeldung bei der Ausführung:


2023-10-14 10_42_44-Synology DS918+ – Mozilla Firefox.png

Sie haben derzeit keine Berechtigung, um dieses Paket zu öffnen.
Um die Einzelheiten Ihrer Zugangsbefugnisse zu prüfen, gehen Sie zu Systemsteuerung > Anwendungsberechtigungen.

Sprich ich kann SynOCR unter dem lokalen User mit Admin-rechten nicht starten.



- Ich bin der Anleitung aus: https://github.com/geimist/synOCR gefolgt
- Ich habe eine Synology DS918+ mit DSM 7.2-64570 Update 3
- Ich bin als User aus der Gruppe "Administrator" in der Weboberfläche angemeldet"
- Docker bzw. Container Manager ist installiert
- Benutzerdefiniertes Skript mit /usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh angelegt.

Ich kriege aber auch mit dem User (Teil der Administrator Gruppe) in der Berechtigungsansicht nur "Verweigern"
2023-10-14 11_00_19-Synology DS918+ – Mozilla Firefox.png

2023-10-14 11_02_23-Synology DS918+ – Mozilla Firefox.png

Wie löse ich das Problem?
 
Zuletzt bearbeitet:

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.736
Punkte für Reaktionen
1.642
Punkte
314
Indem du unter Anwendungsberechtigungen in der Tabelle die Zeile "synOCR" markierst (Zeile ist dann blau hinterlegt) und anschließend oben links auf dem Button "Bearbeiten" klickst. Dann setzt bzw. änderst du den Haken im Reiter Gruppe für administrators auf Zulassen.

Alternatov kannst du auch im Reiter Standard-Berechtigungen den Haken setzen.
 
  • Like
Reaktionen: geimist und Struppix

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
14.057
Punkte für Reaktionen
3.871
Punkte
488
Schalt mal im letzten Screenshot um auf "Gruppe". Wenn da über eine Gruppenmitgliedschaft etwas verboten wurde wirkt das stärker als die Erlaubnis.
 
  • Like
Reaktionen: Struppix

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Indem du unter Anwendungsberechtigungen in der Tabelle die Zeile "synOCR" markierst (Zeile ist dann blau hinterlegt) und anschließend oben links auf dem Button "Bearbeiten" klickst. Dann setzt bzw. änderst du den Haken im Reiter Gruppe für administrators auf Zulassen.

Alternatov kannst du auch im Reiter Standard-Berechtigungen den Haken setzen.
Es sollte auch ein Rechtsklick direkt auf den Eintrag funktionieren und dann "Bearbeiten"
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.736
Punkte für Reaktionen
1.642
Punkte
314
Viele Wege führen nach Rom
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Da war ich noch nie, wäre mal was... 😊
Bei mir markiert er die Zeile nicht (wird nicht hervorgehoben), auch wenn sie aktiviert ist. Warum auch immer. :unsure:
 

nlsn

Benutzer
Mitglied seit
11. Feb 2018
Beiträge
2
Punkte für Reaktionen
1
Punkte
53
Hallo,
gibt es eine Möglichkeit mit Synocr die Dokumente wie in meiner bisherigen Ablage zu benennen? Hier habe ich die Dokumente nach Korrespondent Datum Titel/Weitere Infos benannt. Also z.B.
Versicherung A 2022-02-01 Infoschreiben
Hausarzt 2023-11-04 Blutwerte
Amazon 2018-12-05 Handyhülle

Damit ist also ein Teil des Tag vor dem Datum und ein Teil danach.

Kann ich die Uhrzeit einstellen die verwendet wird beim Dateidatum korrigieren?
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
884
Punkte für Reaktionen
187
Punkte
63
Ja, abgesehen von der Variante mit vor das Datum setzen über eine regex.
Bastle ich morgen zurecht.
Da können wir auch das Datum so einstellen wie gewünscht. Schreib mal den Syntax.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat