synOCR synOCR - GUI für OCRmyPDF

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Das Paket von der Seite von @geimist herunterladen (siehe Signatur) und dann im Paketzentrum oben rechts „Manuelle Installation“ auswählen. Automatische Updates aus DSM heraus funktionieren leider nicht.
 
  • Like
Reaktionen: adallmo und reiki

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Es ist mal wieder Zeit für ein aktualisiertes Beta-Release.

Folgende aufzählungswürdigen Änderungen sind eingeflossen:

1.3.99.10 [2023-05-16]
BUGFIXES:
- [SHELL] wenn der Pfad zur Protokolldatei eine Raute enthielt, schlug die Datumssuche über Python fehl
- [SHELL] Umbenennungsparameter, die als Tag-Namensbestandteile in YAML-Regeln verwendet werden, wurden nicht als Metadaten geschrieben
VERBESSERUNGEN:
- [GUI] Kompatibilität angepasst für DSM7.2 (thx @Tommes)
- [SHELL] Splitting: Wechsel von pypdf zu pikepdf, da pypdf das PDF/A-Attribut zerstört (thx @Gthorsten)
- [SHELL] Metadaten schreiben: Wechsel von pypdf zu pikepdf, da pypdf das PDF/A-Attribut zerstört (thx @Gthorsten)
- [SHELL] Metadaten zusätzlich als XMP-Daten schreiben (thx @Gthorsten)
- [SHELL] Die Python-Umgebung bleibt nun während einer Paketaktualisierung erhalten (>= DSM7)
- [GUI] Bootstrap-Framework auf 5.2.3 aktualisiert (thx @Tommes)
- [GUI] Bootstrap JavaScript auf 5.2.3 aktualisiert (thx @Tommes)
- [GUI] jQuery auf 3.6.4 aktualisiert (thx @Tommes)
- [SHELL] Verbesserung der DSM-Benachrichtigung
- [SHELL] fast der gesamte Bashcode wurde mit shellcheck geprüft und ggf. angepasst.
NEUE FUNKTIONEN:
- 🔥 Einbindung der APPRISE-Bibliothek zur Unterstützung vieler Benachrichtigungsdienste (die native PushBullet-Unterstützung wurde entfernt)
apprise_call: (apprise service) apprise_attachment: (true/false) notify_lang: (DSM lang code) kann in YAML regelgenau definiert und überschrieben werden
- mit dem Wert postscript: in YAML können Postscript-Kommandos definiert werden (Kommando oder Pfad zum Skript)


  • Das Pythonmodul loggt noch sehr ausgiebig. @Gthorsten wird das bei Gelegenheit noch korrigieren.
  • Gerade die Shellcheck Prüfung und Anpassung hat viel Codeänderungen zur Folge gehabt. Bitte testet daher, ob alles wie gewünscht funktioniert.
  • Download der Beta: DSM6 | DSM7
 
Zuletzt bearbeitet:

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
NEUE FUNKTIONEN:
- 🔥 Einbindung der APPRISE-Bibliothek zur Unterstützung vieler Benachrichtigungsdienste (die native PushBullet-Unterstützung wurde entfernt)
apprise_call: (apprise service) apprise_attachment: (true/false) notify_lang: (DSM lang code) kann in YAML regelgenau definiert und überschrieben
Ah, du hast gar nicht erwähnt dass apprise auch in der YAML Datei, je Regel, definiert werden kann. Hätte es auch gleich mittesten können :giggle:
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
:love:
 

jhess

Benutzer
Mitglied seit
14. Apr 2016
Beiträge
41
Punkte für Reaktionen
5
Punkte
8
Hi!

Seit ich das letzte Update installiert habe, werden die §tags nicht mehr im Dateinamen ausgegeben.
Das Datum wird aber gefunden...

Jetzt bin ich ein wenig ratlos... ich finde auch kein docker image mehr - wird das nicht mitinstalliert?
Herzliche Grüße,
jh
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Wenn du mit letzten Update ein Update von DSM auf Version 7.2 meinst, dann wurde die App Docker durch den Container Manager ersetzt.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Ich brauche da genauere Infos. Gern auch ein Log, welches du mir über den Link in meiner Signatur hochladen kannst.
 

jhess

Benutzer
Mitglied seit
14. Apr 2016
Beiträge
41
Punkte für Reaktionen
5
Punkte
8
Danke. Meine Software ist

inotify-tools 3.22,
SynOCR (letzte Beta) von Deinem Server (DSM 7)

DSM 7.1.1 Update 5

Die Monitor-Aufgabe ist nach Deiner Anleitung eingerichtet (z.Zt. ist das Intervall 5min)


Ich erhalte grüne Check-Marks auf der Übersicht von synOCR und an den Ordner-Pfaden des Profils. Verwende ich die Schaltfläche Monitoring auf der Übersichtsseite, bekomme ich aber nicht den roten Button "Monitoring beenden" - vermutlich läuft das Monitoring nicht korrekt.

Die eingerichtete Aufgabe wirrd aber alle 5min korrekt durchgeführt.

Tags werden aber ignoriert - ich habe versucht, nur die Parameter "§tit-§tag" zu setzen - Titel taucht auf, Tags nicht.


Eine Protokolldatei sende ich gleich.

Beste Grüße, jh
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Verwende ich die Schaltfläche Monitoring auf der Übersichtsseite, bekomme ich aber nicht den roten Button "Monitoring beenden" - vermutlich läuft das Monitoring nicht korrekt.
Meistens ist das dann der Fall, wenn du noch ein unvollständiges Profil aktiv hast, insbesondere, wenn dessen Quellordner nicht passt. Den findet inotifywait nicht und quittiert so die gesamte Aufgabe.

Tags werden aber ignoriert - ich habe versucht, nur die Parameter "§tit-§tag" zu setzen - Titel taucht auf, Tags nicht.
Wenn ich das richtig sehe, dann verwendest du die Tags in der GUI.

In dem Fall habe ich einen kleinen Fehler gefunden.
Bitte teste mal diese Version: synOCR_DSM7_local_BETA.spk
 

jhess

Benutzer
Mitglied seit
14. Apr 2016
Beiträge
41
Punkte für Reaktionen
5
Punkte
8
Die neue Version funktioniert jetzt mit den Tags.

Allerdings funktionieren Tags wie "Postbank=Bank" nicht. In diesem Fall wird auch auf der Übersichtsseite kein grüner Checkmark mehr angezeigt.

Die Buttons für Monitoring starten bzw. anhalten sind nun vollständig von der Übersichtsseite verschwunden.
Ist das gewollt?

Das unvollständige Profil "default" habe ich gelöscht, aber wie gesagt, der "Monitoring starten" Button bleibt verschwunden.

Vielen Dank für Deine Hilfe!
jh
 
  • Like
Reaktionen: Struppix

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Allerdings funktionieren Tags wie "Postbank=Bank" nicht.
OK, wir tasten uns ran. Ich guck mir das nochmal an.
Hab aber bitte etwas Geduld. Ich weiß nicht, wann ich es schaffe …

In diesem Fall wird auch auf der Übersichtsseite kein grüner Checkmark mehr angezeigt.
Du meinst, dort, wo ggf. die blaue Sanduhr oder der grüne Haken zu sehen sind?
Da dürfte kein Zusammenhang bestehen. An dieser Stelle hab ich für dein Build nichts geändert.

Die Buttons für Monitoring starten bzw. anhalten sind nun vollständig von der Übersichtsseite verschwunden.
Was steht an dessen Stelle? "manuellen Programmlauf starten"? In dem Fall wurden die Inotify-Tools nicht gefunden.
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Leute,

hier die neuste Version des Editors.
Code:
Änderungen in Vers. 01.02.00
- gefixt, Spalte multilineregex und tagname_RegEx getauscht, somit wieder gleich zu default YAML
- gefixt, Fehler beim Exportieren einer leeren Tabelle abgefangen
- gefixt, Progress Anzeige für Import in Zeile aktiviert
- gefixt, Fehler beim Kopieren außerhalb des gültigen Bereiches korrigiert
- gefixt, mehrere mögliche Laufzeit- und Objektfehler behoben
- gefixt, Fehler im Layout beim Einfügen von rules / subrules und copy behoben
- gefixt, diverse kleinere Fehler behoben
- NEU, Umstellung der Auswahl Menu auf UserForm, sodass nun Selektion und Scrollen ermöglicht wird
- NEU, "Move" Funktion als Ergänzung zum Kopieren. Damit können beliebige Bereiche innerhalb der Tabelle verschoben werden.
- NEU, die zusätzlichen Parameter der neuesten synOCR Beta Version (postscript, apprise_call, apprise_attachment, notify_lang) wurden aufgenommen
- NEU, Schalter / Menu zum Ausblenden von Spalten, um mit den zusätzlichen Parameter die Übersichtlichkeit zu verbessern
- NEU, Auswahlmenu für Verschieben, Kopieren, Ausblenden abhängig von der gewählten Bildschirmauflösung

Bitte gebt mal ein Info bei Fehlern oder Problemen. Gerne auch per PN.

Ich suche noch etwas Unterstützung für die Implementierung und das Testen des Editors auf Exel MAC.
Derzeit läuft er bedingt durch die verwendeten VBA Funktionen nicht auf dem MAC. Da ich selbst keinen MAC habe, kann ich das ganze nicht Testen und somit nicht zum Laufen bringen. Vielleicht meldet sich mal jemand bei Interesse.
 

Anhänge

  • synOCR_YAML_Editor_Version_01_02_00_2023_05_27.zip
    489,7 KB · Aufrufe: 9

andreasing

Benutzer
Mitglied seit
29. Mai 2023
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich habe vor ein paar Wochen synOCR installiert und bin begeistert von den Möglichkeiten.
Es gibt gerade nur ein Feature, welches mir ein wenig fehlt.

Bei Fujitsu SnapScan wird automatisch der Betreff des Dokuments erkannt und das Output-Dokument kann dann mit diesem Inhalt benannt werden. z.B. Auf dem Dokument steht "Antwort auf Ihre Schreiben vom xx.xx.xxxx". Das macht die Identifikation der PDFs noch einfacher.

Ich habe herausgefunden, dass tesseract die Position des detektierten Textes mit ausgibt/ausgeben kann.
Könnte man damit nicht eine Logik zum Füllen einer Variable wie "§subject" definieren, die dann beim Renaming verwendet werden kann?
z.B. --find-subject x y width height, also eine Funktion, die allen Text, der im angegebenen Rechteck beginnt als $subject speichert

Oder geht das schon so ähnlich und ich habe es in der Doku nicht gefunden?

Viele Grüße
Andi
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Leute,

bei der Editor Version 1.02.00 ist mir ein Fehler unterlaufen. Hier ist die Variable searchtyp fehlerhaft.

Bitte einfach in der Version 1.02.00 exportieren und in die Version 1.03.00 importieren. Fertig.

Weiter habe ich gleich ein paar kleinere Änderungen eingebaut.

Code:
Änderungen in Vers. 01.03.00
- gefixt, Fehler in Variable searchtyp in Version 1.02.00 => Zur Fehlerbehebung bitte bei Version 01.02.00 exportieren und hier importieren
- gefixt, Fehler bei den Funktionen copy und move. Hier war das Feld Kommentar nach dem Anwenden nicht mehr ausfüllbar
- NEU, Abfrage ob ein Filter gesetzt wurde, da es bei den Funktionen sonst zum fehlerhaften Ausführen kam
            Filter werden nun entfernt und Funktion in der selektierten Zeile ausgeführt, abschließend wird die selektierte / geänderte Zeile herangezoomt
 

Anhänge

  • synOCR_YAML_Editor_Version_01_03_00_2023_05_30.zip
    485,1 KB · Aufrufe: 8

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Und hier noch die Variante für den sauberen Import aus der Version 1.02.00 (Nur hierfür einmalig erforderlich), Funktionsumfang identisch zu 1.03.00, jedoch dauert der Import minimal länger.

Karsten
 

Anhänge

  • synOCR_YAML_Editor_Version_01_03_00_2023_05_30_searchtyp_import_fix.zip
    494,6 KB · Aufrufe: 2

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
@geimist Hallo Stephan, mein synOCR schiebt die temp-pdf nicht mehr in das eingestellte Verzeichnis, also beispielsweise
/volume1/monacum/2023/2023-06-01_Vodafone_Rechnung.pdf
Wenn der Ordner 2023 bereits vorher besteht, dann klappt es… Der Benutzer synOCR hat die erforderlichen Rechte für /monacum und alle Unterordner, der Task wurde als root ausgeführt. Wonach kann ich noch schauen? Besten Dank!
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
1.3.3, habe die heute aber installiert, weil es bei 1.3.99 auch nicht mehr funktioniert hat.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat