synOCR synOCR - GUI für OCRmyPDF

Tillerbach

Benutzer
Mitglied seit
05. Jul 2020
Beiträge
11
Punkte für Reaktionen
0
Punkte
7
synOCR läuft unter root - das sollte nicht das Problem sein.
Siehst du die Zieldateien evtl. in der Filestation, aber nicht auf dem Client (Netzwerkfreigabe / Drive-Sync ect.)?

Hallo zur späten Stunde,

genau das war der richtige Hinweis. Die Dateien wurden augenscheinlich ohne Berechtigungen angelegt:
Anmerkung 2020-07-19 010815.png

Aus diesen Grund werden sie für meinen User nicht sichtbar sein.

Viele Grüße
Peter
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Interessant. Ich kopiere die Attribute von der Quelldatei auf die Zieldatei.
Warum funktioniert das hier nicht (daran habe ich in diesem Release nichts geändert)? Hat dein regulärer Zielordner evtl. Linuxstandardberechtigungen und ein absoluter Zielpfad für eine Tagregel ACL-Berechtigungen?
 

Tillerbach

Benutzer
Mitglied seit
05. Jul 2020
Beiträge
11
Punkte für Reaktionen
0
Punkte
7
Nach deiner letzten Unterstützung habe ich die Beta installiert, da funktionierte die Sortierung noch wie erwartet.
Der Scanner legt die Dateien in dem entsprechenden Ordner mit den Berechtigungen "-rwxrwxrwx+" ab. Der reguläre Zielordner gehört dem Benutzer "Peter.xxxx" und ist ebenfalls voll erreichbar - "drwxrwxrwx+".
Ich habe mir die neue "synOCR_YAMLRULEFILE" konfiguriert. Dort ist keine Änderung der Berechtigungen hinterlegt. Ansonsten wüsste ich jetzt nicht wo ich etwas, aus versehen, konfiguriert haben könnte.

Nachtrag:
Auch die Zielordner sind im relativen Pfad voll erreichbar (drwxrwxrwx+). Die einzelnen Tag-Ordner gehören entweder dem User oder root ... je nach dem wann bzw. wie sie angelegt wurden.
ACL habe ich nicht konfiguriert, die Ordner bzw. Unterordner befinden sich alle auf der gleichen Freigabe.

Viele Grüße
Peter
 
Zuletzt bearbeitet:

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Also bei mir hier passieren irgendwie auch komische Dinge mit deryaml-engine.
Aus irgendeinem Grund sind plötzlich alle Rules satisfied, obwohl es über die Logs keinen Sinn ergibt.
Beispiel - Folgendes steht im Log, man beachte den searchstring "Kundeninformation"
Search by tag rule: "Riester_ARAG_Kundeninformation" ?
? condition: all
? tag: Kundeninformation
? destination: /volume1/Digitales Büro/Versicherung/Rente/Riester/Altverträge/ARAG
[Subrule]:
>>> search for: blablubb->Das gehört hier nicht ins Forum ;)
isRegEx: false
searchtyp: contains
source: content
casesensitive: false
? Subrule matched
>>> search for: Kundeninformation
isRegEx: false
searchtyp: is
source: content
casesensitive: false
? Subrule matched
>>> Rule is satisfied

Anbei das searchfile, also das was ocrmypdf aus dem Dokument rauszieht. "Kundeninformation" kommt darin nicht vor (Meine persönlichen Daten habe ich natürlich entfernt).

Für dasselbe File wird auch der folgende Ruleblock als "satisfied" angesehen - "Jahresinformation" steht aber als "exact string" nicht im Text und "Wertentwicklung" ist auch wieder nicht zu finden.
Search by tag rule: "Riester_ARAG_Wertentwicklung" ?
? condition: all
? tag: Wertentwicklung
? destination: /volume1/Digitales Büro/Versicherung/Rente/Riester/Altverträge/ARAG
[Subrule]:
>>> search for: blablubb->Das gehört hier nicht ins Forum ;)
isRegEx: false
searchtyp: contains
source: content
casesensitive: false
? Subrule matched
>>> search for: Jahresinformation
isRegEx: false
searchtyp: is
source: content
casesensitive: false
? Subrule matched
>>> search for: Wertentwicklung
isRegEx: false
searchtyp: is
source: content
casesensitive: false
? Subrule matched
>>> Rule is satisfied
 

Anhänge

  • synOCR_searchfile_BRW008092D5797F_003766.txt
    3,3 KB · Aufrufe: 24

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Hier würde mir das Log-File weiterhelfen.
Evtl. hast du einen Inputordner für verschiedene Profile?

Ne, ich habe derzeit nur ein Profil. Konnte mir mit dem Sample aus deinem git-repo aber behelfen. Hab jetzt nur das Problem, dass die Enginge irgenwie verrückt spielt. Siehe oben.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Ne, ich habe derzeit nur ein Profil. Konnte mir mit dem Sample aus deinem git-repo aber behelfen. Hab jetzt nur das Problem, dass die Enginge irgenwie verrückt spielt. Siehe oben.
Ich würde aber gern verstehen, warum deine bestehenden Regeln nicht konvertiert wurden …
Daher die Nachfrage zum Log.

Die false positives in Verbindung von condition: all sind bekannt. Da wird die Erkennung für jede Subrule nicht (wie nötig) zurückgesetzt. Das wird im nächsten Release behoben.
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Ich würde aber gern verstehen, warum deine bestehenden Regeln nicht konvertiert wurden …
Daher die Nachfrage zum Log.
Ja, die Antwort hab ich erwartet :D
Ich werde das ganze heute Abend nochmal mit Log-Level 2 nachstellen und die Logs bereitstellen.

Die false positives in Verbindung von condition: all sind bekannt. Da wird die Erkennung für jede Subrule nicht (wie nötig) zurückgesetzt. Das wird im nächsten Release behoben.
Oh, sorry. Das hatte ich nicht erkannt. Hab zwar die Beiträge auf Seiten 43/44 dazu gelesen, aber scheinbar nicht gut genug. Danke.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Auf meinem Server findest du einen aktuellen Build, wo die Suchregeln funktionieren sollten.
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Bzgl. dem Log-File kann ich leider nichts liefern. Ich hab das Logging auf 2 aber beim Klick auf den Button zum erstellen der yaml-Datei wird keine Log-Datei erstellt. Zumindest nicht im eingestellten Log-Verzeichnis.

Mit der neuen Version scheinen die Suchregeln jetzt korrekt zu funktionieren. Meine beiden Test-Dokumente werden damit korrekt getaggt.

Eine Feature-Request habe ich aber für dein Backlog, sofern du das auch so siehst:
Es wäre hilfreich (zumindest für mich) wenn man im yaml Tags ohne Zuordnung zu einem Targetfolder konfigurieren könnte.
Damit könnte ich für allgemeine Keywords ein Tag herstellen, dass dann automatisch in den Filename übernommen wird.

Bisher müsste ich das so machen:
YAML:
Alles_von_Shop1:
    tagname: Shop1
    targetfolder: /volume1/Digitales Büro/Shop1
    condition: all
    subrules:
    - searchstring: Kundennummer: 1234
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
Rechnungen_Shop1:
    tagname: Rechnung
    targetfolder: /volume1/Digitales Büro/Shop1
    condition: all
    subrules:
    - searchstring: Kundennummer: 1234
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
    - searchstring: Rechnung
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
Alles_von_Shop2:
    tagname: Shop2
    targetfolder: /volume1/Digitales Büro/Shop2
    condition: all
    subrules:
    - searchstring: Kundennummer: abcd567
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
Rechnungen_Shop2:
    tagname: Rechnung
    targetfolder: /volume1/Digitales Büro/Shop2
    condition: all
    subrules:
    - searchstring: Kundennummer: abcd567
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
    - searchstring: Rechnung
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false

Also erstmal eine Regel um alles mit "Kundennummer 1234" in den Ordner "Shop 1" zu verschieben und dann eine zweite, dass alles mit "Rechnung" im Content auch noch das Tag Rechnung bekommt. Bei der zweiten Regel ist mir die Kundennummer und der Targetfolder aber eigentlich egal. Ich muss es aber zwingend mit angeben, da das pdf ansonsten per hardlink irgendwo anders landet, wo ich es eigentlich auch gar nicht brauche.
Hier wäre es hilfreich, einfach nur die Tag-Funktion, ohne den "Folder-Zwang" nutzen zu können.
Also beispielsweise so:
YAML:
Alles_von_Shop1:
    tagname: Shop1
    targetfolder: /volume1/Digitales Büro/Shop1
    condition: all
    subrules:
    - searchstring: Kundennummer: 1234
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
Alles_von_Shop2:
    tagname: Shop2
    targetfolder: /volume1/Digitales Büro/Shop2
    condition: all
    subrules:
    - searchstring: Kundennummer: abcd567
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
AlleRechnungenTaggen:
    tagname: Rechnung
    targetfolder:
    savefile: false
    condition: any
    subrules:
    - searchstring: Rechnung
      searchtyp: is
      isRegEx: false
      source: content
      casesensitive: false
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Bzgl. dem Log-File kann ich leider nichts liefern. Ich hab das Logging auf 2 aber beim Klick auf den Button zum erstellen der yaml-Datei wird keine Log-Datei erstellt. Zumindest nicht im eingestellten Log-Verzeichnis.
Mein Fehler - stimmt. GUI-Aktionen werden nicht geloggt. Mal gucken, ob ich das ändere.
Ich hätte noch ein paar Fragen zum Auslösen des Buttons:
  1. wird ein Backup der alten Regeln in den Inputordner geschrieben?
  2. wird der Pfad des YAML-Files in das Tagfeld der GUI gespeichert?
  3. wird das YAML-File im Inputordner erstellt?
  4. und was steht drin?
Es wäre hilfreich (zumindest für mich) wenn man im yaml Tags ohne Zuordnung zu einem Targetfolder konfigurieren könnte.
Ich verstehe nicht ganz. Das sollte doch möglich sein …
Wenn du Targetfolder leer lässt, wird einfach nur der Tag gesetzt.
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
  1. wird ein Backup der alten Regeln in den Inputordner geschrieben? -> Ja
  2. wird der Pfad des YAML-Files in das Tagfeld der GUI gespeichert? -> Ja
  3. wird das YAML-File im Inputordner erstellt? -> Ja
  4. und was steht drin? -> der komplette Erklärungsblock. Das hier sind die letzten drei Zeilen davon:
YAML:
    #   • finaly, you can check and validate your config file on:                                                 #
    #       https://codebeautify.org/yaml-validator                                                               #
    #                                                                                                             #
    ###############################################################################################################

Wenn du Targetfolder leer lässt, wird einfach nur der Tag gesetzt.

Oh, ok. Das teste ich nachher gleich mal.
Ich habe mich an der Erklärung "if not defined, the GUI defined destination is used" orientiert und in der GUI ist ja dann zwingend "Move to category folder" ausgewählt. Das sollte man ggf. auch noch ins yaml-File schreiben, dass die Category-Option in der GUI nicht verändert werden darf, da sonst die Targetfolder-Info aus dem Rule-Definition nicht mehr verwendet wird. Darüber bin ich auch recht lange gestolpert.
 

Pengo

Benutzer
Mitglied seit
20. Jul 2020
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

wenn ich das Programm installiere und starte bekomme ich folgendes Bild. Früher habe ich die alte Version des Programms benutzt und es hat ohne Probleme funktioniert. Könnt ihr mir bitte helfen, möchte es nicht mehr in meinem Papierlosen Büro missen.

Bildschirmfoto vom 2020-07-20 19-27-33.png
 

Fusion

Benutzer
Sehr erfahren
Mitglied seit
06. Apr 2013
Beiträge
14.159
Punkte für Reaktionen
912
Punkte
424
Browser-Cache? Neues Browser-Profil, anderer Browser?
Force reload "Strg + F5"?
 

Pengo

Benutzer
Mitglied seit
20. Jul 2020
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Habe auf einem Linux Rechner mit Firefox und Chromium probiert. Auf einem MacBook mit Firefox getestet, habe jedes mal das gleiche Bild. Kann es sein das das auf der Synology ein Installationsordner ist der nicht richtieg gelöscht ist? Habe meine Syno heute neu aufgesetzt und einige Pakete wiederhergestellt.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Da werden die Sprachvariablen nicht geladen … :unsure:
Welche Sprache ist bei dir eingestellt (Browser, DSM)?
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Paket mal stoppen und neustarten und das Paket wieder ausführen? Oder ggf. deinstallieren (natürlich solltest du ja Backups von den Konfigs in deinem Konfig-Ordner, den du ja beim Einrichten angelegt bzw. ausgewählt hast, innehaben) und wiederherstellen?
 

Pengo

Benutzer
Mitglied seit
20. Jul 2020
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Die Browser sind auf deutsch eingestellt. DSM habe ich jetzt auch auf deutsch eingestellt, stand auf gefault. Leider das selbe Problem noch.
Hatte schon deinstalliert und neu installiert, keine Besserung. Wo liegen die ganzen Einstellungen zu dem Paket auf der Syno?

Kann ich bitte die alte Version bekommen, möchte damit mal testen.
 

Pengo

Benutzer
Mitglied seit
20. Jul 2020
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Ich habe nochmal die DSM neu gemacht und synOCR V1 installiert und es funktioniert ohne Probleme.
Ich vermute das beim Umzug und Wiederherstellung der Ordner die alten Einstellungen verwendet werden. Wo auf der Festplatte liegen diese?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Oh, das ist schön.
Das Paket liegt hier: /volume1/@appstore/synOCR/ (kann auch ein anderes volume sein - je nach Konfiguration).
Die Einstellungen sind in der DB: /volume1/@appstore/synOCR/ect/synOCR.sqlite

Bei einem Update wird der Ordner /etc gesichert, dann die Programmdateien ausgetauscht und anschließend der Ordner /etc zurückgeschrieben.
Das Verhalten bei dir kann eigentlich nicht von den Einstellungen herrühren.

Hauptsache es geht (y)
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat