synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Auch auf einem anderen NAS, wo synOCR läuft, habe ich keine verwaisten Volumes (genau genommen gar keine).
Wenn es an OCRmyPDF liegt, dann sollte ja eine gewissen Analogie zu finden sein, oder?
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
jo, eigentlich schon. Bedenke aber, ich hatte 1.12 drauf. Ich beobachte das jetzt auch mal näher die nächsten Wochen...
...oder evtl. weil ich Dein Tool manuell und in der letzten Zeit nur alle paar Wochen anwerfe?!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Die synOCR-Version sollte irrelevant sein, weil ich ja an den OCRmyPDF Images nichts ändere.
Bitte berichte, wenn du neue Erkenntnisse hast.
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
..da hätte ich schon was..... ich hatte volumes welche die Partion füllten. Gelöscht... gut wars......
um images habe ich mich nicht gekümmert. Dann schau mal im Screenshot, warum habe ich ein altes Image vom 8.2 HEUTE?
Dein Tool lief gestern und heute mehrmals
 

Anhänge

  • Bildschirmfoto 2022-02-19 um 10.35.54.png
    Bildschirmfoto 2022-02-19 um 10.35.54.png
    40,7 KB · Aufrufe: 11

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Na weil das letzte Image halt vom 8.2. ist :) Es gibt doch nicht jeden Tag ein neues. Und wenn synOCR etwas abzuarbeiten hat und das ausgewählte Image nicht da ist, holt es halt die letzte Version.

Aber was hat das mit den Volumes zu tun :unsure:

Bildschirmfoto 2022-02-19 um 10.52.28.png
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
Habe die Entwicklung länger nicht verfolgt und auch an meiner YAML Datei länger nichts geändert.
Ich habe das "Problem" das PDFs in mehreren Zielordnern gleichzeitig abgelegt werden. Es entstehen also Duplikate.
Kann ich das verhindern, oder ist das "by design" wenn mehrere Regeln gleichzeitig zutreffen?
 

JackOh

Benutzer
Mitglied seit
27. Mai 2015
Beiträge
188
Punkte für Reaktionen
3
Punkte
24
Ich möchte gerne mit iOS 15-Geräten mit den integrierten Scan Apps (Notizen, Dateien o. ä. App) Dokumente scannen und als PDF in einem freigegebenen Ordner auf der DS speichern. Im Anschluss soll die Datei im Scan-Ordner per OCR angereichert werden. Anscheinend ist es die synOCR Lösung in diesem Thread.

Meine Fragen:
  • kann man synOCR auf einer DS718+ mit INTEL Celeron J3455 mit DSM 7.0.1-42218 Update 2 installieren?
  • wenn ja, wo finde ich eine leicht verständliche Anleitung/Tutorial, um synOCR per Docker zu installieren?
Gruß
 

Fusion

Benutzer
Sehr erfahren
Mitglied seit
06. Apr 2013
Beiträge
14.164
Punkte für Reaktionen
915
Punkte
424
Das neueste Paket laden https://geimist.eu/synOCR/synOCR_DSM7_latest.html
Und via Paketzentrum installieren

Ob du das Docker Paket vorher selbst installieren musst, oder dies als Abhängigkeit mitinstalliert wird, bin ich gerade nicht sicher.

Danach findet sich das Programm im Menü wie alle anderen auch.
Vom "Docker Teil" bekommst du mehr oder weniger nichts mit.
 
  • Like
Reaktionen: geimist

JackOh

Benutzer
Mitglied seit
27. Mai 2015
Beiträge
188
Punkte für Reaktionen
3
Punkte
24
Super, das hat geklappt, danke! Komisch, dass sich das Paket im Paketzentrum so nicht finden lässt, obwohl die richtige Paketquelle hinterlegt war.

Just nach dem Start bekomme ich aber schon das nächste Problem, dass die Berechtigung noch nicht

Bildschirmfoto 2022-02-20 um 13.04.15.png

Im Aufgabenplaner habe ich das Script unter Aufgabeneinstellungen hinterlegt und ein paar mal manuell gestartet. Jedoch bleibt diese Meldung.

Über Docker habe ich noch gar nichts gemacht. Muss man da was machen?
 

Fusion

Benutzer
Sehr erfahren
Mitglied seit
06. Apr 2013
Beiträge
14.164
Punkte für Reaktionen
915
Punkte
424
cphub ist zur Zeit nicht aktuell. Aber zumindest eine älter 1.1.2 oder ähnlich hätte auch dort zu finden sein müssen.

Screenshot von der Aufgabe im Planer?
Da muss ein Fehler sein, wenn Paket stoppen/starten im Paketzentrum auch nichts ändert.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
… Es entstehen also Duplikate. Kann ich das verhindern, oder ist das "by design" wenn mehrere Regeln gleichzeitig zutreffen?
Sofern sich die Dateien auf dem gleichen Volume wie der Outputordner befinden, werden lediglich Hardlinks gesetzt. Natürlich gibt es mehrere Zieldateien, sofern auch mehrere Regeln erfüllt sind. Ich würde mir aber nicht anmaßen, hier per Software zu definieren, welcher Zielordner jetzt wichtiger wäre, um so auf ein 'Duplikat' verzichten zu können.

Im Aufgabenplaner habe ich das Script unter Aufgabeneinstellungen hinterlegt und ein paar mal manuell gestartet. Jedoch bleibt diese Meldung.
Wichtig: das Skript muss als User root gestartet werden.

… Aber zumindest eine älter 1.1.2 oder ähnlich hätte auch dort zu finden sein müssen.
Leider nicht auf jedem Client - auf dem Paketserver ist die Konfiguration von synOCR kaputt. Das kann nur @Matthieu oder @QTip fixen.
 

JackOh

Benutzer
Mitglied seit
27. Mai 2015
Beiträge
188
Punkte für Reaktionen
3
Punkte
24
Screenshot von der Aufgabe im Planer?
Bildschirmfoto 2022-02-20 um 14.49.55.pngBildschirmfoto 2022-02-20 um 14.49.47.png

Es hat jetzt aber funktioniert. Die Fehlermeldung in synOCR ist weg. Muss die Aufgabe im Planer öfters am Tag ausgeführt werden. Oder reicht es, wenn es einmal manuell gestartet wurde?

Müssen noch irgendwelche Dinge in docker installiert werden?

Das Paket-Zentrum hatte nur die untere Version gefunden, konnte sie aber nicht installieren, da inkompatibel.
Bildschirmfoto 2022-02-20 um 14.52.11.png
 
  • Like
Reaktionen: geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Aufgabe im Planer öfters am Tag ausgeführt werden.
Letztendlich ist es derselbe Aufruf, welcher über den blauen Button in der GUI ausgelöst wird - nur mit mehr Rechten (und Berechtigungskorrektur). Der Vorteil im Aufgabenplaner ist zusätzlich, dass du gleich einen Zeitplan zur Überprüfung auf neue Dateien im Inputordner einrichten kannst (also z.B. minütlich …). So läuft dann alles von alleine ab, und du musst dich überhaupt nicht mehr darum kümmern.

Müssen noch irgendwelche Dinge in docker installiert werden?
Nein.

Das Paket-Zentrum hatte nur die untere Version gefunden, konnte sie aber nicht installieren, da inkompatibel.
Das ist die (derzeit NICHT aktuelle) Version für DSM6
 
Zuletzt bearbeitet:
  • Like
Reaktionen: TheNightman

JackOh

Benutzer
Mitglied seit
27. Mai 2015
Beiträge
188
Punkte für Reaktionen
3
Punkte
24
Herzlichen Dank für eure Unterstützung!
 
  • Like
Reaktionen: geimist

Rotbart

Benutzer
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.709
Punkte für Reaktionen
633
Punkte
134
Hallo , hab mal eine Frage zur Yaml-datei

ist es möglich in einem Suchmuster als letzte Regel bestimme Begriffe zu suchen die nicht vorkommen dürfen ? also z.b. text enthält gelb oder blau oder grün dann ok, enthält gelb oder blau oder grün und rot dann nicht ok
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Dazu musst du mehrere Regeln heranziehen:

YAML:
rule_01:
    tagname: ok
    condition: all
    subrules:
    - searchstring: gelb
      searchtyp: contains
    - searchstring: blau
      searchtyp: does not contain
    - searchstring: grün
      searchtyp: does not contain
    - searchstring: rot
      searchtyp: does not contain
rule_02:
    tagname: ok
    condition: all
    subrules:
    - searchstring: blau
      searchtyp: contains
    - searchstring: grün
      searchtyp: does not contain
    - searchstring: gelb
      searchtyp: does not contain
    - searchstring: rot
      searchtyp: does not contain
rule_03:
    tagname: ok
    condition: all
    subrules:
    - searchstring: grün
      searchtyp: contains
    - searchstring: gelb
      searchtyp: does not contain
    - searchstring: blau
      searchtyp: does not contain
    - searchstring: rot
      searchtyp: does not contain
 
  • Like
Reaktionen: peterhoffmann

Rotbart

Benutzer
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.709
Punkte für Reaktionen
633
Punkte
134
ok, aber ich dachte mehr an eine Verschachtelung so was z.b.
rule_01:
***tagname: ok
***condition: all
***subrules:
***- searchstring: rot
*****searchtype: does not contain
**********condition: any
**********subrules:
**********- searchstring: blau
*********** searchtyp: contains
***********- searchstring: grün
************searchtyp: contains
**********- searchstring: gelb
********** searchtyp: contains

OT: wie kann ich hier Code einfügen ?
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.563
Punkte für Reaktionen
1.389
Punkte
234
Das geht aber nicht. condition z.B. wird nur einmal je Regel ausgewertet.

PS: bitte Code auch als solchen posten - sonst braucht man 3x solange zum lesen.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat