synOCR synOCR - GUI für OCRmyPDF

mördock

Benutzer
Mitglied seit
04. Jan 2012
Beiträge
806
Punkte für Reaktionen
17
Punkte
44
Moin,

könnte mir vorstellen das man in der Oberfläche die Möglichkeit bekommt z.B. bis zu 4 Quell- und Zielverzeichnisse dauerhaft anzulegen. Auf ein Dropdownmenü, wie es arphex vorschlägt, könnte ich verzichten.
Jeder Nutzer der Filestation kann dann in sein persönliches Quellverzeichnis seine Dokumente reinschmeissen. Dann wartet er bis der Aufgabenplaner startet um die Dokumente in allen Quellverzeichnissen zu verarbeiten, anschließend geht der Nutzer in sein persönliches Zielverzeichnis und holt dort seine fertigen PDF Dateien ab.
Die LOG Dateien brauchen aber keine 4 Verzeichnisse, da reicht es wenn ein Nutzer diese einsehen kann.

#Mördock#
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Wär es nicht einfacher, wenn alle nur einen Incoming-Ordner haben, aber unterschiedliche Outcoming-Ordner? Denn es reicht ja nur ein Präfix, um den entsprechenden Ordner auszuwählen.

FirmaScan_xx.pdf -> Outcoming-Ordner 1
PrivatScan_xx.pdf -> Outcoming-Ordner 2

Und Scan-Profile (mit eigenem Präfix) gibt es fast an jedem Scanner (auch die alten) und in jeder Handy-App

Oder eben aus Tags einen Ordner generieren wäre einfacher?

Es gibt technisch ja unzählige Möglichkeiten und mir ist auch bewusst, dass gemist nicht auf jeden einzelnen Wunsch eingehen und realisieren kann - was auch gut so ist.
 

arphex

Benutzer
Mitglied seit
17. Nov 2011
Beiträge
171
Punkte für Reaktionen
0
Punkte
22
Ich sehe deine Problematik und kann es im Moment auch nicht wirklich überblicken um die meisten Szenarien abzudecken.

Für meinen Teil hätte ich gerne zwei verschiedene gemeinsame Ordner (z.B. docs_privat + docs_firma) und da jeweils die gleiche Struktur (in+out+backup).

Hmm, das macht die sache dann komplizierter.
Mal anders gedacht, bekommt man das mit Tags hin?

P.S.: was ist eigentl. der Untersch. zwischen Tags und Kategorien?
 

arphex

Benutzer
Mitglied seit
17. Nov 2011
Beiträge
171
Punkte für Reaktionen
0
Punkte
22
Wär es nicht einfacher, wenn alle nur einen Incoming-Ordner haben, aber unterschiedliche Outcoming-Ordner? Denn es reicht ja nur ein Präfix, um den entsprechenden Ordner auszuwählen.

FirmaScan_xx.pdf -> Outcoming-Ordner 1
PrivatScan_xx.pdf -> Outcoming-Ordner 2

Und Scan-Profile (mit eigenem Präfix) gibt es fast an jedem Scanner (auch die alten) und in jeder Handy-App

Oder eben aus Tags einen Ordner generieren wäre einfacher?

Es gibt technisch ja unzählige Möglichkeiten und mir ist auch bewusst, dass gemist nicht auf jeden einzelnen Wunsch eingehen und realisieren kann - was auch gut so ist.

Nein das finde ich nicht gut, denn ich mache es über den ix500 über das cloud profil, hier hat das Typ Dokumente genau einen Präfix.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.550
Punkte für Reaktionen
1.380
Punkte
234
Wenn ich diese Funktion implementiere, dann werde ich wahrscheinlich auf komplett eigene Profile setzen. Das wird wahrscheinlich die 'einfachste' Umsetzung und auch zum größten Konsens führen.
Da stellen sich mir noch ein paar technische Fragen, wo ich derzeit noch keine Antwort habe.

Jetzt liegt auch privat einiges an - wartet also bitte nicht auf eine Umsetzung dieser Funktion von heut auf morgen …
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Wenn es nicht kommt, finde ich das auch nicht schlimm.
Bei mir läuft SynOCR bisher einwandfrei und deckt im Grunde alles ab. Mit der Funktion (mehrere Profile) hätte ich nur eine bessere Trennung, wiederum kann ich auch ohne gut damit leben.

Ich möchte mich in aller Form bei dir für deine Arbeit bedanken.
 

arphex

Benutzer
Mitglied seit
17. Nov 2011
Beiträge
171
Punkte für Reaktionen
0
Punkte
22
Wenn ich diese Funktion implementiere, dann werde ich wahrscheinlich auf komplett eigene Profile setzen. Das wird wahrscheinlich die 'einfachste' Umsetzung und auch zum größten Konsens führen.
Da stellen sich mir noch ein paar technische Fragen, wo ich derzeit noch keine Antwort habe.

Jetzt liegt auch privat einiges an - wartet also bitte nicht auf eine Umsetzung dieser Funktion von heut auf morgen …

Vielen Dank im Voraus! :)
 

mördock

Benutzer
Mitglied seit
04. Jan 2012
Beiträge
806
Punkte für Reaktionen
17
Punkte
44
Bitte keinen Stress machen. Grundsätzlich ist alles super, jetzt beginnt halt nur die Phase der "Nice to have" Funktionen.


#Mördock#
 

fbartels

Benutzer
Mitglied seit
19. Mrz 2013
Beiträge
284
Punkte für Reaktionen
2
Punkte
24
Hi,

ich wollte mir gerade einmal ansehen wie die App mit Docker interagiert und habe diese daher auf meiner DS (DS918+) installiert. Leider lässt sich die App dann aber nicht starten. Wenn ich diese aus dem Startmenü aufrufe dann öffnet sich ein Fenster mit einer "Die Seite konnte nicht gefunden" Meldung und kurz darauf bekomme ich von DSM einen Dialog, dass meine Session ausgelaufen sei und ich mich erneut einloggen soll.

Wenn ich das mache. Dsm merkt sich aber welche Apps ich zuletzt aufhatte, lädt wieder das Fenster der App, und triggert wieder die Meldung mit der ausgelaufenen Session. (Das Spielt hat sich so lange wiederholt bis ich es geschafft hatte das SynOCR Fenster zu schliessen bevor meine Session ausgelaufen war).

Ich verwende nicht den "admin" Nutzer, sondern einen eigenen Nutzer mit Adminrechten (das hat DSM bei der Neueinrichtung im November so vorgeschlagen). Darüber hinaus greife ich auf das DSM über einen Reverse Proxy zu, der den Zugriff zusätzlich mit einem HTTP Basic Auth absichert.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.550
Punkte für Reaktionen
1.380
Punkte
234
Hallo fbartels,

du benutzt die aktuelle Version 0.13.1?

Kannst du mal überprüfen, ob die App-Berechtigung in der Systemsteuerung > Berechtigung für deinen User korrekt gesetzt ist? Irgendwo hatte schonmal ein User dieses Problem, was durch eine Neuinstallation behoben wurde.

Hier findest du den Aufruf in Zeile 209 (ist bisschen verkorkst um die Rückgabe abfangen zu können - der Link zu dem zugrundeliegenden Thread steht dort dabei).
 

hightower8

Benutzer
Mitglied seit
01. Mrz 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Hallo

Geniales Tool, vielen Dank dafür!

Ich habe ein Problem mit den Dateiberechtigungen: Ich scanne mit einem User SCANNER, der nur auf dem Quellverzeichnis Zugriff hat. Nach der Verarbeitung durch SynOCR hat im Zielverzeichnis nur der User SCANNER Zugriff auf die Datei (auf dem Ordner sind noch andere berechtigt). Im Backup Ordner haben die anderen User Zugriff auf die Originaldatei.

Habe ich was falsch eingestellt?

LG hightower
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.550
Punkte für Reaktionen
1.380
Punkte
234
mmmmhhhh … :rolleyes:

Eigentlich überträgt synOCR die Dateiattripute der Originaldatei auf die Zieldatei:
Rich (BBCode):
        cp --attributes-only -p "$input" "$output"

Anpassen muss ich die Rechte in jedem Fall, da synOCR von Root aufgerufen wird und die erzeugten Zieldateien dann z.T. nicht mehr von den Usern gelesen werden können. Ein Lesen-Schreiben für everyone wollte ich nicht pauschal anwenden, um keine unvorhergesehenen Komplikationen zu erzeugen.

Hat jemand eine bessere Idee für das Rechtehandling?:confused:
 

fbartels

Benutzer
Mitglied seit
19. Mrz 2013
Beiträge
284
Punkte für Reaktionen
2
Punkte
24
Hi @geimist,

danke für die Rückmeldung.

du benutzt die aktuelle Version 0.13.1?

Ja, diese Version wurde bei mir übers Paketzentrum installiert.

Kannst du mal überprüfen, ob die App-Berechtigung in der Systemsteuerung > Berechtigung für deinen User korrekt gesetzt ist? Irgendwo hatte schonmal ein User dieses Problem, was durch eine Neuinstallation behoben wurde.

Ja, die Berechtigung ist bei meinem Benutzer gesetzt. Inzwischen bin ich im heimischen Netzwerk und mein Zugriff geht nicht mehr über den Reverse Proxy und nun klappt auch die Zugriff auf die App. Nimmt die App eventuell irgendwo aus der Browser Environment den Benutzernamen oder das Passwort?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.550
Punkte für Reaktionen
1.380
Punkte
234

hightower8

Benutzer
Mitglied seit
01. Mrz 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
mmmmhhhh … :rolleyes:

Eigentlich überträgt synOCR die Dateiattripute der Originaldatei auf die Zieldatei:
Rich (BBCode):
        cp --attributes-only -p "$input" "$output"

Anpassen muss ich die Rechte in jedem Fall, da synOCR von Root aufgerufen wird und die erzeugten Zieldateien dann z.T. nicht mehr von den Usern gelesen werden können. Ein Lesen-Schreiben für everyone wollte ich nicht pauschal anwenden, um keine unvorhergesehenen Komplikationen zu erzeugen.

Hat jemand eine bessere Idee für das Rechtehandling?:confused:

Können für die Datei nicht einfach die Rechte des Zielordners übernommen werden? Im Backup ist dies ja bereits so.
 

steje43

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
666
Punkte für Reaktionen
35
Punkte
48
Wow, bin beeindruckt, habe diese Woche hier diesen Post über synOCR gefunden und nun mal
Zeit gehabt mir das anzusehen.

Installiert und lief nach 5 Minuten ohne viel Mühe.

Gleich mal ein paar Dateien eingescannt und manuell ausgeführt.
Was soll ich sagen, die PDF s waren gleich da und durchsuchbar.

Ich kann nun mit meinem Scanner direkt in den Ordner scannen.

Danke für dieses Tool.
 

fbartels

Benutzer
Mitglied seit
19. Mrz 2013
Beiträge
284
Punkte für Reaktionen
2
Punkte
24
Hi Gemist,

um den Buildprozess etwas besser zu verstehen habe ich angefangen dein Buildskript zu refakturieren (bisher ist es nur etwas Syntax und ein Haufen Todos). Wärst du letztendlich an einem Patch interessiert?

Edit: ganz den Link vergessen: https://git.9wd.eu/felix/synOCR/src/branch/cleanup
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.550
Punkte für Reaktionen
1.380
Punkte
234
P.S.: was ist eigentl. der Untersch. zwischen Tags und Kategorien?

Im PDF wird nach Tags gesucht, nicht nach Kategorien. Du kannst aber in der Konfiguration mehreren Tags dieselbe Kategorie zuweisen (tag1=KategorieA;tag2=KategorieA;…), sodass z.B. alle PDFs mit Tags für Versicherung in ein und demselben Ordner verschoben werden (anstatt je ein Ordner pro Tag).

Hier gab's die ursprüngliche Info: #36
 

koen

Benutzer
Mitglied seit
04. Mrz 2019
Beiträge
14
Punkte für Reaktionen
0
Punkte
1
Kan Jemand mir sagen wie ich alternative Sprachen installiere?

Ich habe zwei Maniere versucht:

1. Wie ocrmypdf-dokumention empfehlt: original Dockerimage anpassen, dass ist aber schwierig in DSM (trotzdem versucht: download Image in Docker-app, export, unzip, edit, compress, import --> error.) Gibt es ein bessere Weg?
2. synOCR Konfiguration via SSH anpassen um een merhsprachige Version zu nützen (ocrmypdf-polyglot), auch dass schaffe ich aber nicht, es gibt mehrere Skripts und ich weiss nicht genau wie und welche ich ändern soll.

Setup: brother ads-2400n mit 218+, watchmedo Skript überwachung startet synOCR wenn ich scanne.

edit: typo (nur 1 von viele...)
 
Zuletzt bearbeitet:


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat