synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Hallo Felix,

Dateinamen werden derzeit nicht ausgewertet. Ich würde dir den Weg über ein zusätzliches Profil in synOCR empfehlen: Als Inputordner den Ordner "Steuererklärung" z.B. als Unterordner des Standardinputordners und dasselbe mit dem Outputordner. So bleibt deine bisherige Struktur erhalten.

P.S.: vielen Dank für den Kaffee :eek:
 

Stulle

Benutzer
Mitglied seit
16. Mai 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo Forum,

zunächst mal an alle: Super Entwicklungs- und Fehlerbehebungsarbeit, die hier geleistet wird !

@geimist:

synOCR als GUI zu OCRMyPDF ist wirklich TOP und echt einfach zu nutzen. Auch die Parameterisierung lässt viele Möglichkeiten der Verarbeitung zu.

Einen besonderen Hinweis möchte ich zum Tagging noch beitragen:
Das "#" vor den Tags ist insgesamt sehr hilfreich. Da ich aber eine Software (hier: alltags) zur automatischen Weiterverarbeitung verwenden möchte, die aus den Dateinamen automatisch Tag-Vorschläge generiert, haben diese Tags immer ein "#" davor stehen.

Ich fände super, wenn es noch einen Schalter geben könnte, der das "#" bei der Erzeugung des Dateinamens unterdrückt.

Soweit ein wirkliches Super-Tool.


Viele Grüße
Christoph
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Hallo!


Hab ein neues problem.

Ich benutze das Programm die ganze Zeit unter dem User "admin"
jetzt waren diverse hackerversuche mit dem user namen "admin"

jetzt habe ich als Vorsichtsmaßnahme einen neuen "xyz" admin angelegt.
und den Standard "admin" deaktiviert

NUR wenn man jetzt das Programm startet kommt nur
Es tut uns Leid, die von Ihnen gesuchte Seite konnte nicht gefunden werden.

hab ich was vergessen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Wenn du die DSM-Standardports verwendest, ist es normal, dass da immer wieder angeklopft wird - egal, wie die User heißen. Ich kenne das dank Firewall und Portanpassung nur noch von meinem Mailserver, dessen Port ich systembedingt nicht ändern kann.

Zu deinem Problem:
  • hast du dem User xyz die Rechte an synOCR vergeben (Systemsteuerung > Berechtigungen)?
  • wenn das nicht das Problem ist: setze mal den Haken "Browserkompatibilität durch Überspringen der IP-Prüfung verbessern" (Systemsteuerung > Sicherheit)
 
Zuletzt bearbeitet:

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Entschuldige das ich jetzt erst anworte!

* ja dieser Admin hat rechte
* Browserkompatibilität hab ich aktiviert ---> hat nichts verändert

welchen Port sollte ich mir anschauen?
Aber ich hab als Test die Firewall deaktiviert und trotzdem kommt diese Seite
 
Zuletzt bearbeitet von einem Moderator:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
  • ja dieser Admin hat rechte
  • Browserkompatibilität hab ich aktiviert ---> hat nichts verändert
Ich habe das bei mir mit einem anderen Admin nachgestellt und kann den Fehler nicht reproduzieren. Mit den Rechten meine ich wirklich die Rechte an synOCR, nicht für die benutzen Ordner!

  • welchen Port sollte ich mir anschauen?
Meine Aussage dazu hat nichts mit der Fehlermeldung zu tun, sondern zielte auf deine beobachteten "Hackversuche". Welche Anwendung (=Port) wurde denn angegriffen? DSM (also Port 5001)? Ich würde alle öffentlichen Ports, welche du von extern benötigst, auf einen hohen fünfstelligen Wert legen, z.B. 55001. Dort wird standardmäßig kaum gescannt. Standardports wie 21, 25 und 5001 werden immer wieder gecheckt.

Den User "admin" umzubenennen bringt aus meiner Sicht keinen Sicherheitsvorteil gegenüber einem starken Passwort.
 

Flori73

Benutzer
Mitglied seit
05. Jun 2010
Beiträge
116
Punkte für Reaktionen
0
Punkte
16
Ich bin auf der Suche nach einer Möglichkeit meinen ganzen Papierkram einzusannen und auf den NAS abzulegen, Bin auf das Tolle Tool gestossen, habs installiert und frage mich gerade wie ich am besten mein Archiv durchsuche.
Ich nutze einen Mac OS. Wie durchsucht ihr Euer Archiv ?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Da gibt es mehrere Möglichkeiten:
  • mein Archiv ist Teil eines Teamordners, den ich via Drive auf macOS synce. Da finde ich alles mit Spotlight.
  • ein gemounteter Share ist im Finder durchsuchbar (der Index von UniversalSearch wird da verwendet)
  • durchsuchen mit UniversalSearch im DSM / Drive (Weboberfläche)
 

manu_syn

Benutzer
Mitglied seit
05. Mai 2019
Beiträge
22
Punkte für Reaktionen
4
Punkte
3
Hallo Stephan,

vielen herzlichen Dank für dein praktisches Tool und deinen Einsatz hier. Ich habe es installiert und es lief sofort problemlos.

Ich habe lediglich eine Frage:
Ist es möglich Unterordner innerhalb des Quellverzeichnisses zu nutzen? Also dass synOCR rekursive durch die Ordner durchgeht?


Ich wollte meine komplette pdf Sammlung OCRen und habe einfach die Sammlung inklusive der Unterordner in das Quellverzeichnis kopiert. Leider wurden nur die pdfs bearbeitet, die direkt im Quellverzeichnis lagen.
Gibt es hierzu eine Option die man setzen muss oder müssen die pdfs immer direkt im Quellverzeichnis liegen.

Viele Grüße
Manuel
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Das lässt sich technisch denke ich gut lösen. Aber genau so wichtig wäre für mich, dass im Zielverzeichnis auch entsprechende Ordner erzeugt werden, sonst hätte das Ganze ja nicht viel Sinn, oder?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Das ist derzeit nicht vorgesehen (zumal es ja wahrscheinlich lediglich einmalig benötigt würde).
 

manu_syn

Benutzer
Mitglied seit
05. Mai 2019
Beiträge
22
Punkte für Reaktionen
4
Punkte
3
@ TeXnixO: Genau :) Entwerder im Output Ordner die gleiche Dateistruktur oder direkt im gleichen Ordner und über das Prefix markiert.


@ Stephan: Vielen Dank schonmal für deinen schnelle Rückmeldung. Hier mal mein geplanter Workflow... vielleicht hast du ja eine Idee wie das ohne die Unterordnerstruktur umsetzbar ist:

Nach dem initalvorgang hätte ich synOCR so weitergenutzt, dass der Inputordner inkl. Unterstruktur auch der Output ist. Dies würde es mir ermöglichen die gescannten Dateien beim scannen direkt dort abzulegen wo ich sie brauche (z.B. Dokumente/Versicherung/Firma_A). Danach würde ich sie lediglich nachts per synOCR umwandeln.

So hätte ich den Vorteil, dass ich die Einsortierung direkt beim scannen erledigen kann (wenn ich das Dokument eh gerade anschaue) und nicht erst später nochmal aus dem Output-Ordner in meine Zielstruktur sortieren muss.

Viele Grüße
Manuel

PS: Zum "scannen" nutze ich mittlerweile häufiger eine App auf meinem Smartphone und sende das .pdf dann über Synology Drive an die diskstation und kann das pdf direkt in meine Ordnerstruktur einsortieren. Am nächsten morgen wäre dann alles fein umgewandelt :)
 

Dino86

Benutzer
Mitglied seit
21. Jun 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen, Hallo geimist!

Seit kurzem besitze ich eine DS218 mit dem Hintergrund meine Zettelwirtschaft zu digitalisieren. Mein Ziel: So viel wie möglich zu Automatisieren. Das gelingt mit mit diesem Tool wunderbar! Vielen Dank vorerst für deine Mühen!
Bei meinen ersten Anwendungen ist mir aufgefallen, dass es wunderbar wäre auch gefundene Tags ersetzten zu können. So wäre es z.B. manchmal sinnvoll nach der Versicherungsnumer zu suchen dann aber im Dateinamen "Krankenversicherung" anstatt zu verwenden. Auch ein zweiter #Tag im Dateinamen zu vergeben fände ich beim ein oder anderen Fall sinnvoll.

Grüße Dino
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Hallo Dino,

ja, das steht schon auf der Liste und fände ich auch persönlich wertvoll. Das ganze Tagging und die Suche nach Tags wollte ich ja sowieso noch etwas umbauen - wozu mir noch die zündende Idee fürs einfache Handling fehlt. Derzeit habe ich leider gar keine freien Ressourcen übrig, was sich hoffentlich auch mal wieder ändert … :eek:
 

paulchen0815

Benutzer
Mitglied seit
17. Okt 2012
Beiträge
59
Punkte für Reaktionen
0
Punkte
0
hat sich erledigt: ich war zu doof zum Konfigurieren von synOCR. Habe ich erst jetzt bemerkt, weil ich es viele Wochen nicht mehr benutzt habe :)
 
Zuletzt bearbeitet:

BogusBogey

Benutzer
Mitglied seit
12. Jul 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Gibt es ein Update zu ocrmypdf-alpine? Oder vielleicht ein benutzerdefinierten Auswahl fur ein docker image?

Grüße,
Erwin
Die Niederlande
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Hallo Erwin,

aktuell kann man keine unterschiedlichen Releases über synOCR auswählen, lediglich die unterschiedlichen Images "jbarlow83/ocrmypdf" und "jbarlow83/ocrmypdf-polyglot" (mit alles Sprachdateien). In Zukunft möchte ich die Auswahl noch erweitern.

Für ein Update des Images ist dieses in der Docker-GUI einfach zu löschen. Beim nächsten Programmlauf von synOCR wird die "latest"-Version der Auswahl erneut geladen.

Darf ich fragen: warum benötigst du gerade "ocrmypdf-alpine"?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat