OCR ohne Docker auf bestehende PDFs gesucht

Status
Für weitere Antworten geschlossen.

D-Nero

Benutzer
Mitglied seit
24. Mai 2014
Beiträge
69
Punkte für Reaktionen
0
Punkte
6
Hallo zusammen,

folgende Ausgangssituation:
mit einem Brother Scanner schiebe ich alle meine Dokumente als PDF in ein Verzeichnis auf dem NAS.
Das Verzeichnis wird per "Drive" mit meinem Windows-PC synchronisiert.

Ich suche nun nach einer Lösung, die alle neuen Dateien in dem Scan-Eingangsverzeichnis OCRed und mir ein PDF, welches den Scan und den OCR-Text enthält, erstellt.

Meine DS218 unterstützt keinen Docker womit die Lösungen, die ich hier gefunden habe, ausscheiden.
Ideal wäre natürlcih wenn die Lösung auf der DS läuft.
Ich könnte aber auch damit leben wenn die Lösung auf dem PC über das synchronisierte Verzeichnis läuft.
Ich benötige keine zeitnahe Abarbeitung und keine besonders dolle Qualität.
Wichtig wäre mir nur, dass ich die gescannten Dokumente auch in ein paar Jahren noch halbwegs zuverlässig (auf Basis der Inhalte) wiederfinden kann und das die Lösung möglichst vollautomatisch läuft.
(Sofern das irgendwie Optionen eröffnet, stünde noch ein Raspberry Pi zur Verfügung. Wobei ich dazu direkt sagen muss, dass meine Linux-Kenntnisse gegen null tendieren... *s*)

Schön wäre natürlich eine kostenlose Lösung. Wenn es ein paar Euro (so bis ~100 Eur) kostet, wäre es auch okay.

Für Anregungen wäre ich sehr dankbar.

Viele Grüße
Daniel
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Vorab, ich kenne keine Lösung, habe mich aber auch nicht mit einer Lösung über den PC beschäftigt. PC-Software für OCR wird es genug geben, man müsste halt nur das Verzeichnis auf der DS mit einem Verzeichnis auf dem PC syncronisieren.

Aber da du "bis 100 Euro" in den Raum geworfen hast, ist mir eine andere Lösung eingefallen: Kauf die DS218+ und verkaufe die DS218. Der Verlust sollte sich gut unter 100 Euro einpendeln. Die Migration der HDDs sollte kein Problem darstellen. So hättest du dann ein intelbasiertes System und kannst z.B. SynOcr (Link siehe meine Signatur) nutzen. Der Entwickler ist hier aus dem Forum und das Teil läuft wirklich gut.
 

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
244
Punkte
63

D-Nero

Benutzer
Mitglied seit
24. Mai 2014
Beiträge
69
Punkte für Reaktionen
0
Punkte
6
Also das ist alles irgendwie extremst unbefriedigend:
- Upgrade der DS auf DS+. Wäre u.U. tatsächlich eine Option. Ich befürchte nur wieder dieverse Wochenenden Arbeit für Einrichtung, Konfiguration, Wiederherstellung, etc. mit ungewissem Ausgang, was die ursprüngliche Zielsetzung betrifft. Darüber hinaus wird's wohl nicht mit 100,- getan sein. Um das ganze möglichst sicher durchzuziehen erscheint es mir ratsam ein Case und Festplatten neben die vorhandene DS zu stellen (sodass ich nie in die Situation kommen kann nicht auf das alte System zurückzuwechseln bevor alles läuft...)

- ecodms und ich werden keine Freunde. Ich habe schon lange nicht mehr so mangelhaft dokumentierte und fehlerhafte Installer erlebt (oder mich selber so flach angestellt). Test-Installation auf Win 7 meldet Fehler bei der Postgre Installation und ist nicht installierbar. Installation auf dem Raspi ist nicht möglich weil irgendeine java Komponente fehlt. Handbuch sagt lediglich: "prüfen Sie ob installiert". Wie man's installiert wird nicht verraten. Google wiederum sagt, dass es diese Komponente gar nicht mehr gibt und braucht. Also irgendwie ebenso nicht installierbar bzw. für einen Test nur mit unvehältnismäßigem Aufwand.

Ich habe hier noch was gefunden, was sich nach einer Lösungsoption anhört:
https://jankarres.de/2014/03/raspberry-pi-dokumentenverwaltung-mit-ocr-einrichten/

Was sagt Ihr dazu? Könnte das eine Lösung sein?
Könnte die Lösung ggf. sogar auf der DS218 funktionieren?

Was mich noch zögern lässt es auf dem Raspi zu probieren, ist dass der Artikel schon recht alt ist.

Gruß
Daniel
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Hallo Daniel,

eins zu eins wirst du die Anleitung leider nicht umsetzen können, da u.a. keine Paketverwaltung (apt) auf der DS vorhanden ist. Vielleicht könntest du das via IPKG umschiffen, sofern es die einzelnen Pakete für deine CPU such gibt. Auch das Skript inkl. Pfade müsste natürlich angepasst werden.
 

D-Nero

Benutzer
Mitglied seit
24. Mai 2014
Beiträge
69
Punkte für Reaktionen
0
Punkte
6
Läuft leider nicht mal auf dem Raspi. :-(
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
… - Upgrade der DS auf DS+. Wäre u.U. tatsächlich eine Option. Ich befürchte nur wieder dieverse Wochenenden Arbeit für Einrichtung, Konfiguration, Wiederherstellung, etc. mit ungewissem Ausgang …
Durch Umstecken der HDDs sollte alles (Daten) schon mal an Ort und Stelle sein. Einige Pakete müssen sicherlich (aufgrund des Plattformwechsels) neu installiert werden. Viele Konfigurationsdialoge als Screenshot dokumentiert zu haben, ist immer sinnvoll und ergänzt das obligatorische Datenbackup. Einige Paketkonfigurationen lassen sich auch via HyperBackup sichern und wiederherstellen.

Ich kann deine Bauchschmerzen verstehen …
 

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
244
Punkte
63
Nun, ich denke, die Migration von der 218 auf die 218+ sollte doch ohne Bauchschmerzen geschehen können, Ich hatte das seinerzeit mit Hyperbackup gemacht und hatte wirklich keine Probleme:

https://www.synology.com/de-de/know...igrate_between_Synology_NAS_DSM_6_0_and_later

Ich meine mich zu erinnern, dass sogar die Nutzerverwaltung mitübertragen wurde. Ecodms ist dann übrigens dort im Docker vollkommen problemlos zu installieren, war bei mir eine Sache von 15 Minuten - und läuft seitdem seit Monaten vollkommen stabil.

Also ich denke auch: Der Umstieg auf die 218+ ist aus diesen Gründen - aber auch, wenn man noch andere Erweiterungen haben will - sehr zu empfehlen. Und wenn man dafür einen Wochenend-Tag investiert - so lohnt sich der Zeitaufwand in jedem Fall. Und wenn es doch Probleme geben sollte - hier im Forum reagiert man sehr schnell...

(P.S.: Ich bin deswegen ein Fan von ecodms, weil das Programm im Docker auf Anhieb läuft, ohne Programmierkenntnisse haben zu müssen und irgendwelche Scipte anpassen zu müssen - aber o.k., kostet halt 80 Euro)

Ich war selbst erstaunt, wie einfach das mit Docker doch funktioniert. Übrigens ist der genaue Ablauf im Installations-Handbuch von ecodms für Synology genaustens beschrieben:

https://www.ecodms.de/index.php/de/download/handbuecher/ecodms-archiv/ecodms-version-18-09-apu
 
Zuletzt bearbeitet:

D-Nero

Benutzer
Mitglied seit
24. Mai 2014
Beiträge
69
Punkte für Reaktionen
0
Punkte
6
Hallo zusammen,

so, die neue DS218+ inkl. 2 Festplatten sind bestellt.
Darüber hinaus habe ich in der Zwischenzeit ecodms auf meinem PC zum Laufen gebracht. Evtl. lag's am Port 8080. Der ist das einzige, was ich bei der erneuten Installation geändert habe weil er u.U. schon anders belegt war. Sieht ganz interessant aber auch nach viel Verwaltungsaufwand aus...
Kostentechnisch ufert das ganze Projekt nun doch etwas aus. :)
Scanner, neues NAS, neue FP, ggf. Lizenzen falls ich mich für ecodms entscheide. In dem Fall würden aber auch nicht nur 89,- Eur sondern 2 Lizenzen + ggf. 2 mal ecoMailz fällig.
Nun ja, schauen wir mal.

Btw. nutzt jemand ecoMails mit ecoDMS? Wir nutzen aktuell mailStore. Lohnt der Umstieg?

VG
Daniel
 

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
244
Punkte
63
Du kannst ecoDMS auch nur mit einer Lizenz nutzen - und beliebig vielen Anwendern - die dürfen halt dann nur nicht gleichzeitig auf ecodms zugreifen. Sondern immer nur einer gleichzeitig bei einer Lizenz. Übrigens auch egal, ob per Client oder per Web-zugriff (den ich inzwischen sehr schätze, um mal eben am Smartphone eine Rechnung aufzurufen. Dazu habe ich eine Subdomain: eco.ip_meiner_syno.de erstellt, und lasse in der Syno (Anwendunsportal) per ReverseProxy auf ip_meiner_syno.de:8081 zeigen).

Ja, am Anfang sieht es etwas kompliziert aus, aber wenn man das Konzept einmal begriffen hat, ist es eigentlich einfach. Bei mir hat es einen Tag Einarbeitungszeit gebraucht, jetzt ist alles klar. Zu ecoMailz kann ich nichts sagen, nutze ich nicht.
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat