EcoDMS ocr Erkennung

turbotopo

Benutzer
Mitglied seit
02. Okt 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
hallo zusammen,

ich habe seit kurzem ecoDMS privat im Einsatz (auf einer DS920+) und scanne vor allem Dokumente über den Scaninput.
Bisher habe ich erst knapp 17 Dokumente gescannt, aber ich habe bereits eins, das nicht über die Volltextsuche gefunden wird.
Es ist eine Stromrechnung und egal was für ein Wort ich aus dem Dokument suche, er findet nichts.

Gibt es eine Möglichkeit das OCR-Ergebnis eines Dokuments anzuschauen?

Besten Dank schon mal.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Kam das bereits als PDF mit Text oder ist die Erkennung über ecoDMS die erste in dem Dokument?
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.937
Punkte für Reaktionen
1.261
Punkte
194
Ich würde nicht die ocr-Funktion von ecoDMS nutzen, sondern die von synOCR. Die basieren zwar beide auf der tesseract ocr engine, aber der eigenen Erfahrung nach liefert synOCR die besseren Ergebnisse. Frag‘ mich nicht, warum.
Ansonsten könntest Du ein PDF nach dem OCR-Vorgang mal in Adobe DC öffnen und den Text markieren, das sollte Dir zeigen, welcher suchbare Text der Seite unterliegt.
 
Zuletzt bearbeitet:

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
synOCR bietet auch log-Optionen; in der Stufe 2 kann man sich dann den gesamten erkannten Text ausgeben lassen. @geimist wäre hier im Forum dafür der Ansprechpartner, wenn es dazu noch Fragen gibt.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Da du gerade erst einmal mit Ecodms angefangen hast - wäre Paperless-ngx ist eine bessere Wahl?
 

turbotopo

Benutzer
Mitglied seit
02. Okt 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
was ist hier der Vorteil? habe eine ecoDMS Lizenz bereits gekauft.

Ich würde nicht die ocr-Funktion von ecoDMS nutzen, sondern die von synOCR. Die basieren zwar beide auf der tesseract ocr engine, aber der eigenen Erfahrung nach liefert synOCR die besseren Ergebnisse. Frag‘ mich nicht, warum.
Ansonsten könntest Du ein PDF nach dem OCR-Vorgang mal in Adobe DC öffnen und den Text markieren, das sollte Dir zeigen, welcher suchbare Text der Seite unterliegt.
und wie funktioniert das synOCR mit dem ecoDMS? läuft das alles auf der NAS autark? gibt man ihm eine PDF (in einem Verzeichnis wo der Scanner reinschreibt und spuckt es in einem anderen Verzeichnis wieder aus (durchsuchbar) wo das Archivsystem drauf hört?

Ich danke euch schon mal für die bisherigen Antworten!!!
 
Zuletzt bearbeitet von einem Moderator:

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.937
Punkte für Reaktionen
1.261
Punkte
194
Korrekt. Du scannst Deine Dokumente in den Eingangsordner von synOCR. Der Ausgabeordner von synOCR ist der ecoDMS Eingangsordner. In den ecoDMS-Einstellungen schaltest Du die OCR-Funktion aus. Läuft alles automatisch auf der Diskstation.
 

turbotopo

Benutzer
Mitglied seit
02. Okt 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
habe gerade mal nach dem synOCR geschaut, finde es aber nicht in der Paketverwaltung. Beta-Packages sind aktiv und auch das Community-Hub hab ich hinzugefügt. Dort findet er viele Pakete, aber kein synocr..gibt es irgendwo eine detaillierte Anleitung, auch um den Docker-Container aufzusetzen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
was ist hier der Vorteil? habe eine ecoDMS Lizenz bereits gekauft.
Ich hätte das erst einmal getestet ob es den Ansprüchen gerecht wird.

Ich finde Paperless einfacher, benutzerfreundlicher und für den Heimgebrauch ausreichend. Man benötigt keine extra Software, da alles im Browser abläuft. Es bleiben die original Dateien erhalten und kann mit sämtlichen Files incl Office umgehen.

Wenn du neben ecoDMS noch weitere Software braucht um die Files besser vorzubereiten finde ich es nicht gut umgesetzt.

Ich würde es wenigstens einmal testen.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Ich finde Paperless einfacher, benutzerfreundlicher und für den Heimgebrauch ausreichend. Man benötigt keine extra Software, da alles im Browser abläuft. Es bleiben die original Dateien erhalten und kann mit sämtlichen Files incl Office umgehen.
Dem kann ich mich nur anschließen, ecoDMS habe ich allerdings nicht selbst getestet. Paperless-ngx nutzt wie synOCR Tesseract über OCRmyPDF, die Ergebnisse sind also die gleichen bei gleichen Ausgangsdokumenten.
 

steje43

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
666
Punkte für Reaktionen
35
Punkte
48
Ich finde Paperless einfacher, benutzerfreundlicher und für den Heimgebrauch ausreichend. Man benötigt keine extra Software, da alles im Browser abläuft. Es bleiben die original Dateien erhalten und kann mit sämtlichen Files incl Office umgehen.

Nutze schon seit Jahren ecoDMS für den Heimgebrauch und nun auch für einen großen Verein.

Ich habe aus Interesse Paperless mal installiert.

Nun sieht ganz nett aus.

Trotzdem finde ich ecoDMS besser. Großer Vorteil: Bei ecoDMS liegen die Dateien im Container und sind verschlüsselt.
Und die Originaldateien sind auch noch da. Man kann diese alle exportieren.

Vom Datenschutz viel besser.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Und die Originaldateien sind auch noch da. Man kann diese alle exportieren.
Ohne Container (ecodms) ist kein herankommen an die Files möglich. Bei Paperless jederzeit möglich mit entsprechenden Rechten ohne weitere Software auch aus einem Backup einsehbar und verwendbar. Exporte (ecodms) müssen aufwendiger über die GUI gemacht werden.
Vom Datenschutz viel besser.
Ob das so ist sei dahin gestellt
 
Zuletzt bearbeitet:
  • Like
Reaktionen: w00dcu11er

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Wir reden ja auch immer noch von einem Docker-Container auf dem privaten NAS und nicht einer im WWW gehosteten Website.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat