ecoDMS erfahrungsaustausch?

Chr!s · 06. Feb. 2022

Interessant, ich hatte ich hatte die gleiche Idee fürs OCR synOCR zu testen bin aber aus zeitgründen noch nicht dazu gekommen. Zu deinem Problem mit dem scaninput Ordner…
In ecodms gibt es in den Einstellungen die Möglichkeit ein häkchen zusätzen ob die Texterkennung erneut durchgeführt werden soll wenn der Scan bereits Text enthält. Hab den genauen Wortlaut leider nicht in Kopf. Glaube auch es ist standardmäßig so eingestellt das keine erneute Texterkennung durchgeführt wird. Hoffe das hilft dir weiter bin bis jetzt eher noch in der Experimentier- und Einlernphase was ecodms betriff.

Stationary · 06. Feb. 2022

Super, dank Deines Hinweises habe ich es gefunden: in den ecoDMS Einstellungen unter OCR-Optionen gibt es "Vorhandene OCR von Dokumenten verwerfen und neu erstellen". Da ist bei mir ein Haken drin gewesen, den habe ich jetzt herausgenommen. Bin bei ecoDMS auch neu.

oschmidt · 06. Feb. 2022

Top. Wusste nicht das es die Einstellung gibt, fand die OCR Qualität ebenfalls nicht top

Chr!s · 06. Feb. 2022

Naja ich habe nir von synOCR keine große Verbesserung versprochen da meines Wissens nach beide Tesseract als OCR Engine verwenden daher fand ich deine Aussage sehr interessant. Ich hatte mit das übrigens so vorgestellt dass der scanoutput von synocr der scaninput von ecodms ist. Würde mich freuen wenn du ein kurzes feedback geben könntest wie du das letztendlich umgesetzt hast und wie die Ergebnisse sind.

oschmidt · 06. Feb. 2022

Du wirst alles, was du von eco verarbeitet haben willst, in den Scaninput Ordner legen müssen.
Ich glaube kaum das du tiffsplit direkt ansteuern kannst.

Stationary · 06. Feb. 2022

Also ich habe ein Dokument, daß ich mehrfach durch ecoDMS habe ocr'en lassen, da kam jedesmal "Sanitä" beim OCR heraus. Mit synOCR hatte ich endlich das gewünschte Ergebnis "Sanitär". Und es war kein unklarer Scan.
Ich lege jetzt den OCR-Output von synOCR im scaninput-Ordner ab und lasse bei den PDF/A mit durchgeführtem OCR keinen weiteren OCR mehr laufen - gemäss der jetzt geänderten Einstellungen.
D.h. workflow ist jetzt: Scanner per FTP in den synOCR-Eingangsordner - synOCR nach ecoDMS scaninput, kein weiteres OCR bei vorhandenem OCR.

Chr!s · 06. Feb. 2022

super, jetzt hast du mich dazu gebracht mir das Thema synOCR auch nochmal anzugehen

allerdings scheint es für DSM 7 noch kein synOCR zu geben bzw. habe es noch nicht auf anhieb gefunden. Hast du noch noch dsm6?

Stationary · 06. Feb. 2022

Ja, ich habe noch DSM6 auf meinen Geräten, da bleiben die auch mindestens bis Juni 2023.

Stationary · 06. Feb. 2022

Chr!s schrieb:
allerdings scheint es für DSM 7 noch kein synOCR zu geben

Mir scheint, daß Stephan hier eine Version für DSM 7 anbietet: https://geimist.eu/synOCR/synOCR_DSM7_latest.html Könnte aber eine beta sein, habe ich natürlich nicht ausprobiert.

Chr!s · 06. Feb. 2022

danke da muss ich mich mal einlesen...

Chr!s · 06. Feb. 2022

Stationary schrieb:
Mir scheint, daß Stephan hier eine Version für DSM 7 anbietet: https://geimist.eu/synOCR/synOCR_DSM7_latest.html Könnte aber eine beta sein, habe ich natürlich nicht ausprobiert.

Habe nun synOCR unter DSM7 am laufen. Nach erstem Test scheint die Texterkennung tatsächlich etwas Besser zu sein als die von ecodms selber allerdings habe ich nur eine Dokument zum Testen verwendet. Hier Hatte ich das Problem dass bei einer Abrechnung das Datum rechts oben im Dokument steht, dieses wurde einfach nicht als Text erkannt, nach der Verarbeitung durch SynOCR wird das Datum erkannt.

Wenn ich es richtig gesehen habe erzeugt synOCR während der Verarbeitung PDF Dateien mit dem Namen "TEMP..." im Output-Ordner. Wenn dieser Output-Ordner nun gleichzeitig der ecoDMS Input-Ordner ist könnte ich mir vorstellen dass es möglicherweise zu Problemen kommen kann... wobei mir mit der ersten Test-PDF diesbezüglich kein Fehler aufgefallen. Ist Ich werde weiter testen...

SebastianHue · 08. Feb. 2022

Hallo auch ich beschäftige mich seit ein paar Tagen mit dem EcoDMS.
Ich möchte als ersten Schritt gerne unsere eingehenden Lieferscheine kategorisieren.
Dabei habe ich jetzt in der Testumgebung einige Lieferscheine mehrfach in das EcoDMS eingelesen, gibt es eine Möglichkeit dass das System selbstständig erkennt, dass ein Dokument schon in der Datenbank vorhanden ist? Vielleicht anhand der Klassifizierung in diesem Beispiel Lieferant und Lieferschein Nr.?
Ich habe dazu bisher leider nichts gefunden.

oschmidt · 08. Feb. 2022

Du möchtest verhindern das Duplikate eingelesen werden? Ich glaube so eine Funktion gibt es nicht.

geimist · 08. Feb. 2022

Stationary schrieb:
Mir scheint, daß Stephan hier eine Version für DSM 7 anbietet: https://geimist.eu/synOCR/synOCR_DSM7_latest.html Könnte aber eine beta sein, habe ich natürlich nicht ausprobiert.

Der Link ist korrekt. Und nein, das ist keine Beta, sondern wäre die Version, welche eigentlich auf cphub.net zu finden sein sollte.
Ich hoffe, @Matthieu hat uns da nicht vergessen …

Chr!s schrieb:
Wenn ich es richtig gesehen habe erzeugt synOCR während der Verarbeitung PDF Dateien mit dem Namen "TEMP..." im Output-Ordner.

Das ist korrekt. Das Tempfile ist die Ausgabe von OCRmyPDF. Anschließend werden die Rechte wiederhergestellt und die Verschlagwortung / Sortierung gestartet (die ja in diesem Fall hier nicht zur Anwendung kommt).

SebastianHue · 08. Feb. 2022

oschmidt schrieb:
Du möchtest verhindern das Duplikate eingelesen werden? Ich glaube so eine Funktion gibt es nicht.

Ja das wäre ein Ziel. Doppelte Dokumente führen doch im Allgemeinen im wieder zu Problemen oder wie wird das von euch gehandhabt?

servilianus · 08. Feb. 2022

SebastianHue schrieb:
Ja das wäre ein Ziel. Doppelte Dokumente führen doch im Allgemeinen im wieder zu Problemen oder wie wird das von euch gehandhabt?

Eine Funktion, die erkennt, das Dokumente doppelt eingelesen worden sind, kann es nur in der InBox geben, also bevor das Dokument archiviert worden ist. Denn: Sobald ein Dokument einmal archiviert worden ist, kann und soll es nicht mehr verändert und gelöscht werden (sondern nur noch in den Papierkorb verschoben werden), bzw. es kann es aus dem Papierkorb erst dann gelöscht werden, wenn die hinterlegte Löschfrist (beispielsweise für Rechnungen zehn Jahre) für archivierte Dokumente überschritten worden ist.

Der Grund ist, dass ecoDMS mit den Grundsätzen für die ordnungsgemäßen Buchführung in Deutschland (GoBD) arbeitet - und die besagt, dass jedes in einen Betrieb einlaufende (und ausgehende) Dokument (Rechnungen, Geschäftsbriefe) einen Geschäftsvorfall darstellt, und unverändert sogleich archiviert werden muss, und dann den geltenden gesetzlichen Archivierungsvorschriften unterliegt. Einmal archiviert darf sich das Ursprungsdokument nicht mehr verändern lassen (sondern nur neue, rückverfolgbare Versionen des Ursprungsdokument sich erstellen lassen, beispielsweise durch Annotationen auf der pdf in ecoDMS).

Kurzum: Wenn man versehentlich dasselbe Dokument doppelt archiviert, muss man es manuell in den Papierkorb verschieben, am besten auch mit einer Annotation, warum sich das Dokument im Papierkorb befindet (also wenn man ecoDMS geschäftlich nutzt, wofür es ja vorgesehen ist). Falls nämlich ein Finanzbeamter bei einer Buchführung verlangt, Zugriff auf ecoDMS zu erhalten.

Oder man lässt vom Scanner grundsätzlich nicht direkt automatisch ins Archiv scannen, sondern nur in die Inbox - und muss dann dort manuell schauen, ob das Dokument evtl. mehrfach gescannt worden ist, bevor man es manuell archiviert.

Aber bei mir kommt doppeltes Scannen /Archivieren eigentlich so gut wie nie vor: Ich stempele jedes Dokument vorher mit einem Stempel a la: "Gescannt", jage das Dokument durch den Scanner, hefte das Dokument ab. Anhand des Stempels kann ich später erkennen, dass das Dokument schonmal gescannt worden war.

Und falls doch, kann ich im Archiv im betreffenden Ordner eigentlich recht schnell sehen, dass dort zwei oder mehrere Dokumente erscheinen, die dort mit identischen Rechnungsnummer, Betrag, Rechnungsdatum etc. kategorisiert worden sind und eines davon dann mit einer entsprechenden Annotation ("Doppel-Archivierung) in den Papierkorb verschieben.

Ondaroxx · 10. Feb. 2022

Hi, ich habe hier leider keine Antwort auf mein Problem mit ecoDMS gefunden, deswegen erläutere ich es kurz hier und hoffe auf Antwort

Ich habe ecoDMS erfolgreich seit Monaten laufen und auch noch vor kurzem Dokumente über meinen Scanner gescannt. Auf einmal zeigt er mir neue Scans allerdings nicht mehr in der Inbox ein. Der Drucker scant sie korrekt in das Scaninput Verzeichnis ein, ich kann sie dort sehen. Es erfolgt aber ohne Änderung keine Verarbeitung der Scans.

Hab alles auch bereits neu gestartet und geupdatet, aktuell weiß ich nicht weiter. Wenn ich sie manuell importieren werden die PDFs korrekt archiviert. Nur der Weg über den Scaninput klemmt.

servilianus · 10. Feb. 2022

- verschwinden die pdfs denn aus dem ScanInput-Ordner = werden sie verarbeitet?

- falls ja: kann es sein, dass die pfs deswegen nicht (mehr) in der Inbox auftauchen, weil sie automatisch im Archiv abgelegt worden sind?

Ondaroxx · 10. Feb. 2022

Nein, sie bleiben da einfach unverarbeitet liegen. Da ist irgendwo der Break. Im Docker ist das Verzeichnis aber korrekt hinterlegt. Wie gesagt, ich hatte ja auch nichts geändert und bis vor kurzen problemlos damit gearbeitet.

servilianus · 10. Feb. 2022

Versuch doch mal, eine andere pdf, die nicht vom Scanner kommt, in den Ordner zu ziehen. Um zu sehen, ob evtl. die Scanner-pdfs bzw. Scanner-Einstellungen daran schuld sind, dass sie nicht verarbeitet werden.

ecoDMS erfahrungsaustausch?

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Additional post fields

Kaffeautomat