Paperless-ngx DMS - Fragen zu paperless-ng

Ich habe gestern paperless-ng über den Synology Docker installiert und es läuft sehr gut. Nachdem ich jedoch viele Fehler bei den deutschen Umlauten feststellen musste, wollte ich nun die OCR-Sprache auf deutsch setzen. Da ich keine Ahnung habe, wie man die docker-compose.env anpassen kann, habe ich einfach im Docker Überblick die Variable "PAPERLESS_OCR_LANGUAGE: deu" eingefügt. Nun erhalte ich aber eine Fehlermeldung, dass diese Sprache nicht verfügbar sei.
Meine Fragen:
1) Kann ich mir die docker-compose.env als Datei in mein /docker/config Laufwerk legen?
2) Wie kann man OCR-Sprachen nachinstallieren?
 
@Darkwing9: Das kommt ja drauf an, wie umfangreich das Dokument ist. Also auch was den Text angeht, die Seitenanzahl ist ja nicht zwingend alleine entscheidend.

Ich muss allerdings sagen, dass ich da auch nicht mit der Stoppuhr daneben sitze. Aber 20-40 Sekunden könnte hinkommen und würde ich jetzt nicht als lange empfinden.
 
Zuletzt bearbeitet:
@Adama Dann muss ich leider ganz doof fragen. Wo liegt die denn?
 
Die legst du normalerweise ins selbe Verzeichnis wie die yml.

Und führst ja dann auf der Konsole in dem Verzeichnis docker compose aus. So stellt sich das ja auch auf der Projekt-Seite dar...
 
Ich hatte eine vorgefertigte Anleitung (Caschy) genommen. Da musste/konnte ich keine eigene Datei anlegen. Ich werde die Gelegenheit nutzen und werde heute gleich die neue ngx noch einmal neu aufsetzen.
 
Ok, jetzt habe ich doch einmal die Stoppuhr genommen. Als Beispiel meine Entgeltabrechnung genommen, ein Blatt doppelseitig. Der Vorgang hat leider ziemlich genau 2 Minuten gedauert. Ein weiteres Dokument mit 3 Blättern, einseitig bedruckt, nur Text hat 3,5 Minuten gedauert.

Die Last des Docker-Containers ging z.T. auf über 60% CPU hoch. Die meiste Zeit war der Wert aber im einstelligen Bereich.

Sind die Zeiten normal? Hat jemand Erfahrungswerte, wie lange das mit Docker in einer VM-Umgebung mit deutlich mehr Rechenpower und RAM dauert?
 
Hmm, die Zeiten scheinen bei mir deutlich besser zu sein.

9 Seiten PDF, Ausdruck einer Webseite (Hatte nichts Besseres), jede Menge Text, direkt aus dem Log:
13:23:18 [Q] INFO Enqueued 1
13:23:18 [Q] INFO Process-1:87 processing [Raspi iSCSI.pdf]
13:23:53 [Q] INFO Process-1:87 stopped doing work
13:23:53 [Q] INFO Processed [Raspi iSCSI.pdf]
 
So, habe jetzt mittels Portainer die paperless-ngx installiert. Läuft! Die OCR Language habe ich gleich beim Anlegen mit aufgenommen.
Seltsamerweise kann ich jetzt aber im Portainer keine Variablen ändern. Trage ich im Bereich ENV eine neue Variable ein und klicke dann (wie im Manual beschrieben) auf Deploy the stack. Dann wird der Container neu aufgebaut, aber die Variable wurde nicht gesetzt.
Das Problem haben bei reddit auch einige. Ist das bei Euch auch so?
 
Zum Vergleich der Verarbeitungsgeschwindigkeit habe ich paperless-ngx auch noch einmal im Docker meines Dell T30 Servers installiert. Anstelle von 2 Minuten hat die Verarbeitung meiner Abrechnung nun 1 Minute und 35 Sekunden gedauert. Schon schneller, aber ich hatte auf einen deutlicheren Vorteil gehofft.

Was soll's, die Dokumentenverarbeitung passiert ja im Hintergrund und daher sollte mich die Laufzeit eigentlich nicht sonderlich stören.
 
Guten Abend,
ich möchte auch gern Paperless-ng bzw. ggf. direkt Paperless-ngx einsetzen. Ich verwende aktuell eine Synology Diskstation DS215j - diese ist zu schwach um Docker auszuführen. Für andere Anwendungen habe ich aber noch einen Windows 10 Mini PC am laufen.

Darauf habe ich Docker auch schon installiert und konnte Paperless-ngx auch installieren.

Es scheitert allerdings daran, den eigentlichen Speicherort der Daten auf die Synology auszulagern. Ich bin da völlig ahnungslos und vermute, dass ich die entsprechenden Speicherorte erst als Volume hinzufügen muss. Da scheitert es aber aktuell dran.

Kann mir da jemand von euch behilflich sein? Diese Konstellation Docker auf Win10 + Dateiablage auf einem NAS wird online nicht wirklich behandelt.
Vielen Dank!
 
Hallo zusammen, ich würde auch gern paperless auf meiner Synology benutzen. Mir war beim Kauf nicht bewusst, was ich alles damit machen will, und mir war auch nicht bewusst, dass es Pakete gibt, die mit manchen System "nicht kompatibel" sind. Wie dem auch sei, ich habe eine DS220j, mit der Docker "nicht kompatibel" ist. Ich habe dann etwas recherchiert und das hier gefunden (https://cynarski.eu/docker-on-synlogy-32bit/) das sah vielversprechend aus, leider scheitert es beim starten des docker-Deamons ("dockerd") mit der Fehlermeldung "sudo: dockerd: command not found". Hat jemand von euch eine Idee?
 
Da das Thema direkt nichts mit Paperless zu tun hat, wäre es günstiger, du machst einen neuen Thread auf, um diesen nicht zu verwässern.

Um trotzdem ganz kurz auf deine Frage einzugehen, hast du, wie in der Anleitung beschrieben, die Binaries nach /usr/bin kopiert? Er findet die nämlich nicht, wäre meine Vermutung.

Ansonsten alles weitere in einem neuen Thread...
 
@TillTheMan, ich würde auch eher einen neuen Thread auf machen.

@all, ich bin doch eher enttäuscht von paperless-nxg … das OCR Ergebnis lässt gegenüber ecoDMS und OCRmyPDF (synOCR) doch arg zu wünschen übrig. Doks die mit den beiden letzteren problemlos erfasst werden, kommen bei paperless als ein Haufen von Punkten und Strichen an und damit völlig unbrauchbar … ich hab damit paperless sofort wieder gelöscht!
 
Sehe ich ähnlich, aktuell nicht wirklich brauchbar, ich würde mich aktuell nicht auf eine Langzeitarchivierung verlassen. Kann sich ja noch ändern...
 
Also ich hab' überhaupt keine Probleme damit, die Ergebnisse sind einwandfrei. Das war mit Paperless-ng so und ngx verhält sich nicht anders...

Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
 
Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
mit anderen Namen! erst beim Download über das Webif werden wieder die richtigen Namen aus der Datenbank gespeichert.
Als datenbank nutzt du Sqlite (ng) oder Postgres (ngx) finde bei sehr laaaaaaangsam.
 
Die Namen lege ich fest, ebenso die Verzeichnis-Struktur. Und genau unter denen werden die Dateien auch gespeichert.

Und deine Performance-Probleme kann ich auch nicht nachvollziehen.

Postgres ging auch schon bei Paperless-ng, deine Aussage stimmt also so nicht...
 
Ich habe ebenfalls keine Probleme. Alles läuft problemlos.
 
Die Namen lege ich fest, ebenso die Verzeichnis-Struktur. Und genau unter denen werden die Dateien auch gespeichert.
Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
haben aber nicht mehr den original Namen und sind somit nicht mehr "unangetastet"
Und deine Performance-Probleme kann ich auch nicht nachvollziehen.
musst du ja auch nicht ist halt nur eine Feststellung das es alles sehr langsam geht.
Postgres ging auch schon bei Paperless-ng, deine Aussage stimmt also so nicht...
das mag sein - sehe aber in der viel beschworenen Datenbank keine großen Vorteil erst einmal, performance ist bei beiden gleich. Welche nutzt du denn?
Ich habe ebenfalls keine Probleme. Alles läuft problemlos.
wenn ich da auf github nachschaue ist da so einiges nicht in Ordnung


wie gesagt interessant aber mit schwächen in der Umsetzung. kein Multiuser, kein Mariadb usw.
 
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat