Paperless-ngx DMS - Fragen zu paperless-ng

guidovg

Benutzer
Mitglied seit
26. Nov 2011
Beiträge
142
Punkte für Reaktionen
43
Punkte
34
Ich habe gestern paperless-ng über den Synology Docker installiert und es läuft sehr gut. Nachdem ich jedoch viele Fehler bei den deutschen Umlauten feststellen musste, wollte ich nun die OCR-Sprache auf deutsch setzen. Da ich keine Ahnung habe, wie man die docker-compose.env anpassen kann, habe ich einfach im Docker Überblick die Variable "PAPERLESS_OCR_LANGUAGE: deu" eingefügt. Nun erhalte ich aber eine Fehlermeldung, dass diese Sprache nicht verfügbar sei.
Meine Fragen:
1) Kann ich mir die docker-compose.env als Datei in mein /docker/config Laufwerk legen?
2) Wie kann man OCR-Sprachen nachinstallieren?
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
@Darkwing9: Das kommt ja drauf an, wie umfangreich das Dokument ist. Also auch was den Text angeht, die Seitenanzahl ist ja nicht zwingend alleine entscheidend.

Ich muss allerdings sagen, dass ich da auch nicht mit der Stoppuhr daneben sitze. Aber 20-40 Sekunden könnte hinkommen und würde ich jetzt nicht als lange empfinden.
 
Zuletzt bearbeitet:

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154

guidovg

Benutzer
Mitglied seit
26. Nov 2011
Beiträge
142
Punkte für Reaktionen
43
Punkte
34
@Adama Dann muss ich leider ganz doof fragen. Wo liegt die denn?
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
Die legst du normalerweise ins selbe Verzeichnis wie die yml.

Und führst ja dann auf der Konsole in dem Verzeichnis docker compose aus. So stellt sich das ja auch auf der Projekt-Seite dar...
 

guidovg

Benutzer
Mitglied seit
26. Nov 2011
Beiträge
142
Punkte für Reaktionen
43
Punkte
34
Ich hatte eine vorgefertigte Anleitung (Caschy) genommen. Da musste/konnte ich keine eigene Datei anlegen. Ich werde die Gelegenheit nutzen und werde heute gleich die neue ngx noch einmal neu aufsetzen.
 

Darkwing9

Benutzer
Mitglied seit
09. Jun 2013
Beiträge
188
Punkte für Reaktionen
0
Punkte
16
Ok, jetzt habe ich doch einmal die Stoppuhr genommen. Als Beispiel meine Entgeltabrechnung genommen, ein Blatt doppelseitig. Der Vorgang hat leider ziemlich genau 2 Minuten gedauert. Ein weiteres Dokument mit 3 Blättern, einseitig bedruckt, nur Text hat 3,5 Minuten gedauert.

Die Last des Docker-Containers ging z.T. auf über 60% CPU hoch. Die meiste Zeit war der Wert aber im einstelligen Bereich.

Sind die Zeiten normal? Hat jemand Erfahrungswerte, wie lange das mit Docker in einer VM-Umgebung mit deutlich mehr Rechenpower und RAM dauert?
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
Hmm, die Zeiten scheinen bei mir deutlich besser zu sein.

9 Seiten PDF, Ausdruck einer Webseite (Hatte nichts Besseres), jede Menge Text, direkt aus dem Log:
13:23:18 [Q] INFO Enqueued 1
13:23:18 [Q] INFO Process-1:87 processing [Raspi iSCSI.pdf]
13:23:53 [Q] INFO Process-1:87 stopped doing work
13:23:53 [Q] INFO Processed [Raspi iSCSI.pdf]
 

guidovg

Benutzer
Mitglied seit
26. Nov 2011
Beiträge
142
Punkte für Reaktionen
43
Punkte
34
So, habe jetzt mittels Portainer die paperless-ngx installiert. Läuft! Die OCR Language habe ich gleich beim Anlegen mit aufgenommen.
Seltsamerweise kann ich jetzt aber im Portainer keine Variablen ändern. Trage ich im Bereich ENV eine neue Variable ein und klicke dann (wie im Manual beschrieben) auf Deploy the stack. Dann wird der Container neu aufgebaut, aber die Variable wurde nicht gesetzt.
Das Problem haben bei reddit auch einige. Ist das bei Euch auch so?
 

Darkwing9

Benutzer
Mitglied seit
09. Jun 2013
Beiträge
188
Punkte für Reaktionen
0
Punkte
16
Zum Vergleich der Verarbeitungsgeschwindigkeit habe ich paperless-ngx auch noch einmal im Docker meines Dell T30 Servers installiert. Anstelle von 2 Minuten hat die Verarbeitung meiner Abrechnung nun 1 Minute und 35 Sekunden gedauert. Schon schneller, aber ich hatte auf einen deutlicheren Vorteil gehofft.

Was soll's, die Dokumentenverarbeitung passiert ja im Hintergrund und daher sollte mich die Laufzeit eigentlich nicht sonderlich stören.
 

chhe

Benutzer
Mitglied seit
30. Sep 2017
Beiträge
20
Punkte für Reaktionen
3
Punkte
3
Guten Abend,
ich möchte auch gern Paperless-ng bzw. ggf. direkt Paperless-ngx einsetzen. Ich verwende aktuell eine Synology Diskstation DS215j - diese ist zu schwach um Docker auszuführen. Für andere Anwendungen habe ich aber noch einen Windows 10 Mini PC am laufen.

Darauf habe ich Docker auch schon installiert und konnte Paperless-ngx auch installieren.

Es scheitert allerdings daran, den eigentlichen Speicherort der Daten auf die Synology auszulagern. Ich bin da völlig ahnungslos und vermute, dass ich die entsprechenden Speicherorte erst als Volume hinzufügen muss. Da scheitert es aber aktuell dran.

Kann mir da jemand von euch behilflich sein? Diese Konstellation Docker auf Win10 + Dateiablage auf einem NAS wird online nicht wirklich behandelt.
Vielen Dank!
 

TillTheMan

Benutzer
Mitglied seit
01. Apr 2022
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen, ich würde auch gern paperless auf meiner Synology benutzen. Mir war beim Kauf nicht bewusst, was ich alles damit machen will, und mir war auch nicht bewusst, dass es Pakete gibt, die mit manchen System "nicht kompatibel" sind. Wie dem auch sei, ich habe eine DS220j, mit der Docker "nicht kompatibel" ist. Ich habe dann etwas recherchiert und das hier gefunden (https://cynarski.eu/docker-on-synlogy-32bit/) das sah vielversprechend aus, leider scheitert es beim starten des docker-Deamons ("dockerd") mit der Fehlermeldung "sudo: dockerd: command not found". Hat jemand von euch eine Idee?
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
Da das Thema direkt nichts mit Paperless zu tun hat, wäre es günstiger, du machst einen neuen Thread auf, um diesen nicht zu verwässern.

Um trotzdem ganz kurz auf deine Frage einzugehen, hast du, wie in der Anleitung beschrieben, die Binaries nach /usr/bin kopiert? Er findet die nämlich nicht, wäre meine Vermutung.

Ansonsten alles weitere in einem neuen Thread...
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
@TillTheMan, ich würde auch eher einen neuen Thread auf machen.

@all, ich bin doch eher enttäuscht von paperless-nxg … das OCR Ergebnis lässt gegenüber ecoDMS und OCRmyPDF (synOCR) doch arg zu wünschen übrig. Doks die mit den beiden letzteren problemlos erfasst werden, kommen bei paperless als ein Haufen von Punkten und Strichen an und damit völlig unbrauchbar … ich hab damit paperless sofort wieder gelöscht!
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.119
Punkte
214
Sehe ich ähnlich, aktuell nicht wirklich brauchbar, ich würde mich aktuell nicht auf eine Langzeitarchivierung verlassen. Kann sich ja noch ändern...
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
Also ich hab' überhaupt keine Probleme damit, die Ergebnisse sind einwandfrei. Das war mit Paperless-ng so und ngx verhält sich nicht anders...

Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.119
Punkte
214
Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
mit anderen Namen! erst beim Download über das Webif werden wieder die richtigen Namen aus der Datenbank gespeichert.
Als datenbank nutzt du Sqlite (ng) oder Postgres (ngx) finde bei sehr laaaaaaangsam.
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.134
Punkte für Reaktionen
721
Punkte
154
Die Namen lege ich fest, ebenso die Verzeichnis-Struktur. Und genau unter denen werden die Dateien auch gespeichert.

Und deine Performance-Probleme kann ich auch nicht nachvollziehen.

Postgres ging auch schon bei Paperless-ng, deine Aussage stimmt also so nicht...
 

Tuxnet

Benutzer
Mitglied seit
02. Jan 2019
Beiträge
616
Punkte für Reaktionen
74
Punkte
48
Ich habe ebenfalls keine Probleme. Alles läuft problemlos.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.119
Punkte
214
Die Namen lege ich fest, ebenso die Verzeichnis-Struktur. Und genau unter denen werden die Dateien auch gespeichert.
Und was die Langzeitarchivierung angeht, die Originale bleiben unangetastet in einem eigenen Pfad.
haben aber nicht mehr den original Namen und sind somit nicht mehr "unangetastet"
Und deine Performance-Probleme kann ich auch nicht nachvollziehen.
musst du ja auch nicht ist halt nur eine Feststellung das es alles sehr langsam geht.
Postgres ging auch schon bei Paperless-ng, deine Aussage stimmt also so nicht...
das mag sein - sehe aber in der viel beschworenen Datenbank keine großen Vorteil erst einmal, performance ist bei beiden gleich. Welche nutzt du denn?
Ich habe ebenfalls keine Probleme. Alles läuft problemlos.
wenn ich da auf github nachschaue ist da so einiges nicht in Ordnung


wie gesagt interessant aber mit schwächen in der Umsetzung. kein Multiuser, kein Mariadb usw.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat