Paperless-ngx DMS - Fragen zu paperless-ng

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Nutzt du die aktuellste Version? In der Synology Docker GUI den Paperless Container einmal zurücksetzen und noch einmal testen.
Was hat der Speicherpfad mit dem Namen zu tun?
 

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
1. kann durchaus sein, dass nicht die aktuellste Version (Paperless-ngx 1.8.0). Ich glaub ich traue mich nicht zurückzusetzen.. nicht dass dann alle meine Einstellungen (Dokumenttypen, Korrespondenten, etc.) verloren gehen.. ich hab noch nicht gefunden, wo die überhaupt abgespeichert werden..


2. über den Speicherpfad wird, zumindest bei mir, auch das PDF benannt. Je nach config. {correspondent}/{document_type}_{created_year}{created_month}{created_day}_{title} = Rechnung_20220101_Titel der Rechnung.pdf
 
Zuletzt bearbeitet von einem Moderator:

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Da brauchst du keine Angst zu haben. Es wird nur der Inhalt vom Container zurückgesetzt, wie bei einem Update. Ich bin bei Version 1.10.2.
Wenn du Paperless richtig installiert hast, geht nichts verloren, wenn doch, hilft dir das eh nicht richtig weiter. Dann würde ich keine Files dort archivieren, macht ja keinen Sinn.

Zuerst solltest du Paperless aktualisieren bevor du weiter suchst, es wurde viel gefixt inzwischen. Deine Version ist ein halbes Jahr alt!
 

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
so, Version 1.10.2. Aber die PDFs heißen immernoch anders.. :-(
 
Zuletzt bearbeitet von einem Moderator:

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.218
Punkte für Reaktionen
1.038
Punkte
224
Tja, da gehen mir auch so langsam die Ideen aus. Ich habe gerade noch einmal in deine Konfiguration geschaut, die scheint aber auch in Ordnung zu sein. Ich gehe davon aus, dass du deine UID 1029 entsprechend ermittelt hast?
ich hab noch nicht gefunden, wo die überhaupt abgespeichert werden..
Also zum einen liegen alle verarbeiteten Dokumente in dem eingestellten Speicherpfad unter …/paperless/media/documents/originals. Da liegt allerdings keine Konfiguration, wenn man hier also die Dateien raus kopiert, müsste man sie in eine neue Instanz von Paperless wieder einlesen lassen, neu benennen etc.

Wenn man im Terminal in den Ordner der Konfiguration navigiert, über den Befehl

cd /volume1/docker/paperless/config

kann man dort gemäß Anleitung den Befehl

sudo docker-compose exec -T webserver document_exporter ../export

dann erstellt Paperless ein Back-up in den angelegten Exportordner. Der enthält neben der erstellten PDF noch ein Thumbnail und am Schluss mit der manifest.json und der version.json die Informationen, die man für die Wiederherstellung braucht.

Vorsicht: Die Wiederherstellung funktioniert nur dann, wenn man noch die gleiche Version von Paperless am laufen hat, unter der auch das Back-up erstellt wurde!

@EDvonSchleck hat an anderer Stelle mal geschrieben, dass man die Anleitungen von Marius mit Vorsicht genießen muss. Und ich kann dem insofern zustimmen, dass es immer besser ist, sich so lange mit diesen Projekten unter Docker auseinander zu setzen, bis man das selber versteht und einrichten kann, das erspart einem viel Ärger.
 
Zuletzt bearbeitet:

rmayergfx

Benutzer
Mitglied seit
05. Aug 2013
Beiträge
144
Punkte für Reaktionen
17
Punkte
18
Ich habe den code von MariusHosting etwas modifiziert:
bei environment:
PAPERLESS_FILENAME_FORMAT: "{created_year}/{correspondent}/{title}"

Die möglichen Variablen sind in der Doku gelistet.
Code:
Paperless provides the following placeholders withing filenames:
    • {asn}: The archive serial number of the document, or “none”.
    • {correspondent}: The name of the correspondent, or “none”.
    • {document_type}: The name of the document type, or “none”.
    • {tag_list}: A comma separated list of all tags assigned to the document.
    • {title}: The title of the document.
    • {created}: The full date and time the document was created.
    • {created_year}: Year created only.
    • {created_month}: Month created only (number 1-12).
    • {created_day}: Day created only (number 1-31).
    • {added}: The full date and time the document was added to paperless.
    • {added_year}: Year added only.
    • {added_month}: Month added only (number 1-12).
    • {added_day}: Day added only (number 1-31).

Das kann man auch nachträglich im Docker Container einpflegen, wenn man diesen zuerst stoppt.

Damit werden bei mir alle Dokumente sauber abgelegt.

Das hatte ich in einem anderen Forum gesehen und mir abgespeichert, vllt. ja für den einen oder anderen hiflreich:
Ich gebe als Tipp gerne noch folgende Umgebungsvariable für meine docker-compose.yml mit:
PAPERLESS_FILENAME_FORMAT: ‚{correspondent}/{created_year}/{title}‘
dies erzeugt im Archiv-Ordner (der Ort, an dem paperless-ngx die fertigen .pdf speichert) eine schöne Struktur, die sich im Falle eines „Auszuges“ bzw „Umzuges“ aus paperless-ngx direkt und einfach exportieren lässt und nach den eigenen Wünschen anpassen lässt. die Standard-Ordnung in dem Ordner ist nämlich flach (keine Unterordner) und inkrementierte Dateinamen (00000001.pdf und fortlaufend) was wirklich nicht sehr praktisch ist.
Sollte man sich für eine Struktur im Nachgang entscheiden, in den Stack eintragen (docker-compose.yml) und den Container neu bauen, sollte man sich auch in den Container einklinken und einmal die Funktion „document renamer“ aufrufen, damit vorhandene Dokumente der neuen Struktur angepasst werden.
steht aber alles auch in der Dokumentation ( https://paperless-ngx.readthedocs.io/en/latest/configuration.html#paths-and-folders Abschnitt „PAPERLESS_FILENAME_FORMAT“ und https://paperless-ngx.readthedocs.io/en/latest/administration.html#utilities-renamer für das nachträgliche Umbenennen… die entsprechenden Platzhalter werden hier einmal alle benannt https://paperless-ngx.readthedocs.io/en/latest/advanced_usage.html#advanced-file-name-handling )
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Funktioniert es denn jetzt?

Das Problem ist immer die richtige Beschreibung dessen und die getätigten Einstellungen. Wie schon @Monacum richtig erwähnte, habe ich mehrere Fehler bei Marius schon gefunden. Das Problem ist eigentlich das blinde kopieren nur damit man sich nicht mit dem Thema befassen muss.. Selbst mit der abgespeckten GUI ist fast alles möglich. Was nicht geht, kann man über SSH oder den Aufgabenplaner erledigen.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.218
Punkte für Reaktionen
1.038
Punkte
224
Es gibt für mich mittlerweile auch gar keinen Grund mehr, zwingend an Portainer festzuhalten. Wenn man einmal weiß, wo die Konfigurationsdatei liegt, dann kann man das auch ganz einfach über einen Text Editor darin erledigen und danach den Container neu starten. Da sehe ich für mich mit Portainer keinen Gewinn bei der Bedienung mehr.

Da geht es ja nur darum, die entsprechenden Befehle für das Terminal zu kennen und entsprechend auszuführen.
 
  • Like
Reaktionen: EDvonSchleck

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Vieles (99%) kann man bereits über die Synology-Docker-GUI einstellen. Diese wird mit DSM7.2 deutlich aufgebohrt! Das reicht für jeden „Normaluser“ vollkommen aus, wenn dieser nicht mit den Befehlen vertraut ist. Das restliche 1% ist sowieso eher nicht für den „Normaluser“, da es sich hierbei um spezielle Sachen handelt.

Es dient lediglich der Bequemlichkeit, sich mit dem Thema Docker auseinander zu setzen.
 
  • Like
Reaktionen: Monacum

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.218
Punkte für Reaktionen
1.038
Punkte
224
Gut zu wissen, dass da mit 7.2 nochmal was dazukommt.
 

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
Tja, da gehen mir auch so langsam die Ideen aus. Ich habe gerade noch einmal in deine Konfiguration geschaut, die scheint aber auch in Ordnung zu sein. Ich gehe davon aus, dass du deine UID 1029 entsprechend ermittelt hast?

Also zum einen liegen alle verarbeiteten Dokumente in dem eingestellten Speicherpfad unter …/paperless/media/documents/originals. Da liegt allerdings keine Konfiguration, wenn man hier also die Dateien raus kopiert, müsste man sie in eine neue Instanz von Paperless wieder einlesen lassen, neu benennen etc.

Wenn man im Terminal in den Ordner der Konfiguration navigiert, über den Befehl

cd /volume1/docker/paperless/config

kann man dort gemäß Anleitung den Befehl

sudo docker-compose exec -T webserver document_exporter ../export

dann erstellt Paperless ein Back-up in den angelegten Exportordner. Der enthält neben der erstellten PDF noch ein Thumbnail und am Schluss mit der manifest.json und der version.json die Informationen, die man für die Wiederherstellung braucht.

Vorsicht: Die Wiederherstellung funktioniert nur dann, wenn man noch die gleiche Version von Paperless am laufen hat, unter der auch das Back-up erstellt wurde!

@EDvonSchleck hat an anderer Stelle mal geschrieben, dass man die Anleitungen von Marius mit Vorsicht genießen muss. Und ich kann dem insofern zustimmen, dass es immer besser ist, sich so lange mit diesen Projekten unter Docker auseinander zu setzen, bis man das selber versteht und einrichten kann, das erspart einem viel Ärger.
Naja, man meint schon, es verstanden zu haben, so ist es nicht. Vieles lernt man auch über probieren...
Aber wenn dann auf einmal etwas derartiges passiert und eine nicht nachvollziehbare Umbenennung stattfindet, wie gesagt, abgelegt wird alles ja richtig, dann geht halt die rätselei los.. ich muss mich damit wohl abfinden, dass es irgendwo eine Variable gibt, die niemand kennt und die hier beim export den Vorrang hat...
 
Zuletzt bearbeitet:

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Geht es immer noch nicht? Ich habe deinen Beitrag #326 nicht ganz verstanden, ob das Problem jetzt gelöst wurde.
Installiere Paperless doch einfach neu und clean.
 

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
#326 war nicht ich ;-).

Ja eine Neuinstallation wird es wohl werden... Durch das Update hätten ja die Container alle erneuert werden müssen... Muss noch herausfinden, was dann alles gelöscht wird/werden muss.

Ich hatte das Thema auch parallel bei r/selfhosted angefragt, hier wurde auf das nächste Release verwiesen.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Ich erneuere meine Container automatisch mit Watchtower. Siehe hier.
Wenn du Zeit hast, kannst du bis zum nächsten Release noch abwarten.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.218
Punkte für Reaktionen
1.038
Punkte
224
Muss noch herausfinden, was dann alles gelöscht wird/werden muss.
Das „Programm“ also der Container ohne die eigenen Daten. Wenn alles glatt läuft, sollten die ganzen gespeicherten Daten eigentlich erhalten bleiben, es schadet aber nie, vorher ein Back-up zu machen.

Und ich habe von den anderen hier gelernt, dass man besondere Vorsicht walten lassen muss, wenn die entsprechende Datenbank-Version aktualisiert wird, also je nachdem, was du verwendest PostgreSQL, MySQL oder MariaDB.
 

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
Aber die neue Version wird dir angezeigt? Sprich in Portainer einmal neu deployen.
Ja, die Version 1.10.2 wird mir angezeigt, unten links. Watchtower habe ich nun auch eingerichtet.
Ich warte nun mal ab, vllt. wird es ja tatsächlich angepasst. Wirklich nachvollziehen kann ich es nicht, selbst wenn ich meine eigene PAPERLESS_FILENAME_FORMAT - Variable entferne, oder einen anderen Speicherpfad wähle, immer wird diese "falsche" Benennung genutzt.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Schau dir doch einfach Watchtower an. Den Code musst du nur in eine Aufgabe einfügen und ausführen. Wenn der Container automatisch installiert und gestartet wird, wird jeden morgen um 4 nach Updates gesucht und installiert. Einfacher geht es nicht mehr.
 
  • Like
Reaktionen: Almaran

Almaran

Benutzer
Mitglied seit
13. Jun 2015
Beiträge
67
Punkte für Reaktionen
5
Punkte
8
Danke, wie gesagt, habe ich nun eingerichtet um zumindest diese Fehlerquelle auszuschließen.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Schau morgen in den Container> Detail >Log, denn kannst du sehen, ob etwas aktualisiert wurde.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat