Paperless-NGX - andere Ordner nutzen als bei der "Forum-Installation"

Jesse69

Benutzer
Mitglied seit
22. Aug 2008
Beiträge
60
Punkte für Reaktionen
3
Punkte
8
Moin,
ich habs nun in einigen Anläufen schon zum laufen bekommen und muss zugeben, dass man das mit dieser fantastischen Anleitung hier und den vielen Lösungen zu Fragen die dabei aufkommen können schon ganz gut schaffen kann. STARK HIER!
Abweichend vom Standard hab ich nun noch die MariaDB und ein ausgelagertes "scaninput" Verzeichnis und nun versuch ich noch das Archiv auf Dokumente zu ändern.
Zu blöd ! Ich !

Code:
services:
  broker:
    image: docker.io/library/redis:7
    restart: unless-stopped
    volumes:
      - redisdata:/data

  db:
    image: docker.io/library/mariadb:11
    restart: unless-stopped
    volumes:
      - dbdata:/var/lib/mysql
    environment:
      MARIADB_HOST: paperless
      MARIADB_DATABASE: paperless
      MARIADB_USER: paperless
      MARIADB_PASSWORD: paperless
      MARIADB_ROOT_PASSWORD: paperless

  webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    container_name: paperlessngx
    restart: unless-stopped
    privileged: true
    depends_on:
      - db
      - broker
    ports:
      - "34343:8000"
    volumes:
      - /volume1/scaninput:/usr/src/paperless/scaninput
      - /volume1/Dokumente:/usr/src/paperless/media/documents
    environment:
      PAPERLESS_REDIS: redis://broker:6379
      PAPERLESS_DBENGINE: mariadb
      PAPERLESS_DBHOST: db
      PAPERLESS_DBUSER: paperless
      PAPERLESS_DBPASS: paperless
      PAPERLESS_DBPORT: 3306
      PAPERLESS_MEDIA_ROOT: /volume1/Dokumente

volumes:
  dbdata:
  redisdata:
Nun noch die .env

Code:
USERMAP_UID=1026
USERMAP_GID=100
PAPERLESS_OCR_LANGUAGE=deu
PAPERLESS_TIME_ZONE=Europe/Berlin
PAPERLESS_MEDIA_ROOT=/usr/src/paperless/media
PAPERLESS_FILENAME_FORMAT = {created_year}/{correspondent}/{created}

Und ich hoffe, dass ihr nun schon seht wo ich was falsch mache.

Keine Ahnung wo mein Knoten nun wirklich steckt, aber die Dokumente werden weder umbenannt noch nach Dokumente verschoben. Wenn ich es gut hinbekomme, dann landen sie eben im Standard "archive" (/volume1/docker/paperlessngx/media/documents/archive) - mein Wunsch ist aber eben /volume1/Dokumente

Beste Grüße in ein sehr nahes Pfings-Wochenende
Jesse
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
Was ich schonmal sehe: An den Environments musst du den Pfad NICHT anpassen. Dem Container ist egal, wo die Daten auf dem Host liegen, wenn das Mapping richtig ist. Also ist das PAPERLESS_MEDIA_ROOT: /volume1/Dokumente falsch
 

Jesse69

Benutzer
Mitglied seit
22. Aug 2008
Beiträge
60
Punkte für Reaktionen
3
Punkte
8
Das hab ich nun auskommentiert, neugestartet und das eigestellte Dokument landet auch (namentlich unbearbeitet) in "
..archive"
 
Zuletzt bearbeitet von einem Moderator:

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
In archive landen auch die unbearbeiteten Dokumente. Das passt. Die bearbeiteten landen bei mir in /usr/src/paperless/media/documents/originals
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Ähm... ist es nicht genau umgekehrt? Die unbearbeiteten Dokumente landen im Order /originals und die bearbeiteten (PDF/A) Dokumente landen im Ordner /archive
 
  • Like
Reaktionen: Benie

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
Alter Finne! Ich muss ehrlich sagen, dass das auch von der Benennung mehr Sinn machen würde. Da muss ich mich glatt mal ransetzen und die Mappings anpassen. Das würde bedeuten, dass ich es nun über Jahre falsch verwendet habe :ROFLMAO:
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Du kannst alt werden wie eine Kuh und lernst immer noch dazu 😉
 
  • Haha
Reaktionen: *kw* und plang.pl

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
BTW: Ich synchronisiere mir jeden Morgen über den DSM-Aufgabenplaner die Daten per rsync aus dem Ordner /volume1/docker/paperlessngx/media/documents/originals nach /volume1/Dokumente/Dokumentenmanagement und greife nur lesend auf letztgenannten Ordner zu, falls ich mal nicht Paperless-ngx für eine kurze Recherche bemühen will. Somit liegen die Daten zwar doppelt vor, aber bei aktuell 200 MB an Daten lässt sich das durchaus verkraften. Alternativ könnte man natürlich auch einen SymLink erstellen.
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
Ich synce die Daten via syncthing lesend auf meine mobilen Endgeräte und via Drive mit dem Desktop. Die Daten, die ich synce sind eben die gemappten Daten des Containers. Nur halt anscheinend der falsche Ordner :)
Also meine paperless Daten liegen quasi direkt im Dokumente-Share auf dem NAS und nicht im docker-Ordner.
 

alexhell

Benutzer
Sehr erfahren
Mitglied seit
13. Mai 2021
Beiträge
2.831
Punkte für Reaktionen
855
Punkte
154
@Tommes wieso nicht einfach das Mapping ändern und die Dokumente direkt in den Zweiten Ordner packen? Dann liegen die Dokumente am gewünschten Ort und du musst nichts syncen :)
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Hm.. au man. Na klar. Warum nicht direkt so...
YAML:
volumes:
      - /volume1/Dokumente/Dokumentenmanagement:/usr/src/paperless/media/documents/originals

Dann sollte ich die übrigen Ordner unter /usr/src/paperless/media wohl besser auch mappen, richtig? Also so...
YAML:
volumes:
      - /volume1/docker/paperlessngx/media:/usr/src/paperless/media/documents/archive
      - /volume1/docker/paperlessngx/media:/usr/src/paperless/media/documents/thumbnails

Wäre das so korrekt? Ich will am Ende ja auch meine Persistenten Daten mit Hyper Backup wegsichern und wieder einspielen können, sollte Docker irgendwann mal abrauchen.
 
  • Like
Reaktionen: alexhell

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
Ja, so habe ich das auch gemacht.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Bevor ich das jetzt ausführe! Stimmen die Pfade so?
YAML:
volumes:
      - /volume1/docker/paperlessngx/media:/usr/src/paperless/media/documents/archive
      - /volume1/docker/paperlessngx/media:/usr/src/paperless/media/documents/thumbnails

... oder muss es nicht eher heißen...
- /volume1/docker/paperlessngx/media/documents/archive:/usr/src/paperless/media/documents/archive
- /volume1/docker/paperlessngx/media/documents/thumbnails:/usr/src/paperless/media/documents/thumbnails
 

alexhell

Benutzer
Sehr erfahren
Mitglied seit
13. Mai 2021
Beiträge
2.831
Punkte für Reaktionen
855
Punkte
154
Die linke Seite ist egal. Das legst du selber fest. Nur die rechte Seite ist relevant
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Okay. Ich hab es jetzt so gelöst und es scheint zu funktionieren (... nachdem ich während des deployen des Stacks kurz geschwitzt habe)

YAML:
volumes:
      - /volume1/docker/paperlessngx/data:/usr/src/paperless/data
      - /volume1/docker/paperlessngx/export:/usr/src/paperless/export
      - /volume1/docker/paperlessngx/media/documents/archive:/usr/src/paperless/media/documents/archive
      - /volume1/docker/paperlessngx/media/documents/thumbnails:/usr/src/paperless/media/documents/thumbnails
      - /volume1/Dokumente/Dokumentenmanagement:/usr/src/paperless/media/documents/originals
      - /volume1/Dokumente/Posteingang:/usr/src/paperless/consume

Prima! Es wird immer besser...
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Also da stimmt aber irgendwas nicht. Ich habe grade einen neuen Korrespondenten und einen neuen Datentypen angelegt und wollte nun fröhlich weiter meine Dokumente nach Paperless-ngx portieren. Scheinbar werden mir die Daten aber immer noch in den Ordner /volume1/docker/paperlessngx/media/documents/originals geschrieben und nicht nach /volume1/Dokumente/Dokumentenmanagement. Muss ich das jetzt verstehen?
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.403
Punkte
564
Das kann eigentlich nicht sein.
- /volume1/Dokumente/Dokumentenmanagement:/usr/src/paperless/media/documents/originals
Hattest du nicht geschrieben, dass dort die nicht bearbeiteten hinkommen? Dann ist das doch bei dir nun auch falsch, oder?
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Die nicht bearbeiteten PDF-Dokumente, die ich entweder in den /consume Ordner werfe oder über die GUI zur Verarbeitung auswähle, speichert Paperless-ngx unter /originals. Diejenigen, die Paperless-ngx durch den OCR-Prozess gejagt und entsprechend modifiziert hat, liegen unter /archive. So jedenfalls verstehe ich das.
Zitat von hier

Paperless stores archived PDF/A documents alongside your original documents. These archived documents will also contain selectable text for image-only originals. These documents are derived from the originals, which are always stored unmodified.

Da ich im Ordner /Dokumente/Dokumentenmanagement gerne auf die originalen PDF-Dokumente zugreifen würde, möchte ich gerne den Inhalt des Ordners /originals dorthin mappen und nur den. Das funktioniert bei mir jedoch nicht. Scheinbar kann ich nur den kompletten Ordner /usr/src/paperless/media nach /Dokumente/Dokumentenmanagement mappen, aber das möchte ich nicht. Daher synchronisiere ich aktuell wieder mittels rsync, wie oben bereits beschrieben.
 
Zuletzt bearbeitet:

alexhell

Benutzer
Sehr erfahren
Mitglied seit
13. Mai 2021
Beiträge
2.831
Punkte für Reaktionen
855
Punkte
154
Das ist sehr komisch.... Der Container kennt ja den Ordner gar nicht auf deinem Host. Da müsste irgendwas falsch konfiguriert sein.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.811
Punkte für Reaktionen
1.772
Punkte
314
Hä? Ich will doch nur das Mapping von ursprünglich…
- /volume1/docker/paperlessngx/media:/usr/src/paperless/media
… nach …
- /volume1/Dokumente/Dokumentenmanagement:/usr/src/paperless/media/documents/originals
… umleiten. Das funktioniert bei mir aber nicht. Vermutlich (habe es nicht getestet) kann ich nur den kompletten Ordner /media mappen, also so…
- /volume1/Dokumente/Dokumentenmanagement:/usr/src/paperless/media
… was ich aber nicht möchte. Den /consume Ordner konnte ich dagegen ohne Probleme nach /volume1/Dokumente/Dokumenteneinwurf mappen.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat