Mal wieder Paperless-ngx und die Pfade :-)

Questman

Benutzer
Mitglied seit
26. Okt 2017
Beiträge
15
Punkte für Reaktionen
0
Punkte
7
Moin!
Ich habe hier Paperless-ngx auf einer DS916i unter Docker laufen. Funktioniert soweit :)
Allerdings komme ich mit den Pfaden absolut nicht klar. Evtl. bin ich zu doof :) Aber ich hoffe hier wird auch mal nem Doofen geholfen. :)

Normalerweise speichert Paperless die über den Ordner "consume" eingelesenen Dateien ja in einer Ordnerstruktur unterhalb vom Dockerorder. Bei mir ist das auf dem NAS in der Filestation: docker\paperlessngx\media.....

Wenn ich in Paperless nun Pfade anlege werden die Dokumente schön brav unterhalb des Mediaordners abgelegt. Funktioniert, aber DAS will ich aber absolut nicht.

Ich möchte/muss auch mal ohne Paperless direkt via z.B. Fileexplorer auf die Dokumente zugreifen. Daher liegen meine Dokumente sauber (wie früher) in einer Ordnerstruktur auf dem NAS in einem freigegebenen Ordner außerhalb von der Dockerstruktur. Was kann/muss ich in Paperless einstellen/angeben damit ein Dokument was z.B. in "consume" gescannt wird in eben dieser Struktur abgelegt wird? Also z.B. unter Daten\DMS\Rechnungen\2024.... Mit neuen Einträgen unter "Speicherpfade" bin ich nicht zum Ziel gekommen.

Wäre cool wenn ich da eine Antwort zu bekommen könnte die auch meine Schwiegermutter verstehen würde. Bitte Schwiegermutter nicht überschätzen :)

Greetz Kai-Uwe
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.191
Punkte für Reaktionen
766
Punkte
154

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.216
Punkte für Reaktionen
1.035
Punkte
224
Und die entsprechenden Ordnerrechte für den „neuen“ Ordner müssen natürlich so vergeben sein, dass der Docker-User darauf zugreifen kann.
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.191
Punkte für Reaktionen
766
Punkte
154
Und deiner Schwiegermutter sagen, dass sie da keine Dokumente verschieben oder löschen darf... ;)
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.216
Punkte für Reaktionen
1.035
Punkte
224
Das ist vermutlich der wichtigste Tip 😆
 

Questman

Benutzer
Mitglied seit
26. Okt 2017
Beiträge
15
Punkte für Reaktionen
0
Punkte
7
@Questman Lies dir mal das hier durch, das müsste dir eigentlich helfen:
https://docs.paperless-ngx.com/advanced_usage/#file-name-handling

Und du musst natürlich in deinem Container deinen gewünschten Ordner in den Media-Ordner verweisen.
Das hatte ich gelesen,hilft mir nur leider nicht weiter. Hab da in meiner Frage wohl auch was vergessen. Die Dateien kommen schon mit „fertigen“ Dateinamen im consume Ordner an. Die Dateinamen sollen also nicht von Paperless angefasst werden.

Dann: „Und du musst natürlich in deinem Container deinen gewünschten Ordner in den Media-Ordner verweisen.“….wie geht das ? 😳 Docker ist da nicht meine Welt und soll/wird es wohl auch nicht werden.

Greetz Kai-Uwe

PS: Das mit Schwiegermutter lässt sich klären 😆😆
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.191
Punkte für Reaktionen
766
Punkte
154
Wie hast du denn den Container angelegt?

Du müsstest auf jeden Fall eine Angabe in diesem Sinne in deinem Container finden:
Code:
/meinvolume/meinpfad:/usr/src/paperless/media

Und den musst du anpassen.

Wenn du schon Dokumente importiert hast, musst du die in den gewünschten Ordner kopieren. Und wie @Monacum schon sagte, der Docker-User muss Rechte auf den Ordner haben.

Aber du solltest dich wirklich mit den Grundfunktionen eines Containers auseinander setzen, das hier kann dir auch bei anderen Containern über den Weg laufen...
 
  • Like
Reaktionen: Monacum

Questman

Benutzer
Mitglied seit
26. Okt 2017
Beiträge
15
Punkte für Reaktionen
0
Punkte
7
Erstmal Danke für die Hilfe! So schnell hab ich da nicht mit gerechnet! Super!

Also, angelegt hab ich da nach der Anleitung unter https://mariushosting.com/how-to-install-paperless-ngx-on-your-synology-nas/.

Sowas „/meinvolume/meinpfad:/usr/src/paperless/media“ in der Art hatte ich auch schon gefunden. Das vor dem Dopppelpunkt wäre wohl der Pfad an dem die Dateien physikalisch liegen und nach dem Doppelpunkt der Pfad unter dem Paperless sie dan quasi „sieht“. Oder?

Nur wo trage ich das (die Pfade) ein. Oder ist das dann tatsächlich die Angabe die ich in Paperless eintrage wenn och einen neuen Pfad anlege? Das Wäre dann ja nichtmal so kompliziert. Nur echt doof erklärt/beschrieben.

Die Rechte vergebe ich ja im DSM. „Wem“ gebe ich denn da die Rechte. Ich als DSM-User habe ja die entsprechende Rechte. Mit der Docker User ist wohl der jeweilige User gemeint der sich an Paperless anmeldet?

Bis jetzt habe ich keine Dokumente importiert. Mal ein/zwei zum Testen und die dann auch wieder gelöscht. Wenn das alles mal funktioniert würde ich meinen “alten“ Dokumente Root umbenennen, die Struktur leer neu erstellen um dann Ordnerweise nach und nach die Dokumente in „consume“ zu schieben, von Paperless analysieren zu lassen und ihnen dann die jeweiligen Pfade zuweisen. Dann müssten alle Dokumnenie ja wieder unter gleichem Namen am alten Ort sein aber auch in Paperless erfasst. Zumindest ist das mein Ziel.

Nochmal Greetz von mir und der unbekannten Schwiegermutter 😳
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.216
Punkte für Reaktionen
1.035
Punkte
224
Das hatte ich gelesen,hilft mir nur leider nicht weiter. Hab da in meiner Frage wohl auch was vergessen. Die Dateien kommen schon mit „fertigen“ Dateinamen im consume Ordner an. Die Dateinamen sollen also nicht von Paperless angefasst werden.
Das funktioniert nicht und das ist nicht die Idee hinter Paperless-ngx – sondern der Container verwaltet die Daten und damit deren Inhalt, alle vergebenen Parameter wie Korrespondent und Tags etc und auch den Dateinamen und Speicherort nach Deinen Vorgaben, wenn es eingelesen ist. Wenn Dir das in dein bisheriges System nicht passt, wirst du etwas anderes nutzen müssen wie synOCR von @geimist.
 
  • Like
Reaktionen: Adama

Questman

Benutzer
Mitglied seit
26. Okt 2017
Beiträge
15
Punkte für Reaktionen
0
Punkte
7
SynOCR kannte ich nicht. Hab mir das mal eben schnell angesehen. Ist interessant, ist aber auch nicht das, was ich möchte. Das Dateihandling mit SynOCR scheint wirklich viel einfacher zu sein. Was mir dann aber komplett fehlt ist die Oberfläche um z.B. nach bzw. in Dokumenten zu suchen. Das ist in Paperless schon genial gelöst. Und ja, eigentlich muss man sich mal von gewohnten Dingen lösen, hier die gewohnte Ordnerstruktur. In meinem Fall geht das aber ja leider nicht da ich an anderer Stelle darauf angewiesen bin.

Am coolsten wäre eine Lösung, bei der ich nur mein vorhandenes und über viele Jahre aufgebautes Dokumente Root angeben muss. Dann müssten alle Dokumente vom Tool abgearbeitet werden und in einer durchsuchbaren Datenbank erfasst werden. Ohne irgendwas zu verschieben oder umzubenennen. Fertig!

Ich bin u. A. in der Musikbranche unterwegs. Da wird das mit Audiofiles so gemacht. Beispiel LexiconDJ, EngineDJ, Serato, Recordbox etc. Das sind quasi alles Datenbanken mit denen die Audiofiles erfasst, katalogisiert, in Playlisten gesteckt etc. werden. Die Files selber bleiben wo sie sind und werden auch nicht umbenannt. Es sei denn man möchte das explizit. Dann geht das auch.

Greetz Kai-Uwe….Jetzt muss ich in die Küche! Frauchen hat gebacken und ich darf mich um den Zuckerguss kümmern 😜🌲
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.191
Punkte für Reaktionen
766
Punkte
154
Das ist hier in diesem Fall nicht der grundsätzliche Sinn, man kann es erreichen, man kann aber dadurch aber auch Paperless durcheinander bringen (Schwiegermutter und Dateien verschieben etc.)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.397
Punkte
234
Was mir dann aber komplett fehlt ist die Oberfläche um z.B. nach bzw. in Dokumenten zu suchen.
synOCR dient vor allem dem (unaufälligen) Workflow beim Erfassen, sortieren und taggen. Es ist halt keine Dateiverwaltung. Suchen und Finden geht dann über die Ordnerstruktur oder dank OCR per Volltextsuche (Drive, Spotlight, ect.).
So stellt sich nicht erst die Frage, was bei einem Systemwechsel passiert oder falls synOCR mal gestorben sein sollte.
 

Laola1

Benutzer
Mitglied seit
21. Mrz 2018
Beiträge
304
Punkte für Reaktionen
175
Punkte
99
Meine wichtigen Dokumente und auch Scan´s landen in meinem persönlichen Homeverzeichniss\Scan.

Von dort werden die Dokumente alle 6 Stunden per Aufgabe in den Docker\Consum Ordner kopiert, aber nur das, was innerhalb der letzten 1500 Minuten dort gespeichert wurde.
Also etwas mehr als genau einen Tag alte Dkumente.
Vielleicht hilft dir das ja weiter, und du kannst deine Struktur so belassen wie sie ist.

Natürlich musst du bei Interesse das Script nach deinen Pfaden anpassen, -1500 sind die Minuten.
Wenn du das Script angenommen alle 2 Stunden laufen lässt, reichen technisch gesehen auch genau 121 Minuten.
Ich habe es so großzügig eingestellt, und alle 6 Stunden bügelt er wieder drüber bis die 24Stunden erreicht sind, aber das ist im Grunde völlig Wurscht, Paperless erkennt die Duplikate und verwirft sie sowieso.
Diese bleiben auch nicht als Leichen im Consumeordner liegen, die werden sauber entsorgt, der Consume Ordner ist quasi immer leer.

1734976799667.png
1734976837357.png
1734976881143.png

Script:

find /volume1/homes/xxxyyyzzz/Dokumente/Scan/ -type f -mmin -1500 -exec rsync -a --no-relative {} /volume1/docker/paperless-ngx/consume/ \; > /dev/null 2>&1
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat