Paperless-ngx Paperless-ngx: Ein kurzer Erfahrungsbericht sowie ein erstes Resümee

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.655
Punkte für Reaktionen
1.439
Punkte
194
Ich hatte das immer mal wieder bei verschiedenen Installationen.

Gerade das Ghostscript Problem war mal ne ganze Weile aktuelle .


Genau man kann sowas alles umgehen .
Aber die meisten gehen ja nur nach irgendwelchen Anleitungen .
Und gerade im Business muss es einfach laufen .


Da bist mir Ner Bezahlsoftware einfach besser dran
 

Eru94

Benutzer
Mitglied seit
18. Nov 2024
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Vielen lieben Dank für die schnellen, guten Antworten. Das die Software die Anforderungen nicht erfüllt, war mir so nicht bewusst und auch das Thema Handling... Sagen wir mal so, Probleme in dem Bereich kann ich selbst kaum lösen, bin da fast immer auf Dritte angewiesen. Daher schau ich mich erstmal nach was passendem um. Könnt ihr was empfehlen?
Danke & einen schönen Abend
 

ScannerRenner

Benutzer
Mitglied seit
03. Dez 2024
Beiträge
1
Punkte für Reaktionen
0
Punkte
0
Ich habe selbst Probleme gehabt Paperless-ngx erfolgreich aufzusetzen. Vielleicht bin ich einfach zu doof aber ich bin aus der Dokumentation einfach nicht schlau geworden. Habe aber einen Dienstleister gefunden, der Paperless-ngx für schmales Geld für mich auf Servern innerhalb von Deutschland hostet. Ich muss mich jetzt um nichts mehr kümmern und alles läuft reibungsfrei.
 

guidovg

Benutzer
Contributor
Mitglied seit
26. Nov 2011
Beiträge
149
Punkte für Reaktionen
51
Punkte
34
Ich habe gerade den Thread quer gelesen und kann u.a. hinter alle Beiträge von @Tommes einen Haken machen. Mein aktueller Workflow für Dokumente ist (Post -> Scanner | PDF) -> Inbox-Ordner -> SynOCR für OCR und Benennung -> Ablage in _OUTPUT. Von hier werden die Dokumente von Hand in die passenden Ordner geschoben. Ich mache das nicht automatisch, damit ich bei Fehlern korrigieren kann und das Gefühl des "Überblicks" habe. Am PC finde ich alle Dokumente per Copernic Desktop Search. Meine Herausforderung war: Finden von Dokumenten am iPAD, sowohl meines als auch das meiner Frau.
Unsere Ablage passt aktuell so gut zu unserem Lebensstil, dass die größte Herausforderung bei Dokumenten die Klassiker (Kfz-Rechnung, Ablage bei PKW oder Rechnung) bzw. (Zahnarzt-Rechnung, Gesundheitsordner oder Rechnung) sind.

Mittlerweile "poppt paperless-ngx wie Seuche" auf der NAS. Dokumente gehen in den consume Ordner und alles flutsch. Meine Hemmnisse sind eher, wie aufwendig werden Supportfälle, wie einfach können Backups wieder hergestellt werden, was erwartet mich mit der postgresql DB und wie motiviere ich meine Frau mit paperless zu arbeiten (O-Ton: "Ach das finde ich auch mit der Synology Files App!")

Daher frage ich mich gerade passen Aufwand und Nutzen zusammen. Paperless als Toll ist beeindruckend.

Wie gesagt mich quält die Frage nach dem Aufwand/Restore: Ich habe jetzt den postgres DB Ordner ausserhalb des Dockers gemountet und erstelle per Skript täglich Backups. Die Anwendung kann ich per Container-Manager Projekt jederzeit wiederherstellen. Muss man da noch mehr vorbereiten? Eigentlich müsste ich jetzt mal den Worst-Case simulieren alles löschen und schauen, ob ich es wiederhergestellt bekomme. Da sind wir dann wieder beim Aufwand.

Wie sehr bereitet Ihr Euch auf Support-Fälle vor und testet Ihr Eure Backups regelmäßig, damit Ihr im Fall der Fälle wiederherstellen könnt?
 

Kachelkaiser

Benutzer
Sehr erfahren
Mitglied seit
22. Feb 2018
Beiträge
2.291
Punkte für Reaktionen
1.010
Punkte
174
Danke für diesen Post. Ich stehe auch gerade davor, unsere Ablage neu zu organisieren. Bin gerade in der Überlegung, starte ich mit SynOCR oder gehe ich auf paperless? Der Supportpunkt ist vor allem in Hinblick auf den WAF nicht unwichtig. Bin gespannt.
 
Zuletzt bearbeitet:

wegomyway

Benutzer
Sehr erfahren
Mitglied seit
03. Aug 2022
Beiträge
1.477
Punkte für Reaktionen
632
Punkte
184
Ich nutze synOCR, der Anfang (wie fast üblich bei mir) etwas holprig, aber nun läuft es.
Nutze 3 Profile mit jeweils eigenen Scripten, YAML-Editor lässt grüßen, und auf dem ADS1700er sind die Schnelltasten eingerichtet. Was als Papierform „sicherungswürdig“ daherkommt, geht über den 1700er mit entsprechend genutzter Schnelltaste.
In der Regel sind die Unterlagen für Wohnung, Sommerwohnsitz, Stromabrechnungen, Kfz-Steuer, Versicherungen, Finanzamt-Sachen und sowas in dieser Art. Stelle ich fest, dass es hier nicht wie erhofft dort landet, wo es soll, wird flugs die TXT-Datei erweitert oder modifiziert. Da dieses „fehl gescannte“ Doku ja im Dokumentenorder liegt, kann ich es direkt nach Änderung der TXT-Datei in den Input schieben und sehe gleich das Ergebnis. DAS mache ich direkt im DSM über Drive. Die Anfänge waren öfter mal „eingreifen“ inzwischen aber ist das eher eine Ausnahme. Dauer dann keine 3–5 Minuten und fertig.
AMAZON beispielsweise, da die Rechnungen ja elektronisch vorliegen, schiebe ich direkt in den dafür vorhandenen Input rein, und von da dann landet das im Ordner für Amazon. Da gab es gewisse Probleme mit den Umlauten „Üü, Ää und Öö“ die aber inzwischen auch gelöst sind.
Auch verschiebe ich ab und an Dokus übern Explorer/Netzwerk direkt in die jeweiligen Input-Ordner und lass machen. Klappt auch gut.
Die Volltextsuche innerhalb des Ordners Dokumente (darunter sind die Unterordner bis max. 2te Ebene) funktioniert ebenso klaglos. Auch unterwegs mit der mobilen App Drive (da als Nutzer eingerichtet und NICHT als ADMIN. DER werkelt wenn nur im heimischen WLAN oder mittels WG-VPN).
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Kachelkaiser

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.268
Punkte für Reaktionen
74
Punkte
68
Guten Abend!
Ich schaue mir seit heute Paperless an und stoße schon auf meine erste Grenze:
Habe ein Dokument hochgeladen, wo das Wort "Rentenversicherung" vorkommt, sowie auch die Jahreszahl 2024.

Nun dachte ich, ich könnte folgenden Suchbegriff eingeben: Rente 2024
Leider wird dazu nichts finden.

Jemand eine Idee?
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.863
Punkte für Reaktionen
1.842
Punkte
314
Suchanfrage anpassen!
 
Zuletzt bearbeitet von einem Moderator:

rabbithole

Benutzer
Mitglied seit
02. Feb 2023
Beiträge
37
Punkte für Reaktionen
5
Punkte
8
Vermutlich kommt mindestens einer der beiden Suchbegriffe nicht (oder nicht exakt so) in maschinenlesbarer Form (OCR?) in Deinem Dokument vor.
 

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.268
Punkte für Reaktionen
74
Punkte
68
doch, wenn ich einzeln danach suche, "Rente" oder "2024", kommt das Dokument.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.863
Punkte für Reaktionen
1.842
Punkte
314
Schau mal in die Doku von Paperless-ngx im Abschnitt „Searching“ dort steht was, wie man eine Volltextsuche gestalten kann. Ich habe in diesem Zusammenhang aber auch gelesen, das es einen Unterschied zwischen der „normalen“ Suche und der „erweiterten“ Suche gibt. Bei letzterem sollten mehrere Wörter auch zu Treffern führen, im Gegensatz zu ersteren. Ansonsten… TAGs nutzen.
 

Ghost108

Benutzer
Mitglied seit
27. Jun 2015
Beiträge
1.268
Punkte für Reaktionen
74
Punkte
68
tatsächlich klappt es mit der erweiterten Suche! Kann man diese als Standard einstellen?
 
  • Like
Reaktionen: Tommes

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.863
Punkte für Reaktionen
1.842
Punkte
314
Da bin ich überfragt, nutze ich Paperless-ngx doch überhaupt nicht mehr. Aber schön, das es funktioniert.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.227
Punkte für Reaktionen
1.040
Punkte
224
Ja, Einstellungen öffnen und den Punkt „Vollständige Suche führt zu“ auf „Erweiterte Suche“ ändern und speichern.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: maxblank

Elinea

Benutzer
Mitglied seit
27. Okt 2019
Beiträge
42
Punkte für Reaktionen
14
Punkte
8
Moin,

kurz mein Senf zum Tool Paperless NGX. Ich habe es vor gut 2 Jahren auf der Synology in Betrieb genommen und stehe aktuell bei ~1700 Dokumenten in unserer Datenbank. Ich scanne mit Paperless unser E-Mail-Eingangsordner und nutze einen Brother Dokumentenscanner. Alle eingehenden Dokumente (PDFs) bekommen ein INBOX Tag und ich sichte sie, nachdem die interne KI (ich nenne sie mal so) die meisten relevanten Feder ausgefüllt hat. Danach gebe ich die Dokumente in die Datenbank und durch Paperless erstellt Ordnerstruktur frei. Echt ein easy Job. Durch das Forum hier, habe ich sehr viele Tipps zu den Backup Einstellungen erhalten und schon einmal einen Datenbank Fehler (versehetliches Postgres Release Update gemacht) ohne großen Aufwand wiederherstellen können. Ich nutze die Dokumente aus Paperless z.B. für unseren Steuerberater Termin, Hausabrechnung und auch bei der Suche nach Rechnungen für Garantiefälle. Ich möchte das Tool nicht mehr missen. Heute habe ich von einer Weiterentwicklung Paperless AI gelesen. Das klingt für mich sehr interessant, wobei ich aktuell sehr gut zurechtkomme mit Tags, Korrespondenten und Dokumenttypen. Ich hoffe Verlinkungen sind hier erlaubt, da ich gerne auf die folgende Seite verweisen möchte, die mir super geholfen hat, mit dem Tagging richtig umzugehen: Codeberg.

Tolles Forum hier und ein toller Umgang miteinander. Vielen Dank dafür...
 
  • Like
Reaktionen: deltapapa und Tommes

JohneDoe

Benutzer
Mitglied seit
06. Jan 2025
Beiträge
110
Punkte für Reaktionen
48
Punkte
28
Als ich von Paperless AI gelesen habe, wollte ich es auch mal ausprobieren. Aber da ich keine KI lokal laufen habe und mein Setup auch nicht wirklich ausreichen würde, habe ich es gelassen. Ansonsten landen die Dokumente bei einem Drittanbieter (Open AI) und das geht die wirklich nichts an.
 
  • Like
Reaktionen: Elinea

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.863
Punkte für Reaktionen
1.842
Punkte
314
Ach komm @JohneDoe … du hast es nur nicht hingekriegt, das ans laufen zu bekommen und jetzt redest du es einfach schlecht 😂😂😂😂 … sorry, aber ich hab manchmal komische Gedanken. Ich verschwinde auch schon wieder…
 

JohneDoe

Benutzer
Mitglied seit
06. Jan 2025
Beiträge
110
Punkte für Reaktionen
48
Punkte
28
Um ehrlich zu sein habe ich es nicht mal probiert :D
Will ja meine Dokumente nicht mit denen teilen :)
 

killing joke

Benutzer
Mitglied seit
05. Jan 2025
Beiträge
15
Punkte für Reaktionen
5
Punkte
3
Moin an die Runde,

auch ich interessiere mich für paperless ngx habe allerdings bisher keine großartigen Erfahrungen mit Docker/Portainer und der Art von Dokumenten Management Systemen. Die Frage ist, ob es das richtige für mich / uns ist, weshalb ich hier mal kurz meine Bedürfnisse in den Spoiler schreibe, in der Hoffnung, dass dies der richtige Thread ist. Ich habe hier und da zwar schon einige Threads gefunden, aber so einen richtigen Erfahrungsaustausch-Thread (außer diesen hier) habe ich nicht gefunden. Meine Fragen kommen dann weiter unten.

Als Hardware stehen zur Verfügung:
  • ein Synology NAS DS923+ (2x 1 TB M.2; 3x 14 TB HDD; +1x 32 GB RAM),
  • ein QNAP NAS TS 509 Pro und
  • ein Netzwerkscanner (Epson ES 580W).
Das Synology soll als das produktives System fungieren. Das QNAP ist derzeit mein Datengrab und soll für das Synology zur Datensicherung zur Verfügung stehen (no backup, no mercy). Der Scanner dient natürlich als Scanner.

Docker (wenn ich das richtig verstanden habe, bei DSM 7.2.2 = Portainer genannt) dient ja als erste Grundlage, damit paperless ngx laufen kann. Ist eine Installation auf dem M.2 Laufwerk sinnvoll? Und welche Datenbank verwende ich am besten?

Wir sind zwei Personen im Haushalt. Wir würden paperless ngx nur einmal installieren und die Daten dennoch "getrennt" verwalten wollen. Hierbei soll meine Partnerin auf Ihre und auf unsere und ich auf meine und unsere Dokumente zugreifen können. Wie ist das am besten zu realisieren, wenn berücksichtigt werden soll, dass am Ende die Dokumente auch zumindest in 3 Ordnern liegen sollen ("Mein Ordner"; "Ihr Ordner"; "Unser Ordner"). Sollte schon beim Scanner die Auswahl eines von 3 ScanInput-Ordnern erfolgen oder kann hier auch mit der Namensgebung (vorangestellte Kürzel) gearbeitet werden und in einem Scan-Input-Ordner gepusht werden? Können die Scan-Originale nach der Verarbeitung durch paperless ngx aus dem ScanInput-Ordner gelöscht werden?

Als Namensoutput für die einzelnen Dokumente stelle ich mir folgendes vor „20250115_Korrespondent_ggf.Kundennummer/Kontonummer_Thema“. Ist das realisierbar? Weiterhin würden wir mit Tags arbeiten, haben uns aber noch keine großartigen Gedanken gemacht, welche Tags wir verwenden würden. Die „alten“ Jahre bzw. alte Dokumente würden wir irgendwann dann aus paperless ngx herauslösen wollen um diese ins Datengrab zu schieben, daher eben auch die Benennung.


Weiterhin fragen wir uns, wie wir mit „noch“ nicht fertiggestellten Dokumenten umgehen sollen? Wie berücksichtigt ihr diese Dokumente? Wenn der Word-Brief noch nicht fertiggestellt ist oder die Briefvorlage noch nicht fertig ist.

Fragen:
1. Auf welchen Festplatten installiere ich die Docker/Portainer - paperless ngx-Instanz am besten? Auf der 3x14 TB HDD SHR oder auf der 2x 1 TB M.2 SHR?

2. Welche Datenbank empfehlt ihr? Postgre, MariaDB, etc. und warum? Auch unter Berücksichtigung, das die Datenbank und die Dokumente regelmäßig gesichert werden sollen.

3. Wie realisiere ich am Ende 3 „Ausgabe“-Ordner (Ordner „Ich“; Ordner „Sie“; Ordner „Unser“)? Scannen in drei unterschiedliche Ordner oder in einen Ordner mit vorangestelltem Kürzel?

4. Können die Scan-Originale nach der Verarbeitung durch paperless ngx aus dem ScanInput-Ordner gelöscht werden? (befinden diese sich dann "Ausgabe-Ordner"?

5. Wie löst ihr die Problematik von Dokumenten, die am Rechner erst erstellt werden (z. B. Briefe im Word-Format)?

6. Lässt sich die Namensgebung der Dateien durch paperless ngx automatisieren?

Ich bin zwar ein Anfänger im Bereich Linux und ähnlichen Systemen (erste Erfahrungen mit Raspberry Pi 2 und 3) und DSM aber ich bin lesewillig (und nur manchmal etwas ungeduldig, weil Plug-n-Play schon cool ist… 😊 )

Danke für eure Unterstützung.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.227
Punkte für Reaktionen
1.040
Punkte
224
  1. Ist egal, macht nach meiner Erfahrung auf SSD nicht den riesigen Performance-Unterschied
  2. Am einfachsten ist tatsächlich MariaDB, weil bei Major Updates keinerlei Aktionen deinerseits erforderlich sind. Funktionieren tut am Ende des Tages aber jede ordentlich eingerichtete Datenbank
  3. Es gibt nur einen Input-Ordner und in dem werden grundsätzlich alle Dokumente gescannt. Alles weitere läuft dann nachher in der Verarbeitung in Paperless. Und dann kannst du beispielsweise eigene Dateipfade anlegen, sodass die Dokumente unterschiedlicher Personen in unterschiedlichen Ordnern landen und dann über die Berechtigungen regeln, dass nicht jeder alles sehen kann. Und um eines direkt klar zu machen: Paperless erledigt die Arbeit. Du pfuschst auf gar keinen Fall an irgendwelchen Dateinamen herum, das zerschießt dir nämlich das ganze System. Paperless ist ein Dokumentenmanagement-System und regelt das alles selbst.
  4. Die können nicht nur gelöscht werden, auch hier arbeitet Paperless völlig von alleine und erstellt ein Original und eine Archivversion mit der von dir angestoßenen Verarbeitung. Das Original wird danach aus dem Input-Ordner gelöscht.
  5. Bitte die Dokumentation von Paperless lesen, hier insbesondere den Teil zu Gotenberg/Tika.
  6. Bitte die Dokumentation von Paperless lesen.
Generell empfehle ich hier immer, sich mit den Grundlagen von Docker und auch über die Dokumentation mit den Grundlagen von Paperless vertraut zu machen, weil nur das sicherstellt, dass man bei Problemen nicht gleich das ganze System zerschießt. Alles Adam und Eva an zu erklären, sprengt hier den Rahmen. Wenn dann im Betrieb noch einzelne kleine Fehler auftreten, kann man hier immer nochmal nachsteuern.
 
  • Like
Reaktionen: killing joke


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat