Paperless-ngx Paperless-ngx – DMS via Docker auf dem NAS

Dog6574

Benutzer
Mitglied seit
15. Sep 2014
Beiträge
181
Punkte für Reaktionen
1
Punkte
18
wat ist denn jetzt watchtower...beim letzten mal ging das update mächtig in die hose und ich dachte schon es ist alles weg....inzwischen möchte ich auf paperless nicht mehr verzichten
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
15.029
Punkte für Reaktionen
5.400
Punkte
564
Ist ja auch kein Ding. Watchtower kann alle Container für dich updaten.
Kannst aber auch manuell machen. Einmal Image neu pullen und fertig. Wird aber bei mehreren Containern irgendwann zu aufwendig.
Und bei dir (und vielen anderen) war ja nicht das paperless Update schuld, sondern das Update der postgres-DB, was ja nun bei dir nach "Festsetzen der Version" nicht mehr passieren sollte
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
beim letzten mal ging das update mächtig in die hose
Ich gehe mal davon aus, dass wir hier vom Update der Datenbank reden, oder? 😉 bei Paperless-ngx selber kannst du unbesorgt sein, was das betrifft.
 
  • Like
Reaktionen: Tuxnet

rhinopeak

Benutzer
Mitglied seit
16. Okt 2023
Beiträge
7
Punkte für Reaktionen
0
Punkte
1
@Monacum:
zu 1. ja, zwei OCR-Texte in einem Dokument sind nicht besonders sinnvoll - außer wenn der zweite OCR Text (der den ersten überschreibt) deutlich schlecher wäre wie der erste - aber es wäre auch sehr hinderlich wenn ich in einem OCR PDF ein Stichwort suche und dann an der selben Stellen zwei Mal angezeigt bekommen, wenn der Text zwei Mal gespeichert ist am Dokument.
Und inzwischen halte ich es für sehr wahrscheinlich, dass paperless zusätzlich den OCR Text auch in der Datenbank ablegt - sonst wäre eine Volltextsuche so gut wie unmöglich.
zu 3. erneuter Versuch das Bild1 anzuhängen, ja das sind Attribute der Datei. Schade, dass paperless seine tags nicht auch als Atribute an der archived Datei speichert, sowie schon bestehende Atribute aus der Originaldatei nutzen kann (und wenn ich mir was wünschen dürfte, sollte paperless das "date created" als "date modified" ebenfalls an der archived Datei speichern). Das würde die einfache Nutzung der wichtgsten Metadaten langfristig garantieren und untrennbar mit der Quelle verbinden. Denn jedes DMS ist nach zehn Jahren möglicherweise und nach zwanzig Jahren wahrscheinlich nicht mehr am Markt. Die PDFs dagegen werden wahrscheinlich viele Jahrezehnte nutzbar sein (jetzt immerhin schon 31 Jahre) - und das wäre gerade in der Ahnenforschung sehr wünschenswert, da reden wir von Nutzung für einigen Generationen.

Auf jeden Fall hast Du mir schon sehe geholfen und ich werde wohl paperless bald installieren. Und mittelfristig versuchen eigene Mechanismen zu entwickeln, wie ich die wichtgsten Metadaten (also date created, tags und der orginale Dateiname) an die archived Dateien bekomme - vielleicht auch noch an die orignal Dateien.

PS: wobei ich vermutlich auf 2.0 warten sollten, um nicht gleich am Anfang einen komplizerten Upgrade machen zu müssen.
 

Anhänge

  • Bild1.jpg
    Bild1.jpg
    63,8 KB · Aufrufe: 14

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Das Update der Paperless-Versionen ist untereinander kein Problem, Schwierigkeiten machen eigentlich „nur“ die Major-Updates von PostgreSQL, wenn man da die Version fixiert, ist das also auch kein Problem. Oder anders: Auf die Veröffentlichung von v2 musst du deswegen nicht warten.

Hast übrigens recht, der Text ist in der db gespeichert.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Das ist natürlich deine Entscheidung, aber das Upgrade eines Docker Containers ist nicht tatsächlich nicht kompliziert.
 

macmaniac

Benutzer
Mitglied seit
17. Okt 2010
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hallo Zusammen.

Hat jmd. von Euch eine Idee, warum bei meiner paperless Installation Umlaute (über den Karteireiter Inhalt) nicht korrekt angezeigt werden? Lasse ich OCR von paperless durchführen sind die Umlaute korrekt vorhanden. Wenn jedoch OCR über eine externe App (quickscan, scanner pro, adobe) durchgeführt wird, sind diese nicht korrekt dargestellt.

EDIT: Als Zusatzhinweis, über "Universal Search" werden in der Originaldatei die Texte korrekt indiziert und auch entsprechend gefunden (mit Umlaut)...

Danke für Eure Hinweise,
Marco
 

Anhänge

  • Umlaute.png
    Umlaute.png
    26,2 KB · Aufrufe: 6
Zuletzt bearbeitet:

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Ich kann dir leider nicht sagen, woran das liegt, außer dass ich mir vorstellen könnte, dass es an einem anderen verwendeten Zeichensatz in einer deiner verwendeten Apps liegt. Um das ganze aber zu verhindern, könntest du folgenden Parameter in deine Konfiguration mit aufnehmen:

Und dann schaust du einfach mal, wie die Ergebnisse sind.
 

macmaniac

Benutzer
Mitglied seit
17. Okt 2010
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Danke, aber das möchte ich eigentlich vermeiden, da die Erkennung über die Apps schon merklich besser (und auch deutlich schneller) ist. Ich habe mal in das Protokoll des Containers geschaut. Kann es etwas damit:

perl: warning: Setting locale failed.
perl: warning: Please check that your locale settings:
LANGUAGE = (unset),
LC_ALL = (unset),
LANG = "de_DE.UTF-8"
are supported and installed on your system.
perl: warning: Falling back to the standard locale ("C").

etwas zu tun haben? Normal nutzt er C.UTF-8, im Container ist wohl auch nur das und POSIX aktiv auf der DS aber auch die de_DE...

Wie bekomme ich denn die richtige Sprache in den Container?
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Das ist der Befehl direkt über dem, den ich dir eben geschickt habe:


Default ist hier „eng“ für die englische Sprache. Ob das was ändert, kann ich dir aber nicht sagen, musst du ausprobieren.
 

Dog6574

Benutzer
Mitglied seit
15. Sep 2014
Beiträge
181
Punkte für Reaktionen
1
Punkte
18
Hallo.

Also um die Updates zu laden brauche ich doch nur den jeweiligen Stack stoppen und dann das Image neu laden (repull) oder?

Gruß,
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224

Paperless-ngx v2.0.0

Repository: paperless-ngx/paperless-ngx · Tag: v2.0.0 · Commit: c075642 · Released by: github-actions[bot]

paperless-ngx 2.0.0​

Breaking Changes​

  • Breaking: Rename the environment variable for self-signed email certificates @stumpylog (#4346)
  • Breaking: Drop support for Python 3.8 @stumpylog (#4156)
  • Breaking: Remove ARMv7 building of the Docker image @stumpylog (#3973)

Notable Changes​

Features​

Bug Fixes​

  • Fix: Add missing spaces to help string in document_retagger @joouha (#4674)
  • Fix: Typo invalidates precondition for doctype, resulting in Exception @ArminGruner (#4668)
  • Fix: Miscellaneous visual fixes in v2.0.0-beta.rc1 2 @shamoon (#4635)
  • Fix: Delay consumption after MODIFY inotify events @frozenbrain (#4626)
  • Documentation: Add note that trash dir must exist @shamoon (#4608)
  • Fix: Miscellaneous v2.0 visual fixes @shamoon (#4576)
  • Fix: Force UTF-8 for exporter manifests and don't allow escaping @stumpylog(#4574)
  • Fix: plain text preview overflows @shamoon (#4555)
  • Fix: add permissions for custom fields with migration @shamoon (#4513)
  • Fix: visually hidden text breaks delete button wrap @shamoon (#4462)
  • Fix: API statistics document_file_type_counts return type @shamoon (#4464)
  • Fix: Always return a list for audit log check @shamoon (#4463)
  • Fix: Only create a Correspondent if the email matches rule filters @stumpylog(#4431)
  • Fix: Combination of consume template with recursive tagging @stumpylog (#4442)
  • Fix: replace drag drop & clipboard deps with angular cdk @shamoon (#4362)
  • Fix: update document modified time on note creation / deletion @shamoon(#4374)
  • Fix: Updates to latest imap_tools which includes fix for the meta charset in HTML content @stumpylog (#4355)
  • Fix: Missing creation of a folder in Docker image @stumpylog (#4347)
  • Fix: Retry Tika parsing when Tika returns HTTP 500 @stumpylog (#4334)
  • Fix: get highest ASN regardless of user @shamoon (#4326)
  • Fix: Generate secret key with C locale and increase allowed characters @stumpylog(#4277)
  • Fix: long notes cause visual overflow @shamoon (#4287)
  • Fix: Ensures all old connections are closed in certain long lived places @stumpylog(#4265)
  • CI: fix playwright browser version mismatch failures @shamoon (#4239)
  • Fix: Set a non-zero polling internal when inotify cannot import @stumpylog (#4230)
  • Fix: Set permissions before declaring volumes for rootless @stumpylog (#4225)
  • Documentation: Fix fuzzy matching details @stumpylog (#4207)
  • Fix: application of theme color vars at root @shamoon (#4193)
  • Fix: Trim unneeded libraries from Docker image @stumpylog (#4183)
  • Fix: support doc_pk storage path placeholder via API @shamoon (#4179)
  • Fix: Logs the errors during thumbnail generation @stumpylog (#4171)
  • Fix: remove owner details from saved_views api endpoint @shamoon(#4158)
  • Fix: dashboard widget card borders hidden by bkgd color @shamoon (#4155)
  • Fix: hide entire add user / group buttons if insufficient permissions @shamoon(#4133)
 
  • Like
Reaktionen: Tuxnet

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
Ich habe die letzten Wochen bereits den v2.0.0-rc1 installiert gehabt und sowohl der Wechsel von 1.17.4 auf v2.0.0-rc1 als auch der heutige Wechsel von v2.0.0-rc1 zurück auf latest (v2.0.0) hat ohne Probleme und Fehlermeldungen funktioniert.
 
  • Like
Reaktionen: Tuxnet

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.138
Punkte für Reaktionen
724
Punkte
154
Das Update hat bei mir auch soweit geklappt, nur wenn ich die Benutzer & Gruppen aufrufe, bekomme ich eine Meldung:

paperless.png
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
  • Like
Reaktionen: Tuxnet

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.138
Punkte für Reaktionen
724
Punkte
154
Das Update hat bei mir auch soweit geklappt, nur wenn ich die Benutzer & Gruppen aufrufe, bekomme ich eine Meldung:
Okay, war eine ganz simple Geschichte: In den Rechten fehlte das Recht, die Gruppen anzuzeigen.

paperless2.png
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.195
Punkte für Reaktionen
1.022
Punkte
224
  • Like
Reaktionen: Tuxnet

Biernot78

Benutzer
Mitglied seit
26. Okt 2018
Beiträge
50
Punkte für Reaktionen
3
Punkte
8
Hallo auch bei mir läuft die neue Version 2.0.1 super aber ich habe im Stack immer noch stehen:

db:
image: postgres:15.4
container_name: Paperless-NGX-DB
restart: always

sollte ich hier auf die neuste postgres wechseln oder nicht ?

Gibt es hier eine Anleitung wie man das macht ?
 

myssv

Benutzer
Mitglied seit
27. Okt 2019
Beiträge
198
Punkte für Reaktionen
30
Punkte
28
Ich habe noch folgendes

db:
image: docker.io/library/postgres:13
container_name: db
restart: unless-stopped
volumes:

Dann hänge ich meine Version in die Frage mal mit ein ...
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat