Paperless-ngx Paperless NGX - Import Office Dokumente

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Ich finde es gut – du musst das als Archiv sehen, wo du schnell Dokumente nach Inhalt wieder findest. Da ist ein umdenken deiner GöGa angesagt. Der Name ist weniger wichtig und es wird hauptsächlich mit Tags und Labels. Somit entfallen die oft messihaft angelegten Ordner und Unterordner. Die Suche erledigt den Rest. Wenn du also ein Dokument von den Stadtwerken suchst, werden diese auch angezeigt, die originale werden nicht verändert und die erzeugten, mit OCR versehenden *PDF noch einmal in einer separaten Hierarchie gespeichert.

Ich würde es erst einmal testen und verstehen, was die App alles macht. Danach wird einiges klaren. Der Sinn dahinter ist es ja, das ganze zu vereinfachen. Das muss man aber auch wollen und zu lassen!
 
  • Like
Reaktionen: spooner

*kw*

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
10. Aug 2013
Beiträge
2.842
Punkte für Reaktionen
1.379
Punkte
174

aliofredi

Benutzer
Mitglied seit
09. Apr 2017
Beiträge
14
Punkte für Reaktionen
0
Punkte
1
Funktioniert nun durch die vorgeschlagene Änderung auf gotenberg 7.4 und den " ports: - 3000:3000" .
DANKE für die prompte Unterstützung!
 

Plamsarelais

Benutzer
Mitglied seit
18. Dez 2022
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Einfach die gewünschte Versionsnummer in den Stack einfügen:
image: gotenberg/gotenberg:7.4
Versuche einmal eine ältere Version, die neue macht Probleme! Ich verwende 7.4.
Hi an alle,
ich habe mich nur hier registriert um "Danke" zu sagen. Ich habe leider keine Synology, aber auf meinem ubuntu-Server hatte ich auch das oben erklärte Problem, dass gotenberg einen Fehler brachte und ich keine Word-Dateien einpflegen konnte. Der Hinweis auf die Version 7.4 war offenbar entscheiden! Tausend Dank!
VG
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Hallo zusammen. Ich bekomme es einfach nicht zum laufen. Laut der folgenden Fehlermeldung wird bei mir hinter der Gotenberg URL etwas angehängt was natürlich nicht funktioniert. Ports und Container passen soweit. Je,mand eine Idee wie ich das korrigieren kann? Anbei mein Compose-File.
documents.parsers.ParseError: Error while converting document to PDF: 400 Client Error: Bad Request for url: http://gotenberg:3000/forms/libreoffice/convert#/forms/chromium/convert/html

Compose:
version: "3.4"
services:
broker:
image: docker.io/library/redis:7
restart: unless-stopped
volumes:
- /volume3/docker/paperless/redisdata:/data

webserver:
image: ghcr.io/paperless-ngx/paperless-ngx:latest
restart: unless-stopped
depends_on:
- broker
ports:
- 8777:8000
healthcheck:
test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
interval: 30s
timeout: 10s
retries: 5
volumes:
- /volume3/docker/paperless/data:/usr/src/paperless/data
- /volume3/docker/paperless/media:/usr/src/paperless/media
- /volume3/docker/paperless/export:/usr/src/paperless/export
- /volume2/DMS/paperless-upload:/usr/src/paperless/consume
environment:
PAPERLESS_REDIS: redis://broker:6379
USERMAP_UID: 1026
USERMAP_GID: 100
PAPERLESS_TIME_ZONE: Europe/Berlin
PAPERLESS_OCR_LANGUAGE: deu+eng
PAPERLESS_FILENAME_FORMAT: '{created_year}/{correspondent}/{created}-{added}_{title}'
PAPERLESS_TIKA_ENABLED: 1
PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000/forms/libreoffice/convert#
PAPERLESS_TIKA_ENDPOINT: http://tika:9998

tika:
image: ghcr.io/paperless-ngx/tika
container_name: prod_aw_tika-01
restart: always

gotenberg:
image: gotenberg/gotenberg:7.4
command:
- 'gotenberg'
- '--chromium-disable-javascript=true'
- '--chromium-allow-list=file:///tmp/.*'
- '--chromium-disable-routes=true'
container_name: prod_aw_gotenberg-01
restart: always
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Steck doch einfach alle Container in einem neuen Bridge-Netzwerk.
Auch reicht als URL aus:
Code:
PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000

Im welchem Netzwerk laufen die Container jetzt? Synology Bridge?
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Hallo und danke für die Rückmeldung.

Das Kürzen der URL verbessert die Situation nicht.

Error while converting document to PDF: 404 Client Error: Not Found for url: http://gotenberg:3000/forms/chromium/convert/html

Die Container liegen in keinem speziellen Netzwerk und die Ports werden auch nicht nach außen gereicht. Alle Container sind untereinander erreichbar, das kann es nicht sein.



Gruß


PS: Liegen im "default" Netz.
PPS: woher kommt der "chromium" Teil in der URL?
 
Zuletzt bearbeitet:

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Die Container liegen in keinem speziellen Netzwerk und die Ports werden auch nicht nach außen gereicht. Alle Container sind untereinander erreichbar, das kann es nicht sein.

PS: Liegen im "default" Netz.
Das könnte dein Problem sein, habe ich aber schon geschrieben. Erstelle in der Synology-Docker-GUI ein separates Netzwerk und importiere alle Paperless-Contanier in diesem Netzwerk!


1675270470091.png

1675270414312.png

Alternativ kannst du auch Gotenberg einen externe Port zuweisen. Die Netzwerkmethode ist aber die sauberste Lösung und die Kommunikation findet nicht über das Host-System statt.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Erstelle in der Synology-Docker-GUI ein separates Netzwerk und importiere alle Paperless-Contanier in diesem Netzwerk!
Habe das gerade mal aus „Spaß“ ausprobiert – wenn ich das Netzwerk selbst erstelle, klappt das bei mir nicht, endet mit einem Internal Server Error (500) und damit, dass sich der Paperless-Container ständig neu startet. In meiner .yml ist nichts spezifisch fürs Netzwerk hinterlegt, sodass er sich sein eigenes Netzwerk selbst schafft, wenn man mit docker-compose up -d den Container startet. Hast du nochmal irgendwas in deiner .yml dazu spezifiziert?
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Ich habe kein .yml. Deshalb kann ich ja mit den Containern spielen, wie ich will. :love:
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Hallo, die Container sind doch in einem eigenen Netzwerk. Erreichen sich ja auch über die Ports!

Hab eben mal in Portainer geschaut. Warum also nochmal ein anderes Netzwerk erstellen? Das Problem muss was anderes sein. Bei euch steht in der URL auch immer libreoffice und nicht chromium wie bei mir. Denke da liegt der Fehler...

 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Wenn das alle Container sind, fehlt aber einer, der für die Datenbank.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Schon klar, aber wenn die Datenbank nicht im Container ist und du nicht EDvonSchlecks Lösung verwendest (was du augenscheinlich nicht tust), wie kommuniziert dann die Datenbank mit Webserver und Broker?
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Du hast in deiner yml auch nichts spezifiziert an Datenbank. Die Infos zur Datenbank müssen aber irgendwo stehen, woher soll Paperless sonst wissen, wo die liegt?

Der healthcheck auf Port 8000 (dem internen des Containers) macht übrigens in deiner yml keinen Sinn, der muss auf den gemappten Port 8777.
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Es greift über meine Freigabe zu "data:/usr/src/paperless/data" auf die Datei db.sqlite3 zu.

Es gibt keinen Container zu einer Sqlite: https://github.com/paperless-ngx/pa...docker/compose/docker-compose.sqlite-tika.yml

Hat auch nichts mit meinem Problem zu tun. Paperless funktioniert ja reibungslos. 🤷‍♂️

Die angebotene Lösung ist ein neues Netzwerk. Was sollte der Unterschied zum aktuellen sein? Netzwerk ist Netzwerk. Egal ob ich es paperless nenne oder in meinem Fall folgendermaßen:

1675283974713.png
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Nee das läuft richtig gut. :cool: "Es" war auf das Thema "Import Office Dokumente" bezogen.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Ich denke, dein Containername ist das Problem. Benenne den Container in Gotenberg um.
 

starmagoo

Benutzer
Mitglied seit
07. Apr 2022
Beiträge
32
Punkte für Reaktionen
7
Punkte
8
Der Containername hat nichts mit dem Hostnamen zu tun. Ich erreiche (ping + TCP) den Container ja unter "gotenberg" wie hier zu sehen ist: https://www.synology-forum.de/threads/paperless-ngx-import-office-dokumente.123333/post-1054874

Ich glaube nicht das es ein Netzwerkproblem ist.

Error while converting document to PDF: 404 Client Error: Not Found for url: http://gotenberg:3000/forms/chromium/convert/html

Mache ich den Port 3000 außerhalb des Containers erreichbar erhalten ich hier:

http://192.168.178.3:3000/forms/chromium/convert - ein "Not Found"

und hier:

http://192.168.178.3:3000/forms/libreoffice/convert - ein "Method Not Allowed"

Paperless fragt immer: http://gotenberg:3000/forms/chromium/convert/html

Wie kann ich das ändern?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat