Paperless-ngx Paperless NGX - Import Office Dokumente

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.185
Punkte für Reaktionen
1.014
Punkte
224
Nein, Tika und Gotenberg ist vor allem für Office-Dokumente und eml-Dateien; das Einlesen von Mails und deren Anhängen funktioniert auch ohne die beiden Ergänzungen.
 
  • Like
Reaktionen: Tuxnet und ub.privat

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
15.029
Punkte für Reaktionen
5.400
Punkte
564

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.185
Punkte für Reaktionen
1.014
Punkte
224
Nein, ich muss tatsächlich sagen, dass ich Tika und Gotenberg nicht mehr nutze. Ich habe das vor knapp einem Jahr mal installiert gehabt, aber nie Dokumente gehabt, die ich hätte einlesen müssen, von daher kann ich da leider kein aktuelles Feedback geben.
 

ub.privat

Benutzer
Mitglied seit
14. Nov 2022
Beiträge
17
Punkte für Reaktionen
0
Punkte
1
Hallo @plang.pl und @Monacum,
so richtig scheint es keine Lösung für den Import von Office-Dokumenten zu geben. Ich würde es einfach mal im Auge behalten und warten was noch so kommt.
Gibt es den andere Lösungen um Office-Dokumente in P-NGX zu überführen? Die Dokumentenflut besteht ja nicht nur aus PDF-Dateien.
Ist sicher ein großer Wunsch...
 

alexhell

Benutzer
Sehr erfahren
Mitglied seit
13. Mai 2021
Beiträge
2.831
Punkte für Reaktionen
853
Punkte
154
Naja @plang.pl hat ja geschrieben, dass es wohl am Kernel liegt. Synology macht leider keine Updates davon. Das heißt es wird nicht auf der Synology laufen. Auf einem Linux mit einem aktuellen Kernel läuft ja alles.
 
  • Like
Reaktionen: ub.privat

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.185
Punkte für Reaktionen
1.014
Punkte
224
Die Dokumentenflut besteht ja nicht nur aus PDF-Dateien.
Die Lösung besteht derzeit anscheinend darin, aus den Office-Dateien selbst PDFs zu machen, bevor man sie in Paperless-ngx einliest. Ich weiß auch nicht, ob mit dem nächsten Update von DSM auf 7.2 der Kernel angepackt wird (Container Manager wird ja wohl ein Update bekommen), vermute aber mal, dass nicht.
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
15.029
Punkte für Reaktionen
5.400
Punkte
564
Nein, der Kernel wird m.E. mit ziemlicher Sicherheit nicht angepackt. Die neue Docker Version unter der Haube wird wohl sehr wahrscheinlich auch nix an der Problematik ändern.
 

renfiela

Benutzer
Mitglied seit
27. Dez 2023
Beiträge
14
Punkte für Reaktionen
6
Punkte
53
Hallo zusammen,

also bei mir auf einer DS920+ läuft der Import reibungslos. Ich weiß, dass das nicht unbedingt hilfreich ist und ich weiß auch nicht, wie es sich bei den unterschiedlichen DS* Versionen mit dem Kernel verhält. Dennoch sollte bei gleicher CPU wie bei einer DS720+ der Kernel nicht unterschiedlich sein.
Meine Version lautet 4.4.302+

Bash:
INFO  [qtp310212872-19] 08:58:22,341 org.apache.tika.server.core.resource.TikaResource /tika (application/vnd.openxmlformats-officedocument.spreadsheetml.sheet)
INFO  [qtp310212872-15] 08:59:13,115 org.apache.tika.server.core.resource.MetadataResource /meta (application/vnd.openxmlformats-officedocument.spreadsheetml.sheet)
INFO  [qtp310212872-17] 08:59:14,878 org.apache.tika.server.core.resource.MetadataResource /meta (application/vnd.openxmlformats-officedocument.spreadsheetml.sheet)
Bash:
INF ts=1705049918.4421957 logger=api msg=request handled trace=4f2944a8-3795-4679-bb91-27b0a3709f84 remote_ip=172.19.0.2 host=gotenberg:3000 uri=/forms/libreoffice/convert method=POST path=/forms/libreoffice/convert referer= user_agent=python-httpx/0.25.2 status=200 latency=14779127586 latency_human=14.779127586s bytes_in=9067 bytes_out=19993

mappe.png
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
15.029
Punkte für Reaktionen
5.400
Punkte
564
Das würde mich auch interessieren. Ich hab es nach mehreren Versuchen nicht geschafft, dass der Import wieder funktioniert. Auch nicht älteren Versionen von Gotenberg.
 

ub.privat

Benutzer
Mitglied seit
14. Nov 2022
Beiträge
17
Punkte für Reaktionen
0
Punkte
1
...da wären wir schon drei, die auf die Anleitung von @renfiela mächtig gespannt sind! Ich bin mir sicher, dass es da noch weitere Interessierte, Verzweifelte und Wissbegierige gibt.
 

ub.privat

Benutzer
Mitglied seit
14. Nov 2022
Beiträge
17
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

Wunder geschehen! Ohne zutun - ausser update auf paperles-ngx 2.4.3 funktioniert nun der Office-Import!
1707229614346.png
Gotenborg steht auf latest.
Ich denke, mit jedem PULL hat sich bestimmt auch da etwas getan!?

Für mich ist das Thema hiermit gelöst, besser weiter unter Beobachtung!

VG
Uwe
 

ub.privat

Benutzer
Mitglied seit
14. Nov 2022
Beiträge
17
Punkte für Reaktionen
0
Punkte
1
... Naja den PULL muß ich ja eh für die Aktualisierung von Paperless machen. Ist also ein Aufwasch. Habe nicht dran geglaubt, aber es geschehen halt Softwarewunder! Bis zum nächsten Update... Heul
 

MartinOe

Benutzer
Mitglied seit
10. Feb 2021
Beiträge
13
Punkte für Reaktionen
1
Punkte
3
Hallo @ub.privat,

kannst du erklären was du wie installiert hast? Ich sehe zwei Container einer mit Tika und einer mit gotenberg.
Danke.
M
 

cookie_s23

Benutzer
Mitglied seit
10. Jun 2024
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Hallo Zusammen
neuere Erkenntnisse?
habe mir von mariushosting die paperless ngx installalation verabreicht auf ds224+ und läuft soweit.
Marius bietet ja auch eine Version mit office Support an, und ich überlegte ob ich diese bevor ich meine ganzen Dokumente einpflege, noch mal neu installieren soll. Jetzt allerdings probierte ich mit der Nicht Office Installation ein wenig herum (umfasst meiner begrenzten Ansicht nach auch Gutenberg und Tika) und ich bekam teilweise den weiter oben genannten Fehler mit "service unavailable", nicht allerdings bei einem excel Dok. Einige Stunden später gehts nun sogar mit doc und docx Dokumenten. Allerdings kam bei einer .eml dann wider der bekannte Fehler.
Was kann mir/uns das nun sagen? Ist es doch nun ein Problem, dass der Gutenberg Server, der das pdf erstellt oft überlastet ist? Vielleicht könnt ihr jan auch neues berichten?
Es grüsst Cookie
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.185
Punkte für Reaktionen
1.014
Punkte
224
@cookie_s23 Gotenberg und Tika sind die beiden Container, die den Office-Support ermöglichen; da ich beides nicht verwende, kann ich nicht viel dazu sagen. Außer, dass Gotenberg kein „Server“ für irgendeine Umwandlung deiner Dateien ist, das passiert alles auf deinem NAS.
 

cookie_s23

Benutzer
Mitglied seit
10. Jun 2024
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
@Monacum
Ja ich habe verstanden :) .
Ich habe jetzt auch die Version mit Office Support von Mariushosting installiert, also die Compose Variante, besser gesagt, die mit Gotenberg 7 und redis 16 läuft. Ich habe nun xlc, doc und .eml Dateien problemlos importieren und verarbeiten können. Die wurden auch indexiert. Gruss Cookie
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.185
Punkte für Reaktionen
1.014
Punkte
224
Tiptop, danke für deine Rückmeldung!
 

NurIch

Benutzer
Mitglied seit
10. Jun 2024
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich verwende Paperless-ngx nun auch seit einiger Zeit. Anfangs hat es mit dem Import von Office-Dateien nicht geklappt. Ich hatte da wie immer bei Redis, Tika bzw. Gotenberg den Link und Port eingefügt, hier bekam ich dann beim Importversuch einer Officedatei immer eine Fehlermeldung. Erst als ich anstelle des Link bei z.b Tika den localhost (=192.168.x.x:9998) mit zugehörigem Port verwendet habe, hat es auch mit dem Import der Officedateien geklappt.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat