Paperless-ngx DMS - Fragen zu paperless-ng

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Ich hab' den Test jeweils nur einmal laufen lassen, Zeiten sind aus dem Log über Portainer gezogen:

ABB_Recovery_Media_Creation_Guide_ger.pdf
52,664 s

Syno_AdministratorsGuide_ActiveBackup_Business_enu.pdf
66,573 s

Synology_ABB_admin_guide_Virtual_Machines_enu.pdf
47,334 s
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
wird wohl an der CPU liegen, wobei die nicht wirklich ausgelastet ist und eher bei 12% Auslastung liegt mit Spitzen 1-2sek von 38%.
Ich denke das ist schlecht programmiert oder umgesetzt und alles in Python.

Ach ist nach noch mehrmaligen Test Sqlite schneller als Postgres, wen du das testen magst einfach einmal die Postgres-Einträge in den Einstellungen von Paperless entfernen. Würde gerne issen ob die werte auch bei dir ca. 15% besser sind.
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Nicht zu vergessen, dass ich ja auch SSD-Cache nutze, macht ja vielleicht auch noch einen Unterschied... Und die Frage wäre ja auch, ob die Prozessorgeneration in deiner Syno schon dieselben Erweiterungen hat wie in meiner, liegen ja doch ein paar Jahre dazwischen. Liegen ja doch ein paar Differenzen zwischen unseren Maschinen vor. Hattest Du gesagt, welche DSM-Version du nutzt? Ich bin ja da mittlerweile sogar auf die 7.1RC gegangen...

Sqlite: Da muss ich mal schauen, ob und wann ich das schaffe, das auch mal zu testen...
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
das mag sein, bin noch bei DSM7 natürlich ohne SSD/Cache - das kommt bei der nächsten ;)
Der Test würde mich aber interessieren, da im Netz diverse Beiträge zu finden sind mit langsamer Postgres Datenbank in Verbindung mit Python.

Das ändert zwar jetzt nichts an meiner HArdware, würde aber gerne für die Datentenbanken eine eigene Meinung bilden. denn wenn du im Netz 1000 Beiträge findest, gibt es dazu 2000 Meinungen und 3000 Benchmarks
 

Darkwing9

Benutzer
Mitglied seit
09. Jun 2013
Beiträge
188
Punkte für Reaktionen
0
Punkte
16
Nachdem ich mit der OCR Verarbeitungsgeschwindigkeit und auch der Texterkennungsqualität so meine Probleme hatte habe ich jetzt eine gute Lösung für meine Wünsche und Anforderungen gefunden. Ich scanne mit einem Epson Scanner die Dokumente ein, lasse im Hintergrund automatisch Document Capture Pro die OCR Verarbeitung durchführen und lege das fertige PDF automatisch im Consume Ordner von paperlessngx ab.

In diesem Fall sind die PDFs sofort in paperlessngx mit deutlich besserer Texterkennung und kleinerer Dateigröße vorhanden. Auch die automatische Zuordnung funktioniert aufgrund der wirklich beeindruckenden Texterkennung nun sehr gut. Über die Tags und sonstigen Merkmale in paperless wird der Dateinamen festgelegt und nach der Zuordnung in paperlessngx gespeichert.

Jetzt kann ich über die Volltextsuche die Dokumente auf der Dateiebene im Explorer suchen, ich kann über die Ordnerstruktur und Dateinamen suchen und ich kann auch die Suche in paperlessngx auf Basis der Verschlagwortung und Volltext durchführen. Der Epson scannt 40 Seiten Duplex in der Minute und die Verarbeitung in Document Capture Pro geht absolut schnell und vollautomatisch. Der einzige Nachteil ist, dass ich für die OCR-Verarbeitung meinen PC laufen lassen muss.

Für mich aktuell die perfekte und unaufwändigste Lösung. Mein ecoDMS System werde ich in den nächsten Wochen in Rente schicken und nur noch für die Recherche nutzen. Alle neuen Dokumente kommen jetzt ins paperlessngx System. Wenn ich Lust und Laune habe werde ich die wichtigen Dokument ins paperlessngx übernehmen.
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
… ich habe jetzt auch etwas mit den Umgebungsvariablen gespielt und die Texterkennung ist jetzt um einiges besser … es werden auch keine Punkt/Strich Dokumente mehr durch Paperless erzeugt … ich werde weiter rumprobieren … Ordner Kategorien etc. habe ich mich noch gar nicht beschäftigt …

Wozu sind die Tags da und wie richte ich die ein?
 
Zuletzt bearbeitet:

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Ich hab' mir zum Beispiel welche für den Bearbeitungszustand erstellt:

paperless.PNG
Alle Dokumente, die ich importiere, stehen damit erstmal auf "Unbearbeitet"...

Du kannst damit halt zusätzlich strukturieren...
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
@Adama, Danke ... hab ich jetzt auch mal so eingerichtet ... finde Paperless mttlerweile ganz gut .. zumindest für meinen eingschränkten privaten Gebrauch besser als ecoDMS ;-) und auf meinen Mobilgeräten (Iphone und Ipad) ist auch alles übersichtlich ...
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Ist auch das, was mich überzeugt. Für den Hausgebrauch reicht es völlig, finde ich...
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
@Adama,

ich hab das mit den Tags einmal ausprobiert, leider funktioniert dein verlinkter Code nicht. Es gibt eine Fehlermeldung von Syntax nicht gefunden(erlaubt oder so ähnlich. Kannst du den Befel einmal bei dir absetzen ob der funktioniert? Geändert werden musste da ja nichts, wenn ich richtig gesehen habe.
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Du meinst für für "Unbearbeitet"?

paper2.PNG
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
@EDvonSchleck … erstmal die Tags einrichten und dann kannst Du in der Dokübersicht alle Dok anwählen und einen Tag anwenden !
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Es geht um angelegte Tags nachträglich automatisch zuweisen zu lassen! Steht aber schon eine Seite vorher, wie du nicht gelesen hast!!!
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
Oh ja … sorry .. der Zusammenhang schliesst sich aus Deinem Post da aber auch nicht.

ich frage mich nur was willst Du automatisch nachträglich „taggen“ ? ich habe nachträglich alle Dokumente manuell grün / erledigt getagged … neue, die noch nicht sortiert wurden, werden automatisch immer mit rot - unbearbeitet getagged …
 

Tuxnet

Benutzer
Mitglied seit
02. Jan 2019
Beiträge
619
Punkte für Reaktionen
74
Punkte
48
Zb. : Rechnung / Betriebsanleitung / Lohnabrechnung / Versicherungen etc.
 

Adama

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
05. Mrz 2013
Beiträge
2.205
Punkte für Reaktionen
774
Punkte
154
Dann hab' ich das auch mißverstanden und muss an der Stelle im Moment passen.

Da das bei mir schon ein paar Tage läuft, erinnere ich grad nicht, ob ich überhaupt retaggen musste... 🤔
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
@Tuxnet, hmmm dafür habe ich den Dokumententyp entsprechend Kategorisiert. Taggen tue ich nur so wie Adama.

Was für Dokumententypen hast Du denn gewählt?
 

Tuxnet

Benutzer
Mitglied seit
02. Jan 2019
Beiträge
619
Punkte für Reaktionen
74
Punkte
48
Hier nur ein paar von unzähligen:

Verdienstabrechnung ich
Verdienstabrechnung meine Frau
Bescheinigung
Antrag
Behörde
Vertrag
Kündigung
Renteninformation ich
Renteninformation meine Frau
Usw.
 

MrNeon

Benutzer
Mitglied seit
10. Mai 2011
Beiträge
75
Punkte für Reaktionen
5
Punkte
8
hmm … ich verstehe Deine Idee dann mit den zusätzlichen Tags nicht … das sind doch quasi Deine Kategorien … ich glaube ich ordne zu simpel, aber für mich reichts ;-)
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat