Vielseitiges PDF über Trennblätter auftrennen

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Hallo.

Bei EcoDMS gibt es ja die Funktion, beim Scannen von Dokumenten Trennblätter zwischen die Dokumente zu schieben, die EcoDMS dann erkennt, herauslöscht und die Dokumente entsprechend an diesen Stellen trennt.

Ich habe nach sowas als Stand-Alone-Lösung gesucht aber nichts gefunden. Das heißt nicht wirklich viel, weil ich nie gut darin bin, auf passende Suchbegriffe zu kommen, daher frage ich einfach noch mal nach, ob jemandem eine App einfällt.

Weiß jemand, ob es sowas gibt?
 
Zuletzt bearbeitet:
  • Like
Reaktionen: mail2bsc

NSFH

Benutzer
Sehr erfahren
Mitglied seit
09. Nov 2016
Beiträge
4.093
Punkte für Reaktionen
570
Punkte
194

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Hallo und danke.

Ich hatte - da wir hier ja im Synology-Forum sind - an eine Software gedacht, die auf der Synology läuft, am besten automatisch einen Eingangsordner checkt. Sorry, mein Fehler, hatte die Anforderungen nicht präzise genug erläutert.

Mein aktueller Workflow:

1. Jedes Dokument wird einzeln in den Brother-Scanner gesteckt und gescannt
2. Der Scanner schiebt es per SMB automatisch in den Ordner /volume1/SynOCR_Eingang
3. SynOCR wird über den Aufgabenplaner zwischen 8:00 und 20:00. zu jeder vollen Stunde gestartet, erkennt neue PDFs legt eine OCR-Ebene drüber und verschiebt sie in den Ordner /volume1/Dokumente/01_Dokumenteneingang
4. Alle paar Tage oder Wochen nehm ich mir kurz Zeit, die Dokumente aus …/01_Dokumenteneingang in die weiteren Unterordner meines Dokumentenordners zu verschieben, eben dahin, wo sie hingehören.


Was ich mir wünsche wäre eher sowas wie: Ein paar bunte Trennblätter, damit man sie hinterher besser wieder rausholen kann und dann:

1. 20 Seiten gleichzeitig (so viel bekommt mein Scanner hin) mit Trennblättern zwischen den Einzeldokumenten in den Scanner und scannen.
2. Scanner schiebt die Dokumente in einen Eingangsordner für die Trennung
3. 5 Minuten vor der vollen Stunde (wenn synOCR loslegt) wird die Trenn-App gestartet und trennt alle PDFs die im Ordner liegen automatisch auf (also Trennblätter löschen und an diesen Stellen die PDFs trennen
4. Ab hier weiter wie bisher in Step 3.

Ich vermute einfach mal, dass es so eine Lösung außerhalb von DMS‘en nicht gibt und ich möchte gerne bei meiner Ordnerstruktur bleiben, daher ist das für mich keine Option. Da das Trennen vor SynOCR laufen muss, weil ich die Dateien nach Datum umbenannt und auch den Dateizeitstempel geändert haben möchte, ist also die vorgeschlagene Lösung, mit der alles am Computer geschnitten werden muss leider keine Lösung. Und ich möchte die Dateien möglichst nur einmal anfassen, nämlich wenn ich sie vom Dokumenteneingang an ihren finalen Platz verschiebe.

Bleibt wahrscheinlich nur, weiterhin alle Dokumente einzeln in den Scanner zu schieben.
 

DarkJedi

Benutzer
Mitglied seit
29. Dez 2022
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo,

ich stehe vor der gleichen Herausforderung. Es gibt ein Python-Script, das das ermöglicht. Ich habe aber keine Ahnung, wie man es auf der Synology zum Laufen bekommt.

Hier das Script: https://github.com/baltpeter/scanprep

Python3 Modul und PiP (https://jackgruber.github.io/2021-06-27-install-pip-on-synology/) habe ich installiert, beim Aufruf von scanprep -h kommt aber eine Fehlermeldung (# If you see an error like "ImportError: Unable to find zbar shared library", you need to install zbar yourself. See: https://pypi.org/project/pyzbar/). Dort hört dann mein Latein auf, was noch fehlt oder nicht richtig installiert ist. Und ob das ganze überhaupt auf einer Synology funktioniert. Vielleicht hat ja jemand anderes noch einen Tip?
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Das gibt es nicht, wurde aber schon diskutiert und als aktuell nicht umsetzbar bezeichnet.
Leider schreibst du nicht, wie viel davon mehrseitige Dokumente sind. Ob es schneller geht Trennblätter einzufügen oder gleich das Dokument zu scannen bin ich mir auch nicht sicher. Dazu kommt, dass der Scanner nur 20 Blätter beherbergen kann.

Auch finde ich deine Vorgehensweise zu kompliziert. Ich nutze selbst Paperlessngx. Damit kannst du sogar deine Ordnerstruktur behalten. Diese kannst du dort selbst festlegen. Dafür erhältst du eine gute Suchfunktion und Webinterface dazu.
 

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Beim einzelnen Scannen muss man halt die Verarbeitungszeit des Scanners reinrechnen. Wir reden hier nicht über extreme Ersparnisse, die man über so ein Trennblattsystem erlangen kann, daher ist es auch nicht von großer Wichtigkeit. Wäre es möglich, hätte ich es nett gefunden, gerade wenn man diverse kurze Dokumente scannen will. Aber wenn es nicht möglich ist, ist es auch ok.


Zum Thema komplizierter Workflow und Dokumentenmanagementsysteme - auch wenn die Vor- und Nachteile von DMS an anderer Stelle schon diskutiert worden ist:

Wieso mein Workflow dir kompliziert erscheint weiß ich nun nicht, ich muss jedes Dokument exakt einmal als Papier anfassen, um es zu scannen und einmal als PDF, um es in den Sollordner zu verschieben. Ich hatte mal EcoDMS ausprobiert. ist der Scanvorgang der gleiche, anschließend muss das Dokument aber in der Inbox von EcoDMS klassifiziert werden; das ist auch nicht weniger Aufwandt. Wenn das bei Paperless NGX entfällt, ok, mag schneller gehen. Andererseits prüfe ich, bevor ich die PDF verschiebe, nochmal auf jede Seite drauf, ob der Scan gut und lesbar ist, das Original landet danach nämlich mit wenigen Ausnahmen im Schredder. Einfach so, ohne jedes PDF noch mal selber zu prüfen, wird kein Dokument von mir irgendwo abgelegt!

Eine wirkliche Zeitersparnis seh ich für mich also nicht. Mit Universal Search habe ich bislang auch jedes Dokument mit OCR-Ebene gefunden. Vor allem aber kann ich Universal Search vom Finder meines MacBooks aus verwenden und so gleich mit den bordeigenen Mitteln meines Macs Dokumente finden.

Ich habe diverse andere Gründe, kein DMS verwenden zu wollen, darunter auch so Randgruppenthemen wie „digitaler Nachlass“. Die diskutiert man besser an anderer Stelle.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Digitaler Nachlass ist tatsächlich weniger ein Argument, wenn du damit meinst, dass nach deinem Ableben noch jemand auf die Dokumente zugreifen können soll, denn letztlich bietet Paperless-ngx zwar die entsprechende Oberfläche an, um die Dokumente mit verschiedenen Eigenschaften zu verwalten und damit auch schneller zu finden, auf der anderen Seite werden die aber in einer klaren Ordnerstruktur auf dem entsprechenden Server gespeichert, da gibt es also letztendlich keinen Unterschied, als wenn du selbst Jahresordner oder andere Unterteilungen anlegst.

Auch darf man an der Stelle ja nicht vergessen, dass gerade Paperless ein Freiwilligenprojekt ist und nur so lange lebt, wie es auch von den Leuten, in deren Freizeit, weiter entwickelt wird. Jeder, der das benutzt, sollte sich also grundsätzlich immer überlegen, was er mit den ganzen Daten macht, wenn die Entwicklung eben irgendwann mal aufhört. Es ist ja nicht versprochen, dass sich immer wieder ein neuer Fork entwickelt (Paperless-ng → Paperless-ngx), wenn der andere einschläft. Dafür bezahlt man aber auch für diese Software kein Geld.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Bezüglich des 2 Absatzes: Man kann nie einer ausschließen, dass ein freiwilliges Projekt weiter geführt wird. Das umfasst synOCR bis hin zu Paperless. Der Vorteil bei Open Source ist, dass es aber von einem anderen weitergeführt werden kann. Aber selbst Firmen, die ein DMS anbieten, müssen diese nächstes Jahr nicht mehr existieren. Aufgrund des Codes ist es aber unwahrscheinlich, dass es noch einmal aufgenommen wird. Somit ist ein Risiko immer gegeben, egal ob frei oder kommerziell.
 
  • Like
Reaktionen: Monacum

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Digitaler Nachlass ist tatsächlich weniger ein Argument, wenn du damit meinst, dass nach deinem Ableben noch jemand auf die Dokumente zugreifen können soll, denn letztlich bietet Paperless-ngx zwar die entsprechende Oberfläche an, um die Dokumente mit verschiedenen Eigenschaften zu verwalten und damit auch schneller zu finden, auf der anderen Seite werden die aber in einer klaren Ordnerstruktur auf dem entsprechenden Server gespeichert, da gibt es also letztendlich keinen Unterschied, als wenn du selbst Jahresordner oder andere Unterteilungen anlegst.

Auch darf man an der Stelle ja nicht vergessen, dass gerade Paperless ein Freiwilligenprojekt ist und nur so lange lebt, wie es auch von den Leuten, in deren Freizeit, weiter entwickelt wird. Jeder, der das benutzt, sollte sich also grundsätzlich immer überlegen, was er mit den ganzen Daten macht, wenn die Entwicklung eben irgendwann mal aufhört. Es ist ja nicht versprochen, dass sich immer wieder ein neuer Fork entwickelt (Paperless-ng → Paperless-ngx), wenn der andere einschläft. Dafür bezahlt man aber auch für diese Software kein Geld.
Na gut, dann wird das langsam der vierundachzigste DMS-Pro/Contra-Thread :)

Ja, ich weiß, dass man in Paperless eine Ordnerstruktur anlegt, aber soweit ich es verstehe, liegt diese Struktur eben doch in der Datenbank, die PDFs sind nicht frei zugänglich. Letztens verlor ich durch eine Unvorsichtigkeit das Passwort zum Fernbackup meiner DS920. Das Backup musste ich neu erstellen, das alte konnte ich nur löschen. Ich räume ein, die passende Antwort hier könnte lauten: Pass halt auf deine Passwörter auf, du DAU, aber Unfälle passieren und wenn alle meine PDFs auf der Syn weg wären, wäre das eine ziemliche Katastrophe für mich.


Und was den Nachlass angeht: Ich bin in meiner Familie der Einzige, der sich mit IT auch nur minimalst beschäftigt. Alle anderen halten IT für das, was nötig ist, um auf der Couch sitzend auf einem Tablet Netflix zu gucken.

Mein Bruder hat eine DS420 (die ich ihm hingestellt habe, weil ich sie als Fernziel für mein Backup haben wollte). Er nutzt die DS420 als reine Datenhalde. Dann hörte er, dass es wohl sowas wie Homebridge gäbe, womit er wohl ein Shelly-Relais in seine Apple-Home-Welt bringen könne. Das musste ich dann per Teamview installieren und testen; schon so eine einfache Docker-Geschichte ist für ihn eher unbegreiflich. Ich musste mittlerweile noch diverse andere Dinge auf das Ding für ihn draufpacken.

Er weiß, wie man sich auf eine Synology einwählt, kann also mit seinem Laptop in mein Haus und sich auf meine DS einwählen. Mehr als Daten von den Festplatten sichten kann er nicht und will er auch eigentlich nicht lernen. Wenn ich ihm sage: „Installiere erstmal den Client des DMS, dann such die Datenbank auf meiner DS, dann ….,“ weiß ich schon jetzt, dass das niemals passieren wird. Und er ist der fähigste in der Familie wenn es um sowas geht.

Er hat von mir einen Akten-Ordner (echtes Papier) mit Dokumenten wie z.B. einer Patientenverfügung. Darin ist auch ein versiegeltes Kuvert, in dem ein Zettel steckt mit Zugangsdaten für einen Account, der nur und ausschließlich zum Zugriff auf den Ordner „Dokumente“ berechtigt. Sollte ich im Krankenhaus oder auf dem Gottesacker liegen, kann er sich damit einloggen und rausfinden, wo ich meinen Goldschatz vergraben habe. Schwieriger darf es nicht werden.


Ich will mich aus diversen - auch aus den genannten - Gründen privat kein DMS. Meine Ordnerstruktur und Universal Search reichen mir. Ich wollte mir nur die Scanarbeit etwas erleichtern. Aber solche einfachen Anfragen bleiben ja nie lange einfach :)
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Ja, ich weiß, dass man in Paperless eine Ordnerstruktur anlegt, aber soweit ich es verstehe, liegt diese Struktur eben doch in der Datenbank, die PDFs sind nicht frei zugänglich.
Doch sind sie. Sie liegen im Docker-Ordner in dem entsprechenden Unterordner, den du festgelegt hast. Nicht falsch verstehen, ob das was für dich ist, muss ganz alleine du entscheiden, ich will da keinen überzeugen. Ich möchte nur falsche Sichtweisen/Argumente korrigieren für andere, die das hier lesen. Wenn man nämlich nicht direkt an die Dateien ran käme, wäre das tatsächlich ein Kontra-Argument auch für mich.

Aber solche einfachen Anfragen bleiben ja nie lange einfach
Ja, das ergibt sich dann aus der Diskussion. Macht aus meiner Sicht aber auch die Qualität eines Forums aus, dass man in den Threads auch Meinungen links und rechts vom Thema noch mitnimmt.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Ja, ich weiß, dass man in Paperless eine Ordnerstruktur anlegt, aber soweit ich es verstehe, liegt diese Struktur eben doch in der Datenbank, die PDFs sind nicht frei zugänglich.
Stimmt nicht es werden die Originalen Dateien und die erzeugten PDFs separat weg gesichert in der Struktur die du vorgibst.
Ich will mich aus diversen - auch aus den genannten - Gründen privat kein DMS. Meine Ordnerstruktur und Universal Search reichen mir. Ich wollte mir nur die Scanarbeit etwas erleichtern. Aber solche einfachen Anfragen bleiben ja nie lange einfach :)
Dient ja nur ein Hinweis, dass es einfacher geht und mit weniger Schritten. Ein Urteil sollte man sich erst nach einmal ausprobieren bilden.
 

steje43

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
666
Punkte für Reaktionen
35
Punkte
48
Auch darf man an der Stelle ja nicht vergessen, dass gerade Paperless ein Freiwilligenprojekt ist und nur so lange lebt, wie es auch von den Leuten, in deren Freizeit, weiter entwickelt wird.
Genau, deshalb verwende ecoDMS.

Digitaler Nachlass ist auch wirklich wichtig. Sollte ich heute Nacht sterben, hat meine Ehefrau morgen ein Problem.
Ich werde wohl mal ecoDMS auf ihrem Rechner installieren und ihr die Zugangsdaten geben. :)
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Na denn hoffe mal das ecoDMS noch lange durchhält und nicht wegen einer Randgruppe eingeht. Mal sehen, was du denn machst, um an deine Files zu kommen.
 

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Doch sind sie. Sie liegen im Docker-Ordner in dem entsprechenden Unterordner, den du festgelegt hast. Nicht falsch verstehen, ob das was für dich ist, muss ganz alleine du entscheiden, ich will da keinen überzeugen. Ich möchte nur falsche Sichtweisen/Argumente korrigieren für andere, die das hier lesen. Wenn man nämlich nicht direkt an die Dateien ran käme, wäre das tatsächlich ein Kontra-Argument auch für mich.
OK. In dem Fall war ich falsch informiert und werde es mir in Zukunft tatsächlich mal genauer anschauen. Danke für den Hinweis
 

Thlat

Benutzer
Mitglied seit
11. Jul 2022
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Digitaler Nachlass ist auch wirklich wichtig. Sollte ich heute Nacht sterben, hat meine Ehefrau morgen ein Problem.
Ich werde wohl mal ecoDMS auf ihrem Rechner installieren und ihr die Zugangsdaten geben. :)
Ich mach mir darüber nicht gerne Gedanken, bin noch lange nicht in dem Alter, in dem man sich mit dem man das eigene Ableben wirklich vor Augen hat, aber Unfälle passieren und Herzinfarkte, Schlaganfälle und was weiß ich nicht erwischen manchmal auch Menschen in jungen und mittleren Jahren. Und ich habe schon das Chaos miterlebt, dass meine 90-jährige Oma für meine Mutter hinterlassen hat. Bei mir wäre das ungleich komplexer und das will ich niemandem hinterlassen. Daher sind eben Themen wie Patientenverfügung oder eben die Auffindbarkeit meiner Daten mit wirklich einfachen Mitteln für mich ein wichtiges Kriterium.

Komplett unwichtig für mich sind hingegen so Sachen wie rechtssicheres Archivieren, ich habe keine Geschäftspost, die ich entsprechend lange und sicher ablegen muss, mir reicht der einfache Scan mit OCR.
 

steje43

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
666
Punkte für Reaktionen
35
Punkte
48
Na denn hoffe mal das ecoDMS noch lange durchhält und nicht wegen einer Randgruppe eingeht. Mal sehen, was du denn machst, um an deine Files zu kommen.

Als eine Randgruppe würde ich nun ecoDMS nicht bezeichnen! Zudem kannst du deine PDF-Dateien exportieren und sogar den Client offline nutzen.

10186 Firmen und 8703 Privatleute nutzen ecodms.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
@EDvonSchleck wollte zum Ausdruck bringen, dass auch die Entwickler von ecoDMS weiterentwickeln müssen und wenn das nicht mehr passiert, die Software auch nutzlos ist — weil das gerne als Argument gegen die „Freiwilligenlösung“ Paperless auf GitHub verwendet wird. Und ich denke, dass beide Lösungen letztlich Randlösungen sind, wenn man das auf alle Menschen bezieht und überlegt, wer überhaupt privat DMS verwendet.
 

EDvonSchleck

Gesperrt
Mitglied seit
06. Mrz 2018
Beiträge
4.703
Punkte für Reaktionen
1.120
Punkte
214
Zuletzt bearbeitet:

steje43

Benutzer
Mitglied seit
03. Dez 2011
Beiträge
666
Punkte für Reaktionen
35
Punkte
48
In Ordnung! So kann man das auch sehen.

Aber ein Synology NAS verwende ich auch. Dann bin ich auch von einer Randgruppe.

Noch, denn ich werde mir in Zukunft kein NAS mehr kaufen.
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.200
Punkte für Reaktionen
1.024
Punkte
224
Ich verstehe nicht so ganz, warum du das jetzt auf eine persönliche Ebene ziehst, es ist nun mal so, dass nur ein Bruchteil aller Personen DMS oder auch ein NAS verwenden. Wenn wir jetzt mal davon ausgehen, dass ecoDMS nicht nur in Deutschland genutzt wird, dann ist der Anteil sogar noch geringer, auch wenn 8500 Menschen absolut gesehen schon eine Menge sind.

Und ob du dir noch mal ein NAS kaufst, da haben wir keine Aktien drin und es trifft auch nicht uns, wenn du dir keines mehr kaufst.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat