Suchergebnisse

  1. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Hallo Tobias, schön dass es funktioniert :) Aber um falschen Informationen vorzubeugen, pdftotext ist direkt auf dem System der Diskstation. Aus dem Docker image wird nur ocrmypdf verwendet. Grüße, Stefan
  2. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Hallo nimra20, das sollte funktionieren. Kannst du mit ein Beispiel-pdf (oder den OCR-Text) und deine config schicken? Den reinen OCR-Text bekommst du, wenn du das Script mit der Option "-x" startest, oder hiermit: "pdftotext -l 1 <pdf file>". Dann kannst du aus dem Text-file auch eventuelle...
  3. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Hallo rabu, sorry für die späte Antwort. Ich habe leider momentan wenig Zeit für dieses Projekt .. Gut, dass du das mit dem home-Ordern selbst herausgefunden hast. Scheint ein Rechte-Problem zu sein. Der Docker wird immer mit dem User gestartet, dem die Datei gehört. Wenn aber ein...
  4. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Hi rabu, sieht so aus, als ob irgendwas mit docker nicht stimmt. Bist du sicher, dass das Script mit root-Rechten gestartet wird? Das ist wichtig, damit er den Docker mit dem Benutzer starten kann, dem das pdf gehört. Du sagst, manuell funktioniert es? Was meinst du mit manuell? Startest du das...
  5. S

    synOTR synOTR - scriptsammlung für OTR-Workflow auf Synology Diskstation

    Seltsam, aber vielleicht hat sich in der Zwischenzeit das Ergebnis der search.xml geändert. Hier ist meine search.xml: https://drive.google.com/open?id=0B0d6qSfe4whWdU5FdzFjNkVaa1k Und zur Info, du hast auch die 64-bit dynamisch gelinkte Variante in der 3.1.1. Gruß Stefan
  6. S

    synOTR synOTR - scriptsammlung für OTR-Workflow auf Synology Diskstation

    Und gleich noch ein Fix hinterher :) Problem: Das Schneiden von Fuer_immer_Adaline_17.08.15_22-45_ard_100_TVOON_DE.mpg.HD.avi schlägt fehl, da grep (Zeile 797) die search.xml für eine Binärdatei hält. (Vermutlich wegen Umlauten) cutlist_anzahl=$(grep -c '/cutlist' "$tmp/search.xml" |...
  7. S

    synOTR synOTR - scriptsammlung für OTR-Workflow auf Synology Diskstation

    Hi, ich habe den 4. Link genommen (Dynamisch gelinkt, 64 Bit). Funktioniert auf meiner DS415+. Gruß, Stefan
  8. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Der Container läuft nicht dauerhaft! Es reicht, wenn das Image ("Abbild") jbarlow83/ocrmypdf vorhanden ist. Entweder über den Synology Docker runterladen oder per docker pull jbarlow83/ocrmypdf im Terminal holen. Den Rest macht das Script. Für jedes PDF wird implizit ein neuer temporärer...
  9. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Das ist nicht ganz trivial, da die entsprechenden Bibliotheken für einen file watcher (z.B. inotify) auf der DS fehlen.. Vielleicht kannst du den cronjob ja so einstellen, dass er nicht zu häufig läuft und nur dann, wenn es sinn macht (also z.B. nur Tagsüber jede Stunde). Wenn jemand ne gute...
  10. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Der Grund warum ich das nicht mache ist, dass ich in meinem $archivefolder 100% korrekt benamste Dateien haben möchte. Das Renaming klappt halt leider nicht immer zufriedenstellend und ich muss manuell Nacharbeiten. Erst dann schiebe ich meine pdf's ins Archiv. Aber es ist angekommen: Ihr wollt...
  11. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    $doTagging ist nicht am umbenennen Schuld. Das erzeugt nur eine neue Verzeichnisstruktur mit Verknüpfungen zu den Originaldateien in $archivefolder. Tags werden zusammen mit den anderen namensgebenden Dingen im Schritt $doRenameAfterOCR angehängt. Wenn du nicht den ganzen Schritt deaktivieren...
  12. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Servus Stephan, so kann's gehen. Ich hoffe du kannst es gebrauchen :) Und ja, guter Hinweis .. das Skript sollte als root laufen.
  13. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Input für das Skript sind pdf Dateien. In meinem Fall erzeugt der Scanner direkt PDF's und legt sie per SMB/CIFS direkt auf die Diskstation in den $inboxfolder. Bei mir heißen die Dateien dann Scan.pdf, Scan0001.pdf, Scan0002.pdf, ... Das Skript läuft dann stündlich drüber. Dabei werden im...
  14. S

    pdf-Scan to Folder (auf die Synology) und dann Texterkennung mit OCR durch Synology

    Ich war auch auf der Suche und habe mir letztendlich selber etwas zusammengebaut, was seit einer Weile ganz gut den Dienst auf meiner DS415+ verrichtet. Das ganze habe ich FileBasedMiniDMS getauft und ist hier zu finden: https://github.com/stweiss/FileBasedMiniDMS Kurz zusammengefasst kann das...