synOCR synOCR - GUI für OCRmyPDF

  1. Frage: Brauchst du zwei Profile?
  2. Müssen die Quellordner identisch sein?
    • Hier könntest du mit unterschiedlichen Präfixen arbeiten, um nur bestimmte Dokumente mit einem Profil zu verarbeiten.
So kann man ggf. auch im Scanner entsprechende Profile anlegen, die z.b. den Dateinamen zwischen geschäftlich_xxx.pdf und privat_xxx.pdf unterscheiden.
 
  • Like
Reaktionen: Jesse69
OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)
 
  • Like
Reaktionen: Struppix und geimist
Prima. Wichtig ist nur, das nicht mehrere Profile ohne Differenzierung den gleichen Quellordner verwenden.
 
  • Like
Reaktionen: Jesse69
Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?
 
OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)
Ich erstelle / überarbeite gerade die Videos neu. Die werden kürzer und kompakter und es wird mehrere Parts geben. Dann auch mit Kapiteln / Sprungmarken für die einzelnen Themen.
 
  • Like
Reaktionen: Jesse69
Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?
Ja korrekt. Aber idealerweise mit jeweils einem "Input" Ordner.
 
  • Like
Reaktionen: Yippie
Thanks!
Nutze bisher nur ein Profil, dafür aber mit einer ellenlangen YAML-Datei und ja, leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.
 
… leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.
Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:
Nur PDFs mit definiertem Präfix bearbeiten (z.B. "SCAN_")
leerlassen, wenn alle Dokumente verarbeitet werden sollen
! am Anfang invertiert die Suche ( !value )
$ am Ende definiert den Begriff als Suffix ( value$ )
 
Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:
Es bleibt sich unterm Strich doch gleich, ob ich im Scanner bspw. per Preset mit verschiedenen Präfix oder verschiedenen Verzeichnissen hantiere.
Aber schön, dass es beide Varianten gibt, gerade wenn man die pdf zB. per Script vorsortiert oder umbenennt, oder der Scanner nur eine Variante von beidem beherrscht.

Karsten
 
Danke. Wenn überhaupt, wird es mit einer Umsetzung aber nicht heute oder morgen. Spontan würde ich dann auch ein strukturiertes Format mit einem Key:Value Paar(e) bevorzugen, damit User auch andere Ideen damit umsetzen können. Aber wie gesagt: ich kann nichts versprechen. Es gibt ja auch noch andere Wünsche :giggle:

Erstmal vielen Dank für das geniale Programm. Kann es sein, dass Dein Server / Download-Link aktuell offline ist?
 
Ist mir auch schon aufgefallen, dass der hin und wieder nicht erreichbar ist. Einfach in ein paar Minuten nochmals versuchen
 
Kann es sein, dass Dein Server / Download-Link aktuell offline ist?
Selfhost hat gerade ein technisches Problem, sodass das Routing zu meiner Domain nicht passt. Sie sind wohl dran …

@plang.pl Bis auf die Zwangstrennung habe ich eigentlich eine hohe Uptime. Kannst mir gerne mal eine PN schreiben, wenn dir es mal wieder auffällt.
 
Alles klar, mache ich. So oft lade ich mir synOCR aber nicht runter :D
 
  • Haha
Reaktionen: Monacum und Tommes
Nö - komme nicht auf Deine geimist.eu Seite...
 
Hey,

Ich habe leider folgendes Problem: Ich habe bei einigen gescannten und mit OCR versehen Dateien im Nachgang per Vorschau auf dem Mac leere Seiten gelöscht. Dadurch ist leider auch der OCR Layer "zerstört" worden und die Dateien sind nicht mehr durchsuchbar (schein ein bekannten Problem mit Vorschau zu sein). Nun wäre die Frage, inwieweit ich den OCR Layer wieder entfernen kann und neu hinzufügen kann. Kann ich das irgendwie mit synOCR oder den unterliegenden Technologien automatisieren?

Besten Dank vorab!
 
  • Like
Reaktionen: Tommes
Warum löscht du die leeren Seiten nicht vorab?
 
Ja, ab jetzt mache ich das so aber das hilft leider nicht bei den Hunderten bereits gescannten Dokumenten 😉
 
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat