synOCR synOCR - GUI für OCRmyPDF

geimist · 19. Juli 2023

Frage: Brauchst du zwei Profile?
Müssen die Quellordner identisch sein?
- Hier könntest du mit unterschiedlichen Präfixen arbeiten, um nur bestimmte Dokumente mit einem Profil zu verarbeiten.

So kann man ggf. auch im Scanner entsprechende Profile anlegen, die z.b. den Dateinamen zwischen geschäftlich_xxx.pdf und privat_xxx.pdf unterscheiden.

Jesse69 · 19. Juli 2023

OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)

geimist · 19. Juli 2023

Prima. Wichtig ist nur, das nicht mehrere Profile ohne Differenzierung den gleichen Quellordner verwenden.

Yippie · 19. Juli 2023

Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?

Struppix · 19. Juli 2023

Jesse69 schrieb:
OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)

Ich erstelle / überarbeite gerade die Videos neu. Die werden kürzer und kompakter und es wird mehrere Parts geben. Dann auch mit Kapiteln / Sprungmarken für die einzelnen Themen.

Struppix · 19. Juli 2023

Yippie schrieb:
Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?

Ja korrekt. Aber idealerweise mit jeweils einem "Input" Ordner.

Yippie · 19. Juli 2023

Thanks!
Nutze bisher nur ein Profil, dafür aber mit einer ellenlangen YAML-Datei und ja, leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.

geimist · 19. Juli 2023

Yippie schrieb:
… leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.

Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:

Nur PDFs mit definiertem Präfix bearbeiten (z.B. "SCAN_")
leerlassen, wenn alle Dokumente verarbeitet werden sollen
! am Anfang invertiert die Suche ( !value )
$ am Ende definiert den Begriff als Suffix ( value$ )

Struppix · 19. Juli 2023

geimist schrieb:
Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:

Es bleibt sich unterm Strich doch gleich, ob ich im Scanner bspw. per Preset mit verschiedenen Präfix oder verschiedenen Verzeichnissen hantiere.
Aber schön, dass es beide Varianten gibt, gerade wenn man die pdf zB. per Script vorsortiert oder umbenennt, oder der Scanner nur eine Variante von beidem beherrscht.

Karsten

deathlord · 21. Juli 2023

geimist schrieb:
Danke. Wenn überhaupt, wird es mit einer Umsetzung aber nicht heute oder morgen. Spontan würde ich dann auch ein strukturiertes Format mit einem Key:Value Paar(e) bevorzugen, damit User auch andere Ideen damit umsetzen können. Aber wie gesagt: ich kann nichts versprechen. Es gibt ja auch noch andere Wünsche

Erstmal vielen Dank für das geniale Programm. Kann es sein, dass Dein Server / Download-Link aktuell offline ist?

plang.pl · 21. Juli 2023

Ist mir auch schon aufgefallen, dass der hin und wieder nicht erreichbar ist. Einfach in ein paar Minuten nochmals versuchen

geimist · 21. Juli 2023

deathlord schrieb:
Kann es sein, dass Dein Server / Download-Link aktuell offline ist?

Selfhost hat gerade ein technisches Problem, sodass das Routing zu meiner Domain nicht passt. Sie sind wohl dran …

@plang.pl Bis auf die Zwangstrennung habe ich eigentlich eine hohe Uptime. Kannst mir gerne mal eine PN schreiben, wenn dir es mal wieder auffällt.

plang.pl · 21. Juli 2023

Alles klar, mache ich. So oft lade ich mir synOCR aber nicht runter

geimist · 21. Juli 2023

BTW: DNS passt wieder

Thonav · 21. Juli 2023

Nö - komme nicht auf Deine geimist.eu Seite...

alexhell · 21. Juli 2023

Bei mir funktioniert es.

geimist · 21. Juli 2023

https://www.isitdownrightnow.com/geimist.eu.html

!&all · 23. Juli 2023

Hey,

Ich habe leider folgendes Problem: Ich habe bei einigen gescannten und mit OCR versehen Dateien im Nachgang per Vorschau auf dem Mac leere Seiten gelöscht. Dadurch ist leider auch der OCR Layer "zerstört" worden und die Dateien sind nicht mehr durchsuchbar (schein ein bekannten Problem mit Vorschau zu sein). Nun wäre die Frage, inwieweit ich den OCR Layer wieder entfernen kann und neu hinzufügen kann. Kann ich das irgendwie mit synOCR oder den unterliegenden Technologien automatisieren?

Besten Dank vorab!

Yippie · 23. Juli 2023

Warum löscht du die leeren Seiten nicht vorab?

!&all · 23. Juli 2023

Ja, ab jetzt mache ich das so aber das hilft leider nicht bei den Hunderten bereits gescannten Dokumenten

synOCR synOCR - GUI für OCRmyPDF

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Additional post fields

Kaffeautomat