Hallo,
Ich habe mir als Projekt auch das papierlose (private) Büro vorgenommen, und wärem deshalb diesen Thread nochmal auf. Ob ich das am Ende dauerhaft mit synOCR/ Synology Drive oder mit einer anderen Software organisiere, da bin ich mir im Moment noch nicht 100 % sicher. Im Moment frage ich mich noch,
mit welchen Parametern ich scannen muss, dass synOCR oder andere OCR-Software damit klarkommt. Da sich in diesem Thread ja zumindest ein Scansnap-Nutzer rumtreibt erlaube ich mir hier diese Nachfrage, auch wenn es meine Synology NAS nur indirekt betrifft.
Ich habe mir kürzlich einen Fujitsu Scansnap S1300i zugelegt (so macht scannen Laune, eine Offenbarung im Vergleich zum Multifunktionsdrucker mit Einzug).
Was die Scan-Parameter (auch im Hinblick auf spätere OCR) angeht, so bin ich mir noch nicht sicher.
- Auflösung (in der Scansnap Software "Bildqualität"): Die Stufe "am besten" bewirkt 300 DPI bei Farb- sowie 600 DPI bei Schwarzweiss-Scans. Ich habe anderweitig gelesen, dass 300 DPI von OCR-Software in der Regel am besten verdaut wird, 600 DPI eher zu schlechteren Ergebnissen führt. Wie sind eure Erfahrungen? Da der Scansnap die Auflösung von der Farbe abhängig macht gibt es keine Einstellung, wo immer mit 300 DPI gescannt wird. Führt das bei der OCR wegen der teils höheren Auflösung von 600 DPI zu Problemen? Wäre es dann besser, eine Stufe runter zu gehen, dann hätte ich bei Farbscans allerdings nur 200 DPI?
- Komprimierungsrate: 5 Stufen sind möglich. Wie wirkt sich das auf die OCR-Tauglichkeit aus?
Was ich brauche ist
primär eine gut fuktionierende OCR-Auswertung und sekundär die Möglichkeit, aus dem PDF einen Ausdruck zu erstellen, welcher qualitativ nahe am Original liegt. (Letzteres ist ja wohl bei 300 DPI Auflösung gegeben.
Nun noch eine
scnasnap-spezifische Überlegung: Neben der Möglichkeit mit synOCR die Texterkennugn zu machen, wäre dies auch a) direkt beim Scan und b) nach dem Scan mit Abbyy Finereader möglich. Was spricht dafür, anstatt Variante a) zu wählen nachträglich synOCR zu bemhen?
Vielen Dank für die Rückmeldung.