Hallo nochmal.
Sorry, ich hab mich falsch ausgedrückt.
Das Suchpräfix macht, sofern ich es richtig verstehe, das genau Gegenteil von dem was ich haben will.
Also Beispiel Suchpräfix:
- Eingabeordner und Ausgabeordner sind gleich
- Suchpräfix ist "Brother_"
- Es kommt eine PDF-Datei von einem Brother-Scanner im Ordner an namens "Brother_1234.pdf"
- synocr erkennt die Datei beim nächsten Lauf, verarbeitet diese und speichert sie mit neuem Namen ohne Präfix. Dadurch wird die Datei beim nächsten Lauf nicht mehr erkannt
Es werden also explizit Dateien auf Basis eines Präfix eingeschlossen und der Rest ignoriert
Mein Workflow ist aktuell anders, hierbei werden explizit alle Dateien eingeschlossen, außer diese haben ein bestimmtes Suffix ("_OCR"):
- Eingabeordner und Ausgabeordner sind gleich
- Es kommt eine PDF-Datei im Ordner an namens "abcdef1234.pdf"
- Beim nächsten Lauf meines Skripts wird die Datei erfasst und geprüft, ob am Ende des Dateinamens "_OCR" hängt. Falls ja, wird diese Datei übersprungen. Falls nein, wird die Datei verarbeitet und in "abcdef1234_OCR.pdf" umbenannt.
Ich weiß natürlich, dass ich mit der Option "--skip-text" auf ein ähnliches Ergebnis kommen würde. Allerdings würden dann alle meine Dateien im Eingabe-/Ausgabeordner, die bereits OCR haben, wieder und wieder verarbeitet werden, da ocrmypdf das skippen (sinnvollerweise) auf Seitenebene und nicht auf Dateiebene macht.
Daher meine Frage ob man zusätzlich zu einem Suchpräfix auch so etwas wie ein ExclusionSUFFIX (Danke
@TeXniXo für den Hinweis das ich einen Suffix habe
) einführen könnte. Am bestenen natürlich als Regex, dann kann man sich die ganze Thematik bzgl. Suffix/Präfix auch sparen.
Danke und Beste Grüße.