BUGFIXES: | |
- Das Anlegen der benötigten Benutzergruppe 'docker' war nicht möglich, wenn bereits eine gleichnamige Gruppe existierte (DSM7 only) | |
- RegEx mit lookahead / lookbehind für tag-Namen war nicht möglich | |
- einige Fehlerbehebungen (thx to @Tommes ) | |
VERBESSERUNGEN: | |
- Behandlung von Sonderzeichen verbessert Bitte testet besonders die OCR-Parameter, sofern ihr euch da ausgetobt habt. @symax (das Problem von #1939 konnte ich noch nicht lösen, aber die Werte werden jetzt scheinbar korrekt an ocrmypdf übergeben) | |
- Bereinigung von unbenutzten (ersetzten) Docker-Images | |
- Cronjob löschen, der mit synOCR bei DSM6 erzeugt wurde (das geht inzwischen nicht mehr über den Sicherheitsberater) | |
- DSM-Benachrichtigungen funktionieren wieder | |
- DSM-Benachrichtigungen: Liste aller möglichen Benutzer in der GUI | |
- Indikator für die Gültigkeit der Verzeichnisse in der GUI | |
- die Reihenfolge der Tags kann nun festgelegt werden | |
Kriterium ist die alphabetische Sortierung der Regelnamen in der YAML-Datei @s-tyle @reneh | |
NEUES: | |
- Umbenennungsparameter für das Jahr kann nun 2- oder 4-stellig sein | |
§yocr2 §yocr4 §ynow2 §ynow4 §ysource2 §ysource4 | |
- Zieldateien können in nach Jahr benannte Ordner verschoben werden (Auswahl in der GUI) @TJ. | |
- Zieldateien können in nach Jahr/Monat benannten Ordnern abgelegt werden (Auswahl in der GUI) | |
- Die Anzahl der Backupdateien kann nun begrenzt werden (Tage oder Anzahl) @peterhoffmann |
Das sind Beispieleinträge - und wenn du genau hinschaust, wirst du feststellen, dass es sich bei beiden um ungültige Daten handelt. Sie dienen als Symbol für die Schreibweise, welche aber nicht mit Benutzerangaben in Konflikt kommen.standen bei mir schon zwei Datumsangaben drin, die meines Wissens nicht von mir stammen (2021-02-29 und 2020-11-31). Kann das sein?
Es geht beides… da steht mit LEERZEICHEN getrennt. Die eingegebenen Daten bei mir sind aber mit SEMIKOLON getrennt. Geht somit beides oder sind die Daten bei mir falsch eingetragen?
@geimist und @tomjonsSo. Jetzt muss ich mich noch mit der Sortierung in Ordner kümmern.
Bisweilen werden die PDF ja mit der erkannten Belegnummer umbenannt.
Nun möchte ich noch: Falls im Belegfuß "Amazon"oder "Ebay" steht entsprechend in den jeweiligen Ordner sortiert wird.
Code:tagBestellnummer8: tagname: "Ihr Beleg" targetfolder: tagname_RegEx: ((?<=(^Ihr Beleg[:|;][\s]{7}){1})|(?<=(^Ihr Beleg[:|;][\s]{8}){1})|(?<=(^Ihr Beleg[:|;][\s]{9}){1}))[0-9]+ condition: all subrules: - searchstring: ((?<=(^Ihr Beleg[:|;][\s]{7}){1})|(?<=(^Ihr Beleg[:|;][\s]{8}){1})|(?<=(^Ihr Beleg[:|;][\s]{9}){1}))[0-9]+ searchtyp: contains isRegEx: true source: content casesensitive: false
(?<=(^LfdNr[\s]{3}[:|;][\s]{6}){1})[0-9]+
OR ist in dem Fall ein Pipe (=Mit OR Meist du dieses "lange Ding" was @tomjons auch genutzt hat, oder?
|
). Man kombiniert also mehrere Möglichkeiten. Ein Beispiel hatte ich HIER gezeigt.Wieviel Leerzeichen jetzt bei dir von OCR interpretiert werden, müsste man im RAW-Text nachsehen (findest du im Log-Ordner bei erweitertem Loglevel 2). Die 3 und 6 Leerzeichen waren jetzt nur ein Beispiel und ins Blaue geraten.Wie kommst du auf 3 und 6 Leerzeichen?
WICHTIG ! | Mit dieser Version ist der Zeitplaner in auch in DSM6 nicht mehr in der GUI verfügbar. Bitte verwende den DSM Aufgabenplaner! Dadurch sind engere Intervalle möglich und ein späteres Upgrade auf DSM7 wird dadurch vereinfacht. |
BUGFIXES: | - Das Anlegen der benötigten Benutzergruppe 'docker' war nicht möglich, wenn bereits eine gleichnamige Gruppe existierte (DSM7 only) |
- RegEx mit lookahead / lookbehind für tag-Namen war nicht möglich | |
- einige Fehlerbehebungen (thx to @Tommes ) | |
VERBESSERUNGEN: | - Behandlung von Sonderzeichen verbessert Bitte testet besonders die OCR-Parameter, sofern ihr euch da ausgetobt habt. @symax (das Problem von #1939 konnte ich noch nicht lösen, aber die Werte werden jetzt scheinbar korrekt an ocrmypdf übergeben) |
- Bereinigung von unbenutzten (ersetzten) Docker-Images | |
- Cronjob löschen, der mit synOCR bei DSM6 erzeugt wurde (das geht inzwischen nicht mehr über den Sicherheitsberater) | |
- DSM-Benachrichtigungen funktionieren wieder | |
- DSM-Benachrichtigungen: Liste aller möglichen Benutzer in der GUI | |
- Indikator für die Gültigkeit der Verzeichnisse in der GUI | |
- die Reihenfolge der Tags kann nun festgelegt werden Kriterium ist die alphabetische Sortierung der Regelnamen in der YAML-Datei @s-tyle @reneh | |
- @Tommes hat die komplette GUI auf neue Füße gestellt. Tommes und ich haben schon fleißig getestet, aber bitte kontrolliert, ob alle Formularfelder wie gewünscht funktionieren. | |
- synOCR wurde im Paketzentrum umbenannt (synOCR DSM6 & synOCR DSM7). Ich hoffe, dass sich nach dem Veröffentlichen auf cphub.net das Handling dadurch etwas verbessert. | |
NEUES: | - Umbenennungsparameter für das Jahr kann nun 2- oder 4-stellig sein§yocr2 §yocr4 §ynow2 §ynow4 §ysource2 §ysource4 |
- Zieldateien können in nach Jahr benannte Ordner verschoben werden (Auswahl in der GUI) @TJ. | |
- Zieldateien können in nach Jahr/Monat benannten Ordnern abgelegt werden (Auswahl in der GUI) | |
- Die Anzahl der Backupdateien kann nun begrenzt werden (Tage oder Anzahl) @peterhoffmann | |
- Umbenennungsparameter §pagecount hinzugefügt (Seitenanzahl des aktuellen Dokuments) @TJ. | |
- alle Umbenennungsparameter können nun auch als Variablen in Regel basierten Pfaden (YAML-Regeldatei) verwendet werden (z.B. /Rechnungen/§yocr4 ). Ausgenommen davon ist die Variable §tit für den originalen Dokumentnamen. @TJ. |
Hi @claus_hipp- "$pagecount_latest" als Umgebungsvariable - damit ich nur den Pagecount des aktuellen Dokuments verwenden kann - dann sehe ich gleich wie viele Seiten ein Dokument hat, noch bevor ich es öffne.
Es gibt verschiedene Textlayer. Bitte informiere dich da mal bei ocrmypdf. synOCR reicht die Parameter ja nur durch.- Bei mir funktioniert der Parameter: -s nicht -> Dokumente laufen immer wieder durch die OCR
Da dieses Szenario in der Regel nur 1x (am Anfang) eintritt, gibt es keine eingebaute Lösung. Aber ich habe dazu ein Hilfskript erstellt, welches du hier findest: https://git.geimist.eu/geimist/synOCR/src/branch/master/recursive_inputdir_workflow.shAbsolut großartig wäre es, wenn man die Möglichkeit hätte, über einen "Start Profil", einen Verzeichnis anzugeben, welches alle darin enthaltenen Unterordner durchläuft, Dateien OCR`ed, ggf umbenennt, aber im gleichen Verzeichnis belasst …
Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.
Als Dankeschön schalten wir deinen Account werbefrei.