Hallo
Ich suche nach einer möglichkeit das Datum aus einem PDF zuverlässig auszulesen. Leider klappt das ziemlich schlecht wenn man ältere Dokumente scannen möchte.
Fall a) das Dokument wurde am Datum X erstellt und hat diese Information in den Metadaten der Datai. (kann man in Datei Explorer sehen )
- sollte dieses Dokument klassifiziert werden und man hat eine Regel die ebenfalls versuch ein Datum aus dem Text zu erkennen -> Problem. Häufig wird das Datum nicht korrekt erkannt und durch einen Default werd der Regel ersetzt.
- b)
Versucht man eine Regel zu definieren bei der das Datum irgendwo auf dem Dokument steht, klappt das nur in sehr speziellen Fällen. Ist das Datum etwas verrutscht oder mal in einem anderen Format -> Problem.
zu a) gibt es nicht eine Regel: Wenn du das Datum nicht richtig auslesen kanns -> nimm doch das Datei datum
zu b) gibt es nicht flexiblere datumsregeln: z.B. dd. MMMM yyyy || d. MMMM yyyy
Oder funktioniert das und ich habe nur einen Fehler gemacht?
Ich suche nach einer möglichkeit das Datum aus einem PDF zuverlässig auszulesen. Leider klappt das ziemlich schlecht wenn man ältere Dokumente scannen möchte.
Fall a) das Dokument wurde am Datum X erstellt und hat diese Information in den Metadaten der Datai. (kann man in Datei Explorer sehen )
- sollte dieses Dokument klassifiziert werden und man hat eine Regel die ebenfalls versuch ein Datum aus dem Text zu erkennen -> Problem. Häufig wird das Datum nicht korrekt erkannt und durch einen Default werd der Regel ersetzt.
- b)
Versucht man eine Regel zu definieren bei der das Datum irgendwo auf dem Dokument steht, klappt das nur in sehr speziellen Fällen. Ist das Datum etwas verrutscht oder mal in einem anderen Format -> Problem.
zu a) gibt es nicht eine Regel: Wenn du das Datum nicht richtig auslesen kanns -> nimm doch das Datei datum
zu b) gibt es nicht flexiblere datumsregeln: z.B. dd. MMMM yyyy || d. MMMM yyyy
Oder funktioniert das und ich habe nur einen Fehler gemacht?