Auf Thema antworten

Kleine Anmerkung zur Python-Datumssuche.

Folgendes Verhalten:

2023-09-30 23:10:50,334 - Line from File: GERMANY 92342 September 13, 2023

2023-09-30 23:10:50,383 - Found date 02.09.2013


Zwischen 92342 und September hat die Originaldatei ganz viele Leerzeichen, die bei der Suche aufgrund der "Leerzeichen entfernen"-Option natürlich weg sind.


Prinzipiell zwei Vorschläge:

- Vorschlag 1: Die Leerzeichen-Entfernung nur für die normale Regex-Suche verwenden, nicht aber für die Datums-Suche.

- Vorschlag 2: Sofern die erste Zahl ein Teil eines viel größeren Worts ist (= nicht durch Leerzeichen getrennt), sollte diese nicht für die Datumserkennung herangezogen werden. In dem Fall gehört die 2 ja zur PLZ 92342.


Persönlich fände ich Vorschlag 2 besser, falls machbar.

Wie seht ihr das?


Additional post fields