Kleine Anmerkung zur Python-Datumssuche.
Folgendes Verhalten:
2023-09-30 23:10:50,334 - Line from File: GERMANY 92342 September 13, 2023
2023-09-30 23:10:50,383 - Found date 02.09.2013
Zwischen 92342 und September hat die Originaldatei ganz viele Leerzeichen, die bei der Suche aufgrund der "Leerzeichen entfernen"-Option natürlich weg sind.
Prinzipiell zwei Vorschläge:
- Vorschlag 1: Die Leerzeichen-Entfernung nur für die normale Regex-Suche verwenden, nicht aber für die Datums-Suche.
- Vorschlag 2: Sofern die erste Zahl ein Teil eines viel größeren Worts ist (= nicht durch Leerzeichen getrennt), sollte diese nicht für die Datumserkennung herangezogen werden. In dem Fall gehört die 2 ja zur PLZ 92342.
Persönlich fände ich Vorschlag 2 besser, falls machbar.
Wie seht ihr das?