synOCR synOCR - GUI für OCRmyPDF

CSchmitt

Benutzer
Mitglied seit
29. Mrz 2018
Beiträge
40
Punkte für Reaktionen
8
Punkte
8
Ohje da hätte ich jetzt auch nicht drauf geachtet. Aber schön das es wieder klappt ??
 
Zuletzt bearbeitet von einem Moderator:

tt-wb

Benutzer
Mitglied seit
19. Okt 2020
Beiträge
7
Punkte für Reaktionen
1
Punkte
3
Hallo - vielen Dank für diese toller Erweiterung.

Dazu eine Frage: Kann man folgenden Workflow abbilden:
Datei wird eingelesen - OCR - es erfolgt ein Abgleich mit einer Kundendatei als Excel Liste nach z.B. Kundennummer und Name - die Datei wird dann unter diesen beiden Kriterien abgelegt xxx_Kundennummer_Name
Oder ist das zu komplex?

Vielen Dank!
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
das ist möglich mit z.B. der existierenden YAML Konfiguration. Suche nach Kundennummer und Ablage in Verzeichnis.
 
  • Like
Reaktionen: geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Falls die Excelliste dynamisch ist, kannst du die Regeldatei via Makro/VBS generieren lassen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
So nativ geht das nicht. Das YAML-File muss die Daten der Excel-Tabelle enthalten. Daher mein Hinweis auf ein Excel-Makro.
 

tt-wb

Benutzer
Mitglied seit
19. Okt 2020
Beiträge
7
Punkte für Reaktionen
1
Punkte
3
Muss man da jetzt für jeden Datensatz (Kundennummer, Name) jeweils einen Regelblock als den Suchstring erstellen oder kann man diese Datensätze nach denen gesucht werden soll kommagetrennt oder so als Block einfügen?
 

CSchmitt

Benutzer
Mitglied seit
29. Mrz 2018
Beiträge
40
Punkte für Reaktionen
8
Punkte
8
Muss man da jetzt für jeden Datensatz (Kundennummer, Name) jeweils einen Regelblock als den Suchstring erstellen oder kann man diese Datensätze nach denen gesucht werden soll kommagetrennt oder so als Block einfügen?
Ich glaube was er meint ist, in Excel selbst ein Makro anzulegen was über deine Excelliste iteriert und am Ende ein yaml ausspuckt wo die Regeln "hardcoded" (generiert aus dem script) drinstehen.
Im Endeffekt generierst du das yaml aus deiner Quelle, nämlich dem excel.


Edit: okay nach dem zweiten Mal lesen hab auch ich es verstanden. Ich denke du musst für jede kundennummer einen eigenen Tag machen
 
  • Like
Reaktionen: geimist

tt-wb

Benutzer
Mitglied seit
19. Okt 2020
Beiträge
7
Punkte für Reaktionen
1
Punkte
3
Ach herrje..... hat jemand zufällig so ein Grundmakro für Yaml für Excel erstellt und kann es zur Verfügung stellen? Vielen Dank.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Es ist 'nur' ein Textfile, welches korrekt (besonders die führenden Leerzeichen) formatiert sein muss (Infos findest du im Beispielfile).
Bei Microsoft Markros kann ich dir leider nicht helfen. Wenn du diese Anforderung in einem entsprechenden Forum erfragst, sollte die Hürde mit ein wenig Ambition überwindbar sein.
 
Mitglied seit
30. Nov 2014
Beiträge
49
Punkte für Reaktionen
3
Punkte
8

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Mir ist jetzt aufgefallen das wenn ich ein PDF habe was er nicht bearbeiten kann, dann legt er ein temp_name.pdf an und arbeitet die nachfolgenden nicht mehr ab. Somit fängt er beim nächsten Lauf zwangsläufig mit dem PDF an was er nicht abarbeiten kann und bricht dann wieder ab.
Dazu bräuchte ich mal ein Log. Das kannst du mir hier privat hochladen.
 

Biernot78

Benutzer
Mitglied seit
26. Okt 2018
Beiträge
50
Punkte für Reaktionen
3
Punkte
8
Hallo,
kann mir jemand erklären warum meine PDFs nicht umbenannt werden ?

Unbenannt.PNG
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
In deinem Log steht, dass keine Tags definiert sind. Hast du evtl. unterschiedliche Profile (inkl. das default-Profil), welche vielleicht bereits vorher abgearbeitet werden? Dein Log stammt vom Abarbeiten des Profils "Alle Scanns".
 

Biernot78

Benutzer
Mitglied seit
26. Okt 2018
Beiträge
50
Punkte für Reaktionen
3
Punkte
8
Ja ich habe 3 Profile drin brauch aber nur einer - ich lösch die anderen beiden mal
 

Biernot78

Benutzer
Mitglied seit
26. Okt 2018
Beiträge
50
Punkte für Reaktionen
3
Punkte
8
Asche auf mein Haupt - Das Profil war deaktiviert - jetzt geht es
 
  • Like
Reaktionen: geimist
Mitglied seit
30. Nov 2014
Beiträge
49
Punkte für Reaktionen
3
Punkte
8
Ja, ich bin spät dran - sehr spät. Habe aber gerschrieben, dass es nicht eilt, da es mit dem Textfeld funktioniert.
Werde heute oder morgen mal testen!
Danke!
Die Version funktioniert gar nicht. Es werden keine Stichworte in den Dateinamen geschrieben und die Datei wird auch nicht ins Backup-Verzeichnis kopiert.
Input:SCN_002433.pdf
Output: temp_SCN_002433_1605170876.pdf
Das gilt für Textfeld und externe Datei.
 
Mitglied seit
30. Nov 2014
Beiträge
49
Punkte für Reaktionen
3
Punkte
8
Ich nutze aktuell immer noch das Textfeld, finde die externe Tagdatei aber sehr interessant:
Wird die externe Tagdatei von oben nach unten durchgearbeitet?
Hintergrund wäre: Wenn ich die Tags logisch anordne und beim der letzten zugehörigen Tag einer logischen Einheit einen Zielordner definiere, werden dann die folgenden Tags trotzdem noch erfasst oder wird die Datei dann sofort ins Zielverzeichnis kopiert?

Beispiel - Auf jeder Baumarktrechnung stehen die Bankdaten des Baumarkts. Diese sollen jedoch nicht als Tag in den Dateinamen eingetragen werden, wenn es sich um eine Baumarktrechnung handelt. Würde das funktionieren bzw. wo würde die Datei landen (target1 oder target2) ?

Rechnung_1:
tagname: Rechnung
targetfolder:
condition: any
subrules:
- searchstring: Rechnung
searchtyp: is
isRegEx: false
source: content
casesensitive: true
Baumarkt_2:
tagname: Baumarkt
targetfolder: //volumeX/target1
condition: any
subrules:
- searchstring: Baumarkt
searchtyp: is
isRegEx: false
source: content
casesensitive: true
Bankname_3:
tagname: Bankname
targetfolder: //volumeX/target2
condition: any
subrules:
- searchstring: Bankname
searchtyp: is
isRegEx: false
source: content
casesensitive: true
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat