synOCR synOCR - GUI für OCRmyPDF

dewenni

Benutzer
Mitglied seit
05. Okt 2019
Beiträge
8
Punkte für Reaktionen
1
Punkte
1
Hallo geimist,
auf von mir ein großes Lob und Dankeschön!

Was mir noch fehlt ist die Möglichkeit nach einem Schlüsselwort zu suchen und dieses durch ein anderes zu ersetzten.
Beispiel: Suche nach "DKB" => ersetzte mit "Bank"

Oder geht das schon und ich habe es nur noch nicht erkannt?

Grüße
Sven
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
Statt ersetzen würde ich eher hinzufügen bevorzugen damit man auch weiterhin DKB findet...
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.378
Punkte
234
… Was mir noch fehlt ist die Möglichkeit nach einem Schlüsselwort zu suchen und dieses durch ein anderes zu ersetzten.
Beispiel: Suche nach "DKB" => ersetzte mit "Bank"…
Ja, das fehlt mir auch noch :eek:
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54

Mirko1

Benutzer
Mitglied seit
02. Nov 2013
Beiträge
34
Punkte für Reaktionen
1
Punkte
8
Einrichtung von OCRmyPDF und SynoOCR

Hallo,

ich beschäftige mich schon eine Zeitlang mit dem Thema scheitere aber scheinbar an den Grundlagen.
Gibt es irgendwo eine Schritt für Schritt Anleitung (wenn es geht auf deutsch und für Laien) was man in Docker genau einstellen muss.
Der Start der Cointainer beendet sich immer wieder. Scheinbar muss man bei Ordner etwas einstellen. Dort scheitere ich aber an dem so genannten "Mount-Pad" was muss denn dort rein?

Danke für eure Hilfe.
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134

Mirko1

Benutzer
Mitglied seit
02. Nov 2013
Beiträge
34
Punkte für Reaktionen
1
Punkte
8
Alles klar. Ich hab das die ganze Zeit versucht im Docker zu installieren dabei ist das ja ein normales Paket.

Wie durchsucht ihr die dann erstellten PDFs? Also wenn ich jetzt 1000 Dateien habe und irgendwas in dem Volltext der unterschiedlichen PDFs suchen will um die richtige Datei zu finden.
Gibt es dafür eine schöne Lösung. Also quasi ein Programm ws den Text aus den PDFs speichert und dann mir sagt in welcher Datei das gesuchte steht.
 
Zuletzt bearbeitet:

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Genau, das ist der treffende Punkt. :)
 

Mirko1

Benutzer
Mitglied seit
02. Nov 2013
Beiträge
34
Punkte für Reaktionen
1
Punkte
8
Vielleicht ist meine andere Frage untergegangen weil ich sie im Nachhinein eingefügt hatte. Deshalb nochmal:

Wie durchsucht ihr die dann erstellten PDFs? Also wenn ich jetzt 1000 Dateien habe und irgendwas in dem Volltext der unterschiedlichen PDFs suchen will um die richtige Datei zu finden.
Gibt es dafür eine schöne Lösung. Also quasi ein Programm ws den Text aus den PDFs speichert und dann mir sagt in welcher Datei das gesuchte steht.
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Option 1:
Universal Search benützen auf der DS (Paket da, sofern es nicht vorinstalliert ist - bin mir nicht sicher)

Option 2:
Ordner als Netzwerklaufwerke einbinden -> PC via Explorer / Mac via Finder (nicht Spotlight!) nach Dateien suchen.
 

Mirko1

Benutzer
Mitglied seit
02. Nov 2013
Beiträge
34
Punkte für Reaktionen
1
Punkte
8
Danke. Ich meinte eher als extra Programm welches ich auch auf dem Handy laufen lassen kann. Universal Search gibt es ja leider nicht als App.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.378
Punkte
234
Meine Dokumente liegen in einem (von UniversalSearch indiziertem) TeamOrdner. Die Volltextsuche steht in der Drive-App auch zur Verfügung (auch wenn die Dokumente nicht offline verfügbar gemacht wurden).
 

schrecki

Benutzer
Mitglied seit
24. Jan 2020
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo geimist,

Riesen Respekt für synOCR! Ich bin schon seit langem auf der Suche nach einem OCR Tool, deines ist Super! Funktioniert tadellos!

Für stellt sich noch eine Frage ob synOCR folgendes kann, vlt. habe ich es aber auch nicht richtig verstanden.....

Folgendes:
ich nutze die Funktion der Kategorie Ordner nun möchte ich gerne folgendes umsetzen:
Beispiel:
Suche in der PDF nach: Julia Meier + Rechnung + Auto dann verschiebe die PDF in den Ordner Dokumente/Julia/KFZ/Rechnungen

Suche in der PDF nach: Florian Meier + Rechnung + Auto dann verschiebe die PDF in den Ordner Dokumente/Florian/KFZ/Rechnungen

Suche in der PDF nach; Julia Meier + Lohnabrechnung dann verschiebe die PDF in den Ordner Julia/Arbeit/Lohnabrechnungen


Ist so etwas möglich?

Ich habe schon folgendes ausprobiert ohne die "und" Verknüpfungen, aber anscheinend funktioniert bei den Kategorien nur ein direkter Unterordner im Ausgabeverzeichnis, korrekt?
Julia Meier=Dokumente/Julia


Vielen Dank für dieses Super Tool!!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.378
Punkte
234
Derzeit werden ja ALLE Regeln in einem einzigen Textfeld abgebildet. Konsequenterweise sollten jetzt noch logische Operatoren hinzukommen, sowie Regeln (wie in deinem Fall). Das kann man keinem User auf diese Art zumuten (es müsste ja alles über eine Syntax geschachtelt und gesteuert werden). Das müsste man irgendwie in der GUI schematisch abbilden können - ich kann das aber nicht umsetzen (da keine Ahnung vom Webdesign).

Solange ich da also keine Unterstützung habe, werden wir das wohl nicht hinbekommen … :(
 

Franzi1

Benutzer
Mitglied seit
28. Jan 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Datumsformat wird verworfen

Hallo geimist,
hallo liebes Forum,

eine große Lob für synOCR. Heute habe ich mal meine Dokumente auf meinem NAS durchlaufen lassen, waren ca. 500 Dokumente. Bei 460 hatte er das Datum korrekt erkannt und angewandt, bei 40 gleich aufgebauten Dokumenten letzteres leider nicht.

In der LOG steht folgendes:
-----------------------------------
| ==> Installationsinfo <== |
-----------------------------------

synOCR-User: root
synOCR-Version: 0.15.2
Architektur: x86_64
DSM-Build: 24922
Gerät: 218plus (2140664893)
aktuelles Profil: Datum anfügen
verwendetes Image: jbarlow83/ocrmypdf
verwendete Parameter: --force-ocr -rd -l deu
ersetze Suchpräfix: no
Umbenennungssyntax: §y-§m-§d_§tit
Loglevel: normal
Anwendungsverzeichnis: /usr/syno/synoman/webman/3rdparty/synOCR

...

/SEV Abrechnungen neu/SEV Abrechnung 0119.pdf
prüfe Datum: S001/505238-07/8912019ZMCS --> ungültiges Format
prüfe Datum: 18.01.2019 --> ungültiges Format
prüfe Datum: S001/505238-07/8912019ZMCS./synOCR.sh: line 467: 10#S001: value too great for base (error token is "10#S001")
--> ungültiges Format
Datum nicht gefunden - verwende Dateidatum:
Tag: 21
Monat:07
Jahr: 2019
wende Umbenennungssyntax an --> 2019-07-21_SEV Abrechnung 0119
Zieldatei: 2019-07-21_SEV Abrechnung 0119.pdf

Das Datumsformat 18.01.2019 wird erkannt, jedoch wird es verworfen. Woran könnte das liegen?



Vielen DANK nochmals für dieses super Tool. Es hat mir einiges an Zeit erspart.
 

guidovg

Benutzer
Mitglied seit
26. Nov 2011
Beiträge
142
Punkte für Reaktionen
43
Punkte
34
@Schrecki:

Ich weiß nicht ob es für Dich eine gut Lösung ist, aber bei mir ermöglicht diese genau das, was Du machen willst. Ich habe auf dem Mac die Anwendung "Hazel" laufen. Auf dem PC soll es etwas vergleichbares unter dem Namen FileJuggler geben. Vorteil: Es ist sehr einfach unendlich viele Regeln per GUI zu erstellen. Nachteil: Es muss der Mac/PC laufen. Ich kann da jedoch ganz gut mit leben. Alle Dokumente landen nach der OCR-Bahndlung eh im Output Ordner. Sobald mein Mac an ist bearbeitet er den Output Ordner was sehr schnell geht.

Leider habe ich noch Nichts gefunden, dass den Leistungsumfang von Hazel bietet und direkt auf der Synology läuft.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.378
Punkte
234

winka

Benutzer
Mitglied seit
25. Dez 2013
Beiträge
432
Punkte für Reaktionen
0
Punkte
16
Guten Morgen,

@geimist, ich habe jetzt auch meine Dokumente in Drive im Teamordner freigegeben und kann, wir zuvor auch in DSFile, die Suche verwenden. Doch leider ist die Suche recht unscharf. Suche ich zum Beispiel nach "Rentenversicherung" und nach "2018" listet er alle Ergebnisse auf die eines von beidem enthalten. Kennst du Suchparameter durch die beides im Dokument gesucht und gefunden wird?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.378
Punkte
234
Du meinst die mobile Drive-App?

Gerade probiert: Leerzeichen ist bei mir UND-Operator

Oder meinst du woanders?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat