synOCR synOCR - GUI für OCRmyPDF

winka

Benutzer
Mitglied seit
25. Dez 2013
Beiträge
432
Punkte für Reaktionen
0
Punkte
16
Genau dort. Bei mir kommt alles von beidem, auch wenn nur eines zutrifft.

Eben auf Synology nachgelesen: Es werden alle Dateien angezeigt die beides im Dateinamen enthalten, bei indizierten Ordner aber alle die entweder das eine oder das andere Suchwort enthalten.

Regain auf dem Laptop ist ganz okay. Ist ähnlich wie Google. Gebe ich zum Beispiel "Rente" und 2018 ein, dann kommt auch ein Dokument welches zwar 2018 enthält, aber auch (lediglich) "Rent-a-car".
Ich habe es aber auf dem Server noch nicht zum laufen gebracht.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Genau dort. Bei mir kommt alles von beidem, auch wenn nur eines zutrifft. …
Wie gesagt: kann ich so nicht nachvollziehen:

Suche mit einem Begriff:
IMG_21A5918F04F3-1.jpg

Suche mit 2 Begriffen:
IMG_2B2822CBA831-1.jpeg

… Eben auf Synology nachgelesen: Es werden alle Dateien angezeigt die beides im Dateinamen enthalten, bei indizierten Ordner aber alle die entweder das eine oder das andere Suchwort enthalten. …
Hast du da mal bitte einen Link?
 

winka

Benutzer
Mitglied seit
25. Dez 2013
Beiträge
432
Punkte für Reaktionen
0
Punkte
16

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Ohne Sternchen gibt es kein Suchergebnis, aber wenn ich Mieterhöhung ausschraube, ist es das selbe Resultat. Ich wollte damit nur zeigen, dass durchaus aus Operatoren funktionieren.
 

winka

Benutzer
Mitglied seit
25. Dez 2013
Beiträge
432
Punkte für Reaktionen
0
Punkte
16
Screenshot_20200129-181819_Drive.jpgScreenshot_20200129-181832_Drive.jpgScreenshot_20200129-181819_Drive.jpgScreenshot_20200129-181904_Drive.jpg

Sorry für die zu großen Bilder.

Es lohnt sich scheinbar sich zu überlegen, welche Suchworte wohl genau oder ungenau sind und das Ungenaue mit einem Sternchen zu versehen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
synOCR v0.16.0

synOCR v0.16.0

IMPLEMENTIERUNGEN:
  • es steht wieder ein aktuelles "polyglot-Image" mit allen Sprachen zur Auswahl (das originale wurde ja von jbarlow83 eingestellt)
  • manuell heruntergeladene Images stehen ebenfalls zur Auswahl (sofern "ocrmypdf" im Namen enthalten ist)
    Sollte also ein spezielles Image von ocrmypdf gewünscht sein, so einfach in der DOCKER-GUI aus dem Hub laden (oder selber bauen)
  • eine tag-Kennzeichnung ist nun konfigurierbar (für keinen, einfach leer lassen)
  • Prüfung auf vorhandene Dockerinstallation
  • das Dateidatum der Ausgabedatei kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden
  • das Umbenennungsdatum kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden
BUGFIXES:
  • "beenden erzwingen" war nicht möglich
  • Dateidatum der Quelldatei wurde teilweise nicht korrekt auf die Ausgabedatei übertragen
  • Minorbugfixes
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
Merci Beaucoup, Stephan!

Könnte man vielleicht irgendwo, bevorzugt im ersten Posting dieses Beitrags hier, einen Hinweis/eine Beschreibung aufnehmen, wie man am besten ein Update vornimmt?

Ich gehe Mal davon aus: neues .SPK herunterladen und manuell installieren, aber ich denke, ein einfacher Satz wie dieser würde dem ein oder anderen evtl. weiterhelfen, oder du schreibst es jedes Mal in dein Posting rein, wenn du ein neues Update gebaut hast ;-)

Danke dir auf jeden Fall für dein großartiges Paket!
Michael
 

hamma50

Benutzer
Mitglied seit
10. Jan 2020
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Einfach automatisch updaten über das Paketzentrum.
 
Zuletzt bearbeitet von einem Moderator:

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
Hm, ach ja, dämliche Frage eigentlich von mir. Ich dachte nämlich, dass ich das Paket selbst heruntergeladen und installiert habe. Aber ja, du hast Recht, so soll's gehen :rolleyes:
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Deshalb immer die Empfehlung, die Installation über das Paketzentrum vorzunehmen. Voraussetzung dafür ist natürlich die eingebundene Paketquelle des community package hub.

Anleitung HIER
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
synOCR v0.16.0

super! Wieder mal ein Update, auch wenn ich ja immer noch auf das REGEx Upgrade warte (zwinker!)
Diese aktuelle Version, hat einen "Schönheitsfehler". Die Dateien werden konvertiert, aber im DSM Interface bleibt (zumindest bei mir) bleibt "bitte warten, bis die Dateien abgearbeitet sind" stehen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
… auch wenn ich ja immer noch auf das REGEx Upgrade warte (zwinker!) …

Ich bin mir des Bedarfs bewusst und zitiere mich hier noch mal selbst:
Derzeit werden ja ALLE Regeln in einem einzigen Textfeld abgebildet. Konsequenterweise sollten jetzt noch logische Operatoren hinzukommen, sowie Regeln (wie in deinem Fall). Das kann man keinem User auf diese Art zumuten (es müsste ja alles über eine Syntax geschachtelt und gesteuert werden). Das müsste man irgendwie in der GUI schematisch abbilden können - ich kann das aber nicht umsetzen (da keine Ahnung vom Webdesign). Solange ich da [diesbezüglich] also keine [fachkundige] Unterstützung habe, werden wir das wohl nicht hinbekommen:(
Vielleicht gelänge es mir, ein paar einfach Operatoren einzubauen, aber wenn, dann würde ich es gleich gern richtig machen und da kommen wir wieder zu obigen Punkt. Ich habe es jedenfalls nicht vergessen und mache mir auch weiterhin Gedanken!

… Diese aktuelle Version, hat einen "Schönheitsfehler". Die Dateien werden konvertiert, aber im DSM Interface bleibt (zumindest bei mir) bleibt "bitte warten, bis die Dateien abgearbeitet sind" stehen.

Diesbezüglich habe ich nichts geändert und hier funktioniert es auch noch. Das gab es aber schon immer, dass das Fenster diesen Status behielt (besonders bei langen Jobs und wenn man das Fenster / Browsertab gewechselt hat und während dessen der Job beendet wurde).
 

mamema

Benutzer
Mitglied seit
23. Okt 2009
Beiträge
667
Punkte für Reaktionen
132
Punkte
63
Vielleicht gelänge es mir, ein paar einfach Operatoren einzubauen, aber wenn, dann würde ich es gleich gern richtig machen und da kommen wir wieder zu obigen Punkt. Ich habe es jedenfalls nicht vergessen und mache mir auch weiterhin Gedanken!
ich zitiere mich nun auch selbst :)
für MICH geht "function over form". Darf kompliziert sein, wenn es das Interface im Webdesign nicht hergibt. Im Unix Bereich -> Synology basiert darauf, ist halt Kommandozeile angesagt......
"Richtig machen" ist Definitionssache. Diese Definition übernimmt klar der Entwickler!
Ich finde es eine Monsteraufgabe, etwas komplexes zu vereinfachen, was nicht vereinfachbar ist. Aber das ist nur IMHO
 

Harzo

Benutzer
Mitglied seit
01. Feb 2020
Beiträge
1
Punkte für Reaktionen
0
Punkte
0
Hallo Geimist,

ich habe mich, aufgrund dieses Forums und Deiner Entwicklung, in den letzten Tagen mit ein bisschen Hardware ausgestattet (DS 218+, Brother 2700W). Ich hatte etwas bedenken, ob ich Software-seitig alles hinbekomme, aber das war unbegründet! Es lief von Anfang an alles einwandfrei und nach und nach verschwinden meine Papierordner aus dem Schrank.

Dafür, dass Du Dein Tool zur Verfügung stellst und hier im Forum Rede und Antwort stehst, möchte ich mich ganz herzlich bei Dir bedanken!!!!
 

Entenpunk

Benutzer
Mitglied seit
05. Nov 2010
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Hallo Community,

@Stephan,
vielen Dank für das echt coole Tool. Macht richtig Spaß. (Bis auf mein kleines Problem...)

@all,
Warum gibt es einen Unterschied beim benennen der Datei? Es sind "Punkte" statt "Striche". Was mache ich falsch?
Siehe Bild.

Danke für Eure Hilfe
Christianscan.jpg

PS: Wie bekomme ich das Bild kleiner?
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
… Warum gibt es einen Unterschied beim benennen der Datei? Was mache ich falsch?
Siehe Bild.
Check mal, ob du noch ein anderes Profil mit den entsprechenden Einstellungen hast, was ggf. vorher abgearbeitet wird.

Sonst schicke mir mal bitte das passende Log per PN oder poste es.

PS: Wie bekomme ich das Bild kleiner?
vor dem Hochladen kleiner machen …
 

Entenpunk

Benutzer
Mitglied seit
05. Nov 2010
Beiträge
6
Punkte für Reaktionen
0
Punkte
1
Danke für die schnelle Antwort. Ja, es gab noch das Default-Profil. Ich lösche es.

Das stand ja auch im Text bei den synOCR Einstellungen. Sorry. ;-)

Danke Stephan.

Viele Grüße
Christian
 
Zuletzt bearbeitet:

winka

Benutzer
Mitglied seit
25. Dez 2013
Beiträge
432
Punkte für Reaktionen
0
Punkte
16
Ich habe ein Problem, welches ich so nicht erwarten würde.
Von der Idee einen Paginierstempel zu nutzen bin ich abgekommen und habe mir als Alternative DMS-Barcode-Etiketten bestellt.
Die ersten die kamen waren recht klein und es gab Probleme bei der Erkennung der Zahlen durch OCR. Ok, reklamiert und größere erhalten die deutlich lesbar sind.
Trotzdem werden die eigentlich garnicht durch OCR erkannt.

Habt ihr eine Erklärung dafür?

Unbenannt.JPG
 

Anhänge

  • Test.pdf
    338 KB · Aufrufe: 12
Zuletzt bearbeitet:

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Hast du mal mit einem anderen Docker-Image (gemist statt jbarlow) in diesem Tool probiert?
Ansonsten kann gemist evtl. mehr dazu schreiben.

Aber du, wieso bist du von dem Paginerstempel abgekommen? Die Idee an und für sich fände ich schon super und hätte eh gerne mal versucht, aber wenn du schon damit keine Erfolge hast, würde ich gerne wissen, bevor ich damit experimentiere. :)
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat