synOCR synOCR - GUI für OCRmyPDF

allahopp

Benutzer
Mitglied seit
15. Mai 2022
Beiträge
133
Punkte für Reaktionen
10
Punkte
18
Aktuell die Version "1.3.99.8"
 

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.890
Punkte für Reaktionen
1.510
Punkte
274

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
OK, interessant. Ich habe keine dangling Images.
Liefert das die entsprechende Liste?:
Bash:
docker images -f "dangling=true" --format "{{.ID}}:{{.Repository}}:{{.Tag}}" 2>/dev/null | grep -q "ocrmypdf"

Das sollte die dangling Images löschen:
Bash:
docker rmi -f $(docker images -f "dangling=true" --format "{{.ID}}:{{.Repository}}:{{.Tag}}" 2>/dev/null | grep "ocrmypdf" | awk -F: '{print $1}') 2>/dev/null

Könnt ihr das mal auf der Shell testen?

Die Beta vom 12. März, 1.3.99.8 auch, @geimist ? Diese lässt sich leider nicht mit der neuesten Public updaten...
Die Beta (1.3.99.8 ist derzeit die letzte Beta) lässt sich nicht über ein Release mit einer geringeren Version installieren (es gibt noch kein neueres Release). Das nächste Release wird dann die Version 1.4.0 sein.
 

allahopp

Benutzer
Mitglied seit
15. Mai 2022
Beiträge
133
Punkte für Reaktionen
10
Punkte
18
docker images -f "dangling=true" --format "{{.ID}}:{{.Repository}}:{{.Tag}}" 2>/dev/null | grep -q "ocrmypdf"
Ohne die Option "-q" bei grep wird mir die Liste der unreferenzierten Images angedruckt (siehe Screenshot).

docker rmi -f $(docker images -f "dangling=true" --format "{{.ID}}:{{.Repository}}:{{.Tag}}" 2>/dev/null | grep "ocrmypdf" | awk -F: '{print $1}') 2>/dev/null
Das löschte meine 11 Images (siehe Screenshot).

1682886667777.png

So siehts jetzt aktuell aus:
1682886804996.png
@geimist

Dein Script funktioniert :)

Kann mir noch jemand kurz erklären was die sha256... Einträge bei den jeweiligen Images sind?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Ohne die Option "-q" bei grep wird mir die Liste der unreferenzierten Images angedruckt (siehe Screenshot).
Ja, mein Fehler. Im Skript soll damit nur geprüft werden, ob ein Löschen überhaupt nötig ist.

Dein Script funktioniert :)
Dann wundert es mich aber, dass es aber noch dangling Images bei dir gab. Also scheint es nicht korrekt zu greifen. Ich gucke es mir nochmal an.

Kann mir noch jemand kurz erklären was die sha256... Einträge bei den jeweiligen Images sind?
Das sind z.T. Imagefragmente. Docker nutzt die Prüfsummen ja überall für die Identifizierung.
 
Zuletzt bearbeitet:

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Leute,

ich habe mich die letzten Tage mal an einem synOCR YAML-Datei Editor auf Exel Basis versucht. Hier ist nun das Ergebnis.

Da ich mich durch den Editor erstmals mit VBA beschäftigt habe, war das eine recht schwere Geburt. :cautious: Ich hoffe der Code ist nicht allzu schlimm ...

Was kann der Editor ua.:
  1. Es gibt eine Import und Export Funktion. Dabei sind Kurz- und Standard Schreibweise möglich und werden auch erkannt.
  2. Es können rules, subrules erstellt, gelöscht und kopiert werden.
  3. Es erfolgt eine durchgängige Nummerierung.
  4. Alle "Values" sind per Drop Down Menu verfügbar.
  5. Es gibt ein Kommentarfeld zur besseren Zuordnung.
Dabei sind die Vorteile der Exel Version im Vergleich zum Editor recht gravierend, da man durch Suche, Filtern und natürlich mit der Kopierfunktion, bei der man ganze Regelblöcke recht schnell kopieren kann, und sich Abhängigkeiten der Regeln recht gut aufzeigen lassen kann.
Zugegeben ist die Darstellung im Gegensatz zu einem anderen Editor recht ungewohnt, aber daran gewöhnt man sich recht schnell.
Und zB. Fehler in der Nummerierung wie doppelte Nummern, oder fehlende oder zu viele Leerzeichen sind damit eigentlich ausgeschlossen.

Im Editor gibt es eine kleine Anleitung mit einigen Hinweisen, welche Ihr bitte lesen solltet. Die Datei ist nicht geschützt gespeichert. Ihr könnt also nach Herzenslust experimentieren. Zur Arbeitsweise würde ich denken, dass man jeweils einen Editor im jeweiligen Ordner eines Profils hat, und dann dort die gewünschten Änderungen jederzeit im- und exportieren kann.

Wenn Ihr 5-10 Minuten Eurer Zeit opfern könntet um den Editor einmal auszuprobieren, und Fehler, Änderungen oder Ergänzungen aufzuzeigen, wäre ich Euch dankbar.

Hier noch ein paar Bilder:
Unbenannt6.PNGUnbenannt7.PNG

Unbenannt8.PNGUnbenannt9.PNG

Gruß Karsten
 

Anhänge

  • synOCR_YAML_Editor_Version_01_01_46_2023_05_05_final.zip
    612,5 KB · Aufrufe: 14
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Ey, das find ich ganz stark :cool:
Ich finde es auch klasse, wie du dich dafür in VBA eingearbeitet hast. Ich hoffe, dass viele davon profitieren können.

(Ich habe leider nur LibreOffice auf dem Mac)

Vielen Dank für deine Mühe‼️
 
Zuletzt bearbeitet:

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Achtung:

Da ist wohl etwas schief gegangen. Der Import sollte bei Euch nicht funktionieren. Und die exportierte Variante läuft nicht in synOCR.
Sorry. Melde mich wieder wenn gefixt. Da passt etwas nicht mit dem Text Format.


Falls es doch bei jemand funzt bitte mal melden.

Danke Karsten
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo Leute,

pünktlich zum Wochenende kommt hier nun die gefixte Version. Wie sagt man, was lange währt .... Bin selbst Schuld. Das mit der Codepage ist schon blöde.
Der Funktionsumfang ist unverändert. Ich habe die Import- und Exportfunktion komplett rausgeschmissen und neu gemacht, damit wir synOCR die Textfiles in der richtigen Codepage liefern. Außerdem konnte ich so die Zeiten für Im-und Export halbieren.
Beim Import geht nun Unicode 8 mit und ohne BOM und CR, LF und CRLF als Trennzeichen. Exportiert wird grundsätzlich in Unicode 8 mit BOM und LF.
Für alle die Probleme habe, einfach mal melden. Solange in der Datei keine Sonderzeichen zerhackstückt sein sollten (also Äܧ usw), ist das recht schnell gefixt. Die Codepage zeigen übrigens die meisten Programme und Editoren an. Der Windows Editor zB unten rechts im Eck. Er ist zum editieren der YAML-Dateien eine sehr schlechte Wahl.

So nun bitte testet mal das Teil, um zu erfahren ob das überhaupt jemand nutzt. Ich habe gezwungener Maßen die letzten Tage viel damit in meinen YAML's rumgeändert. Ehrlich, Ihr könnt Euch gar nicht vorstellen, wie viele Fehler und ja sogar fast identische Regeln ich gefunden habe.

Bin gespannt auf Euer Feedback, und was man noch alles an Funktionen einbauen könnte.

Gruß Karsten
 

Anhänge

  • synOCR_YAML_Editor_Version_01_01_54_2023_05_12_final.zip
    588,4 KB · Aufrufe: 19

Schrotti

Benutzer
Mitglied seit
10. Okt 2020
Beiträge
22
Punkte für Reaktionen
3
Punkte
3
Tolle Sache ansich,
ich scheitere leider bereits daran, die Rules aus der TagConfig zu importieren, bekomme die Meldung das Wort rule muss enthalten sein.
:(
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hi Schrotti,

ich habe da schon eine Vermutung. Also 2 Fragen:
Hat die Yaml das richtige Format ?
Steht bei Dir die erste Rule ( .... rule.... ) in Zeile 1 ?
Karsten
 

Schrotti

Benutzer
Mitglied seit
10. Okt 2020
Beiträge
22
Punkte für Reaktionen
3
Punkte
3
Nee,
sieht bei mir so aus wie aus der GUI erstellt..
#-----------------------------------------------------------
# nachstehend die automatisch konvertieren Benutzerregeln:
#-----------------------------------------------------------

Rente_1:
tagname: Rentenversicherung
targetfolder: Rentenversicherung
condition: any
subrules:
- searchstring: Versicherungsnummer
searchtyp: contains
isRegEx: false
source: content
casesensitive: true
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Yep, das geht leider nicht.

Lies mal die Anleitung. ich brauche den Namen ..:.rule...., ansonsten habe ich keinen festen Bezugspunkt zum suchen.

Du kannst das Rente 1 gerne unter den Kommentaren im Editor einfügen.

Karsten
 

Schrotti

Benutzer
Mitglied seit
10. Okt 2020
Beiträge
22
Punkte für Reaktionen
3
Punkte
3
OK, händisch geändert, läuft.


Auch Karsten

PS sorry meine eigenen Typos fallen mir auch immer nicht auf, immer nur bei den anderen
habe einen gefunden im Button 'Insert a sublue'
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
882
Punkte für Reaktionen
184
Punkte
63
Hallo,

hier ein kleines Update mit ein paar Fehlerbehebungen.

Code:
Änderungen in Vers. 01.01.59
- gefixt, Dateien die die erste Rule oder Leerzeilen in Zeile 1 hatten, konnten nicht importiert werden
- gefixt, Exel friert beim Export (speichern unter) bei sehr großen / vielen Regelblöcken ein
- gefixt, die Ausgabedatei hatte eine feste Länge von 20000 Zeilen
- gefixt,  "Kopierzeilen" wurden bei der Funktion Copy nicht ausgeblendet
- Export Verzeichnis und Name nun Verzeichnis und Name der Editor-Datei als Vorauswahl
- Progress Anzeige für Im- und Export hinzu

Gruß Karsten
 

Anhänge

  • synOCR_YAML_Editor_Version_01_01_59_2023_05_13_final.zip
    606,7 KB · Aufrufe: 9
  • Like
Reaktionen: MacAir13 und geimist

adallmo

Benutzer
Mitglied seit
28. Mrz 2018
Beiträge
14
Punkte für Reaktionen
3
Punkte
3
Hallo zusammen,

wie ist ein update von synOCR durchzuführen? Die automatische Aktualisierung im Paketzentrum meines Synology-NAS scheint nicht zu funktionieren, obwohl für alle Pakete diese Funktion ausgewählt ist. Aktuell läuft die Version 1.3.1 bei mir problemlos (vielen Dank dafür!), auf dem Server von geimist wird die latest DSM7-Version mit 1.3.3 angegeben.

Die YAML-Dateien in den NAS-Archivordnern müssten bei einem manuellen Update erhalten bleiben, gilt dies auch für die Profile in synOCR? Muss die alte Version vorher deinstalliert werden?

Vielen Dank und beste Grüße!

Ansgar
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.375
Punkte
234
Die automatische Aktualisierung im Paketzentrum meines Synology-NAS scheint nicht zu funktionieren
Ja, weil auf CPHub noch eine völlig veraltete und defekte Version rumlungert, die ich aber nicht löschen kann. Das erfreut mich auch nicht gerade, weil es dadurch immer wieder zu Missverständnissen kommt. Ich kann es leider nicht beeinflussen.

Zum Update: Einfach von meinem Server laden und manuell installieren. Alle Einstellungen bleiben erhalten. Natürlich schadet es nie, wenn man auch synOCR mit Hyperbackup sichern lässt.
 
  • Like
Reaktionen: adallmo


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat