synOCR synOCR - GUI für OCRmyPDF

geimist · 24. Apr. 2023

Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.

Yippie · 25. Apr. 2023

geimist schrieb:
Den Wunsch, ein manuelles Skript / Befehl ausführen zu können, gab es schon einmal. Ich tue mich damit aber schwer, weil Oma Gertrud dann sieht: "Oh, hier ist ein Formularfeld - gleich mal was eintragen …"

Ja, von mir aber meine Oma heist nicht Gertrud und hat mit IT schon Mal gar nix am Hut und auf dem NAS auch nix verloren

Ansonsten ist die Forderung schon irgendwie legitim, ich hatte ja auch bereits um eine solche Erweiterung gebeten

Für mich wäre schon hilfreich, wenn ich in jeder Regel der YAML-Datei, einen Befehl zur Ausführung eines Skripts angeben könnten, denn dann wäre es möglich, die durch die Regel bearbeitete Datei bspw. an einen anderen Ort zu verschieben. Oder aber auch per FTP oder einem anderen Protokoll irgendwo hochzuladen.

geimist · 25. Apr. 2023

Ja, ja … ich hab's doch schon eingebaut

Man wird bei jeder Regel noch den Wert postscript: angeben können. Da kann man dann einen Einzeiler oder den Pfad zu einem Skript angeben. Soll es immer greifen, so erstellt man halt eine Universalregel mit dem RegEx .*. Man kann aber auch mehrere Befehle bei Erfüllung mehrerer Regeln kombinieren.

ThomGee · 25. Apr. 2023

DANKE!
Wird gleich getestet, wenn der Download verfügbar ist ...

geimist schrieb:
Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.

Bash:

Could not open input file: /volume1/web/nextcloud/occ

Das funzt also leider nicht

geimist · 25. Apr. 2023

ThomGee schrieb:
Wird gleich getestet, wenn der Download verfügbar ist ...

Bitte noch etwas Geduld.

ThomGee schrieb:
Bash:

Could not open input file: /volume1/web/nextcloud/occ

Das funzt also leider nicht

Guck mal, ob du da vielleicht die Rechte entsprechend anpassen kannst. Sonst wird dir das Feature nicht viel bringen.

PS: … es sei denn, du startest synOCR dann über root.

ThomGee · 25. Apr. 2023

geimist schrieb:
Guck mal, ob du da vielleicht die Rechte entsprechend anpassen kannst. Sonst wird dir das Feature nicht viel bringen.

PS: … es sei denn, du startest synOCR dann über root.

F*** das Skript kann nur vom Besitzer der Conf-datei von nextcloud ausgeführt werden.
Auch das kann ich modifizieren, aber ich glaub da komm ich in Teufels Küche, wenn ich da noch mehr Rechte, geschweige denn Besitzer ändere.

Ich werde mich also mal bei inotifywait einlesen und gucken wie sauber das mit Synology läuft
Sieht irgendwie vielversprechend aus. Muss nur die Ausgaben auswerten und dafür sorgen, dass das Monitoring am laufen bleibt.

Umsonst sind Deine Bemühungen dennoch nich

Ein fettes Danke von mir - ich werde es in anderem Zusammenhang denoch bestimmt brauchen
Yippie wird sich freuen...
Die vielen anderen Tüftler

Danke für das coole Tool!

Yippie · 25. Apr. 2023

ThomGee schrieb:
Yippie wird sich freuen...

Nö, wieso?
.
.
.
DOCH! Natürlich freue ich mich. Konnte es nur noch nicht testen.
Vielen herzlichen Dank!

geimist · 25. Apr. 2023

Yippie schrieb:
Konnte es nur noch nicht testen.

Ich weiß nicht, ob es diese Woche noch mit einer neuen Beta wird. Da ist dann aber auch eine Überraschung für dich eingebaut.

Yippie · 25. Apr. 2023

geimist schrieb:
Ich weiß nicht, ob es diese Woche noch mit einer neuen Beta wird. Da ist dann aber auch eine Überraschung für dich eingebaut.

Aha! Kanns kaum erwarten

DeeKay1 · 28. Apr. 2023

Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).

geimist · 28. Apr. 2023

Ey, das klingt ja spannend

DeeKay1 schrieb:
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Es kommt halt auf den Aufwand an und wie das implementiert werden soll.

DeeKay1 schrieb:
Man müsste es jeweils selbst hosten

Da denke ich ja gleich weiter, ob man es in Zukunft auch mit llama.cpp auf der DS nutzen könnte

DeeKay1 · 28. Apr. 2023

geimist schrieb:
Da denke ich ja gleich weiter, ob man es in Zukunft auch mit llama auf der DS nutzen könnte

Das wäre natürlich noch viel interessanter.

Ich hatte nur direkt an synOCR gedacht als er es mir gezeigt hat, da es ja auch auf Bash basiert. Der Integrationsaufwand dürfte daher überschaubar sein, da die Grundstruktur bereits übereinstimmt und das GPT-4-Script lauffähig ist.
Und ja, ich bin selbst Entwickler und weiß das wir hier immer noch von mehreren Tagen und nicht von Minuten reden

geimist · 28. Apr. 2023

Ich werde mich in nächster Zeit diesem zusätzlichen Feature nicht eigenständig annehmen können, aber wenn du dir die Implementierung mal ansehen möchtest, sehr gerne. Wir können das ja weiter auf GitHub diskutieren, wenn du möchtest.

DeeKay1 · 28. Apr. 2023

Same. Jetzt kommt der Frühling und der Garten hat Vorrang. Aber die Regentagen werden auch wieder kommen, daher auch meine Anfrage ob überhaupt Interesse besteht. Dann lass uns mal ein Issue auf GitHub erstellen und das da weiterverfolgen.

OverDodo · 29. Apr. 2023

Hey, erstmal vielen Dank für deine Arbeit! Mir ist etwas aufgefallen.. Ich scanne mittlerweile direkt auf PDF/A und möchte jetzt eben noch OCR drüber laufen lassen.. Das ganze funktioniert auch, jedoch zeigt mir verapdf nach dem ocr an, dass die neue pdf nicht konform mit dem Standard ist.. Ich dachte, es liegt an ocrmypdf, habe also auf einer ubuntu vm dieselbe pdf versucht, da ist das output konform.. Ich führe da den folgenden Befehl aus:

Code:

ocrmypdf 20230429_183104.pdf outNew.pdf -srd -l deu+eng

Nutze dieselben Parameter auch in synOCR.. Habe auch mit dem output-type parameter gespielt, hat nix geändert.. Habe auch die verschiedenen Docker images in synOCR getestet, auf Ubuntu läuft 13.4.0+dfsg

Habe leider noch nichts dazu gefunden, woran könnte das denn liegen?

geimist · 29. Apr. 2023

Das liegt an PyPDF2. Im nächsten Release setzen wir auf pikepdf, womit das schon wesentlich besser aussieht. Da gibt es derzeit zwar noch eine Fehlermeldung bei den Metadaten, aber sonst wird es fehlerfrei verifiziert.

OverDodo · 29. Apr. 2023

Ah super! Vielen Dank, freue mich drauf

Gthorsten · 30. Apr. 2023

DeeKay1 schrieb:
Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).

Was würde denn da passieren. Also die Dokumente sind durch den OCR process und das gpt4 macht dann ohne irgendwelche Regeln daraus Datei Namen?

Dann habe ich das aber nicht mehr unter Kontrolle. Heute entscheide ich ja per Regel wie die Datei heißt?
Oder habe ich da was falsch verstanden?

geimist · 30. Apr. 2023

Ich gehe schon davon aus, dass man seine Wünsche formulieren muss.
Vielleicht wird es auch eher eine Alternative Möglichkeit der Steuerung.

allahopp · 30. Apr. 2023

Hi,

in anderen Threads bin ich über das Thema "Aktualisierung von Docker-Container" und die Bereinigung von unreferenzierten Images gestoßen.
Ich habe mir mal alle Images auflisten lassen und da kommt "ocrmypdf" häufiger vor.

Sehe ich das richtig, dass dies damit zusammenhängt, da dieses Image bei jeder Nutzung von "synOCR" mit dem Tag "latest" aufgerufen wird und bei jedem neuen Update des Images eine unreferenzierte Verision entsteht?

Gibt es in "synOCR" eine Routine, mit welcher diese nicht getaggten Image-IDs gelöscht werden können, oder ist dies (in meinem Fall) über SSH manuell durchzuführen?

Danke und Gruß
Frank

NAS:	DS920+ (20GB, DSM7.1.1) - 4x8TB Seagate IronWolf (ST8000VN004) - (BTRFS/SHR1)
UPS:	EATON - Ellipse PRO 650
Netzwerk:	Fritz.Box 6660 cable

NAS:	DS920+ (20GB, DSM7.1.1) - 4x8TB Seagate IronWolf (ST8000VN004) - (BTRFS/SHR1)
UPS:	EATON - Ellipse PRO 650
Netzwerk:	Fritz.Box 6660 cable

synOCR synOCR - GUI für OCRmyPDF

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Anhänge

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Additional post fields

Kaffeautomat