synOCR synOCR - GUI für OCRmyPDF

Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.
 
Den Wunsch, ein manuelles Skript / Befehl ausführen zu können, gab es schon einmal. Ich tue mich damit aber schwer, weil Oma Gertrud dann sieht: "Oh, hier ist ein Formularfeld - gleich mal was eintragen …" 🤕
Ja, von mir aber meine Oma heist nicht Gertrud und hat mit IT schon Mal gar nix am Hut und auf dem NAS auch nix verloren :p
Ansonsten ist die Forderung schon irgendwie legitim, ich hatte ja auch bereits um eine solche Erweiterung gebeten :cool:

Für mich wäre schon hilfreich, wenn ich in jeder Regel der YAML-Datei, einen Befehl zur Ausführung eines Skripts angeben könnten, denn dann wäre es möglich, die durch die Regel bearbeitete Datei bspw. an einen anderen Ort zu verschieben. Oder aber auch per FTP oder einem anderen Protokoll irgendwo hochzuladen.
 
Ja, ja … ich hab's doch schon eingebaut ;)

Man wird bei jeder Regel noch den Wert postscript: angeben können. Da kann man dann einen Einzeiler oder den Pfad zu einem Skript angeben. Soll es immer greifen, so erstellt man halt eine Universalregel mit dem RegEx .*. Man kann aber auch mehrere Befehle bei Erfüllung mehrerer Regeln kombinieren.
 
DANKE!
Wird gleich getestet, wenn der Download verfügbar ist ... :)

Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.
Bash:
Could not open input file: /volume1/web/nextcloud/occ
Das funzt also leider nicht
 
Zuletzt bearbeitet von einem Moderator:
Zuletzt bearbeitet:
  • Like
Reaktionen: Yippie
Guck mal, ob du da vielleicht die Rechte entsprechend anpassen kannst. Sonst wird dir das Feature nicht viel bringen.

PS: … es sei denn, du startest synOCR dann über root.
F*** das Skript kann nur vom Besitzer der Conf-datei von nextcloud ausgeführt werden.
Auch das kann ich modifizieren, aber ich glaub da komm ich in Teufels Küche, wenn ich da noch mehr Rechte, geschweige denn Besitzer ändere.

Ich werde mich also mal bei inotifywait einlesen und gucken wie sauber das mit Synology läuft
Sieht irgendwie vielversprechend aus. Muss nur die Ausgaben auswerten und dafür sorgen, dass das Monitoring am laufen bleibt.

Umsonst sind Deine Bemühungen dennoch nich

  1. Ein fettes Danke von mir - ich werde es in anderem Zusammenhang denoch bestimmt brauchen
  2. Yippie wird sich freuen... :)
  3. Die vielen anderen Tüftler
Danke für das coole Tool!
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Yippie
  • Like
Reaktionen: Monacum
Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).
 
  • Like
Reaktionen: Monacum und geimist
Da denke ich ja gleich weiter, ob man es in Zukunft auch mit llama auf der DS nutzen könnte 🤷‍♂️
Das wäre natürlich noch viel interessanter.

Ich hatte nur direkt an synOCR gedacht als er es mir gezeigt hat, da es ja auch auf Bash basiert. Der Integrationsaufwand dürfte daher überschaubar sein, da die Grundstruktur bereits übereinstimmt und das GPT-4-Script lauffähig ist.
Und ja, ich bin selbst Entwickler und weiß das wir hier immer noch von mehreren Tagen und nicht von Minuten reden :D
 
  • Like
Reaktionen: Monacum
Ich werde mich in nächster Zeit diesem zusätzlichen Feature nicht eigenständig annehmen können, aber wenn du dir die Implementierung mal ansehen möchtest, sehr gerne. Wir können das ja weiter auf GitHub diskutieren, wenn du möchtest.
 
  • Like
Reaktionen: DeeKay1
Same. Jetzt kommt der Frühling und der Garten hat Vorrang. Aber die Regentagen werden auch wieder kommen, daher auch meine Anfrage ob überhaupt Interesse besteht. Dann lass uns mal ein Issue auf GitHub erstellen und das da weiterverfolgen.
 
  • Like
Reaktionen: Monacum
Hey, erstmal vielen Dank für deine Arbeit! Mir ist etwas aufgefallen.. Ich scanne mittlerweile direkt auf PDF/A und möchte jetzt eben noch OCR drüber laufen lassen.. Das ganze funktioniert auch, jedoch zeigt mir verapdf nach dem ocr an, dass die neue pdf nicht konform mit dem Standard ist.. Ich dachte, es liegt an ocrmypdf, habe also auf einer ubuntu vm dieselbe pdf versucht, da ist das output konform.. Ich führe da den folgenden Befehl aus:
Code:
ocrmypdf 20230429_183104.pdf outNew.pdf -srd -l deu+eng
Nutze dieselben Parameter auch in synOCR.. Habe auch mit dem output-type parameter gespielt, hat nix geändert.. Habe auch die verschiedenen Docker images in synOCR getestet, auf Ubuntu läuft 13.4.0+dfsg

Habe leider noch nichts dazu gefunden, woran könnte das denn liegen?
 

Anhänge

  • 2023-04-29 19_43_21-.png
    2023-04-29 19_43_21-.png
    98,2 KB · Aufrufe: 4
Das liegt an PyPDF2. Im nächsten Release setzen wir auf pikepdf, womit das schon wesentlich besser aussieht. Da gibt es derzeit zwar noch eine Fehlermeldung bei den Metadaten, aber sonst wird es fehlerfrei verifiziert.
 
  • Like
Reaktionen: OverDodo
Ah super! Vielen Dank, freue mich drauf 😊
 
Zuletzt bearbeitet von einem Moderator:
Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).
Was würde denn da passieren. Also die Dokumente sind durch den OCR process und das gpt4 macht dann ohne irgendwelche Regeln daraus Datei Namen?

Dann habe ich das aber nicht mehr unter Kontrolle. Heute entscheide ich ja per Regel wie die Datei heißt?
Oder habe ich da was falsch verstanden?
 
Ich gehe schon davon aus, dass man seine Wünsche formulieren muss.
Vielleicht wird es auch eher eine Alternative Möglichkeit der Steuerung.
 
Hi,

in anderen Threads bin ich über das Thema "Aktualisierung von Docker-Container" und die Bereinigung von unreferenzierten Images gestoßen.
Ich habe mir mal alle Images auflisten lassen und da kommt "ocrmypdf" häufiger vor.

1682871092488.png
Sehe ich das richtig, dass dies damit zusammenhängt, da dieses Image bei jeder Nutzung von "synOCR" mit dem Tag "latest" aufgerufen wird und bei jedem neuen Update des Images eine unreferenzierte Verision entsteht?

Gibt es in "synOCR" eine Routine, mit welcher diese nicht getaggten Image-IDs gelöscht werden können, oder ist dies (in meinem Fall) über SSH manuell durchzuführen?

Danke und Gruß
Frank
 
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat