synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
Den Wunsch, ein manuelles Skript / Befehl ausführen zu können, gab es schon einmal. Ich tue mich damit aber schwer, weil Oma Gertrud dann sieht: "Oh, hier ist ein Formularfeld - gleich mal was eintragen …" 🤕
Ja, von mir aber meine Oma heist nicht Gertrud und hat mit IT schon Mal gar nix am Hut und auf dem NAS auch nix verloren :p
Ansonsten ist die Forderung schon irgendwie legitim, ich hatte ja auch bereits um eine solche Erweiterung gebeten :cool:

Für mich wäre schon hilfreich, wenn ich in jeder Regel der YAML-Datei, einen Befehl zur Ausführung eines Skripts angeben könnten, denn dann wäre es möglich, die durch die Regel bearbeitete Datei bspw. an einen anderen Ort zu verschieben. Oder aber auch per FTP oder einem anderen Protokoll irgendwo hochzuladen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Ja, ja … ich hab's doch schon eingebaut ;)

Man wird bei jeder Regel noch den Wert postscript: angeben können. Da kann man dann einen Einzeiler oder den Pfad zu einem Skript angeben. Soll es immer greifen, so erstellt man halt eine Universalregel mit dem RegEx .*. Man kann aber auch mehrere Befehle bei Erfüllung mehrerer Regeln kombinieren.
 

ThomGee

Benutzer
Mitglied seit
06. Aug 2021
Beiträge
5
Punkte für Reaktionen
1
Punkte
3
DANKE!
Wird gleich getestet, wenn der Download verfügbar ist ... :)

Das Paket synOCR wird wohl kein sudo ausführen können. Aber teste doch mal, ob der User synOCR (er ist in der Gruppe administrators) den Befehl erfolgreich ausführen kann:
sudo -u synOCR php80 /volume1/web/nextcloud/occ files:scan --path="/<user>/files/<path>" -v

Wenn das läuft, mache ich mir mal Gedanken, wie ich das in die Regeldatei aufnehmen kann.
Bash:
Could not open input file: /volume1/web/nextcloud/occ
Das funzt also leider nicht
 
Zuletzt bearbeitet von einem Moderator:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Zuletzt bearbeitet:
  • Like
Reaktionen: Yippie

ThomGee

Benutzer
Mitglied seit
06. Aug 2021
Beiträge
5
Punkte für Reaktionen
1
Punkte
3
Guck mal, ob du da vielleicht die Rechte entsprechend anpassen kannst. Sonst wird dir das Feature nicht viel bringen.

PS: … es sei denn, du startest synOCR dann über root.
F*** das Skript kann nur vom Besitzer der Conf-datei von nextcloud ausgeführt werden.
Auch das kann ich modifizieren, aber ich glaub da komm ich in Teufels Küche, wenn ich da noch mehr Rechte, geschweige denn Besitzer ändere.

Ich werde mich also mal bei inotifywait einlesen und gucken wie sauber das mit Synology läuft
Sieht irgendwie vielversprechend aus. Muss nur die Ausgaben auswerten und dafür sorgen, dass das Monitoring am laufen bleibt.

Umsonst sind Deine Bemühungen dennoch nich

  1. Ein fettes Danke von mir - ich werde es in anderem Zusammenhang denoch bestimmt brauchen
  2. Yippie wird sich freuen... :)
  3. Die vielen anderen Tüftler
Danke für das coole Tool!
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Yippie

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
  • Like
Reaktionen: Monacum

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).
 
  • Like
Reaktionen: Monacum und geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Da denke ich ja gleich weiter, ob man es in Zukunft auch mit llama auf der DS nutzen könnte 🤷‍♂️
Das wäre natürlich noch viel interessanter.

Ich hatte nur direkt an synOCR gedacht als er es mir gezeigt hat, da es ja auch auf Bash basiert. Der Integrationsaufwand dürfte daher überschaubar sein, da die Grundstruktur bereits übereinstimmt und das GPT-4-Script lauffähig ist.
Und ja, ich bin selbst Entwickler und weiß das wir hier immer noch von mehreren Tagen und nicht von Minuten reden :D
 
  • Like
Reaktionen: Monacum

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Ich werde mich in nächster Zeit diesem zusätzlichen Feature nicht eigenständig annehmen können, aber wenn du dir die Implementierung mal ansehen möchtest, sehr gerne. Wir können das ja weiter auf GitHub diskutieren, wenn du möchtest.
 
  • Like
Reaktionen: DeeKay1

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Same. Jetzt kommt der Frühling und der Garten hat Vorrang. Aber die Regentagen werden auch wieder kommen, daher auch meine Anfrage ob überhaupt Interesse besteht. Dann lass uns mal ein Issue auf GitHub erstellen und das da weiterverfolgen.
 
  • Like
Reaktionen: Monacum

OverDodo

Benutzer
Mitglied seit
16. Apr 2023
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hey, erstmal vielen Dank für deine Arbeit! Mir ist etwas aufgefallen.. Ich scanne mittlerweile direkt auf PDF/A und möchte jetzt eben noch OCR drüber laufen lassen.. Das ganze funktioniert auch, jedoch zeigt mir verapdf nach dem ocr an, dass die neue pdf nicht konform mit dem Standard ist.. Ich dachte, es liegt an ocrmypdf, habe also auf einer ubuntu vm dieselbe pdf versucht, da ist das output konform.. Ich führe da den folgenden Befehl aus:
Code:
ocrmypdf 20230429_183104.pdf outNew.pdf -srd -l deu+eng
Nutze dieselben Parameter auch in synOCR.. Habe auch mit dem output-type parameter gespielt, hat nix geändert.. Habe auch die verschiedenen Docker images in synOCR getestet, auf Ubuntu läuft 13.4.0+dfsg

Habe leider noch nichts dazu gefunden, woran könnte das denn liegen?
 

Anhänge

  • 2023-04-29 19_43_21-.png
    2023-04-29 19_43_21-.png
    98,2 KB · Aufrufe: 4

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Das liegt an PyPDF2. Im nächsten Release setzen wir auf pikepdf, womit das schon wesentlich besser aussieht. Da gibt es derzeit zwar noch eine Fehlermeldung bei den Metadaten, aber sonst wird es fehlerfrei verifiziert.
 
  • Like
Reaktionen: OverDodo

OverDodo

Benutzer
Mitglied seit
16. Apr 2023
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Ah super! Vielen Dank, freue mich drauf 😊
 
Zuletzt bearbeitet von einem Moderator:

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Ein Ex-Kollege von mir hat ein Bash-Script geschrieben welches OCR-Dokumente entgegennimmt und daraus per GPT-4 automatisch Dateinamen generiert. Ich hab mir das Ergebnis mal angesehen und es sieht ziemlich gut aus.
Besteht Interesse das in synOCR zu integrieren? Dann könnte ich mir das mal ansehen.

Achtung (und bevor hier der Aufschrei kommt): GPT-4 IST NICHT ChatGPT. Man müsste es jeweils selbst hosten, z.B. per Azure OpenAI-Instanz. Die Daten werden nicht genutzt um irgendwelche anderen Modelle zu verbessern (zB ChatGPT). Auch Microsoft hat keinen Zugriff auf die übertragenen Daten, da es Kundeninstanzen sind).
Was würde denn da passieren. Also die Dokumente sind durch den OCR process und das gpt4 macht dann ohne irgendwelche Regeln daraus Datei Namen?

Dann habe ich das aber nicht mehr unter Kontrolle. Heute entscheide ich ja per Regel wie die Datei heißt?
Oder habe ich da was falsch verstanden?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.544
Punkte für Reaktionen
1.377
Punkte
234
Ich gehe schon davon aus, dass man seine Wünsche formulieren muss.
Vielleicht wird es auch eher eine Alternative Möglichkeit der Steuerung.
 

allahopp

Benutzer
Mitglied seit
15. Mai 2022
Beiträge
133
Punkte für Reaktionen
10
Punkte
18
Hi,

in anderen Threads bin ich über das Thema "Aktualisierung von Docker-Container" und die Bereinigung von unreferenzierten Images gestoßen.
Ich habe mir mal alle Images auflisten lassen und da kommt "ocrmypdf" häufiger vor.

1682871092488.png
Sehe ich das richtig, dass dies damit zusammenhängt, da dieses Image bei jeder Nutzung von "synOCR" mit dem Tag "latest" aufgerufen wird und bei jedem neuen Update des Images eine unreferenzierte Verision entsteht?

Gibt es in "synOCR" eine Routine, mit welcher diese nicht getaggten Image-IDs gelöscht werden können, oder ist dies (in meinem Fall) über SSH manuell durchzuführen?

Danke und Gruß
Frank
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat