synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Es sollte nur wenige Minuten dauern. Ich habe natürlich keine Erfahrung bei deiner CPU.

Wie sieht die CPU-Auslastung aus?
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Die Auslastung ist vernachlässigbar - hier die Prozessliste sortiert nach Auslastung: 1616257717750.png
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Da scheint noch was zu hängen.

Bitte mal die Seite "Übersicht" neuladen -> auf den blauen Button drücken und den bewarnten Durchlauf abbrechen -> dann dass Log schicken.

(euphorisch bin ich gerade nicht :confused: )
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Hier der Log:

----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
pdfinfo nicht gefunden
pagecount_latest 0
pagecount 0
ERROR at line 1230: pagecount_new=$(( $(get_key_value ./etc/counter pagecount) + $pagecount_latest))
ERROR at line 1231: ocrcount_new=$(( $(get_key_value ./etc/counter ocrcount) + 1))
ocrcount_new 1
pagecount_ID_new 0
ocrcount_ID_new 1

PROCESSING: ? Testdatei.pdf (Sat Mar 20 17:19:51 CET 2021)
temp. target file: /tmp/tmp.3hoRS5Fy07/Testdatei.pdf
[runtime up to now: 00:00:00]

-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Also keine erweiterten Erkenntnisse …

Ich würde auch mal ein anderes Image testen.

Bzw. müsste man mal etwas mehr in der Shell die Interaktion mit Docker testen.
cat "/volume1/temp/OCRTest/in/Testdatei.pdf" | /opt/usr/bin/docker run --name synOCR --network none --rm -i -log-driver=none -a stdin -a stdout -a stderr dennischancs/ocrmypdf:latest -srd -l deu - - | cat - > "/volume1/temp/OCRTest/out/Testdatei_ocr.pdf"
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Das läuft durch, aber nur wenn ich in SSH sudo -i ausführe. Sonst kommt "Permission denied". Kann es ein Berechtigungsthema sein?

1616262228534.png
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Ja, docker braucht root.

Jetzt würde ich mal das komplette Skript laufen lassen (auch als root). Die abschließende Zahl ist die ID deines Profils.

/usr/syno/synoman/webman/3rdparty/synOCR/synOCR.sh 1
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Folgendes kommt dann raus wenn ich das direkt in der Shell ausführe (als root):

root@ICCS-NAS:~# /usr/syno/synoman/webman/3rdparty/synOCR/synOCR.sh 1
-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR.sh: line 87: docker: command not found
used image (created): dennischancs/ocrmypdf:latest ()
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: /usr/syno/synoman/webman/3rdparty/synOCR/synOCR.sh: line 97: docker: command not found
WARNING: Docker could not be found. Please check if the Docker package has been installed!
Loglevel: debug
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
pdfinfo nicht gefunden
pagecount_latest 0
pagecount 0
ERROR at line 1230: pagecount_new=$(( $(get_key_value ./etc/counter pagecount) + $pagecount_latest))
ERROR at line 1231: ocrcount_new=$(( $(get_key_value ./etc/counter ocrcount) + 1))
ocrcount_new 1
pagecount_ID_new 0
ocrcount_ID_new 1

PROCESSING: ? Testdatei.pdf (Sat Mar 20 21:11:25 CET 2021)
temp. target file: /tmp/tmp.og5TLK1VuU/Testdatei.pdf
[runtime up to now: 00:00:00]


? OCRmyPDF-LOG:
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR.sh: line 227: docker: command not found
? OCRmyPDF-LOG-END

[runtime up to now: 00:00:03]

?? failed! (target file is empty or not available)


root@ICCS-NAS:~#
Kann das wiederum daran liegen, dass docker nicht in meiner PATH Variable drin ist? Du hattest eingangs so etwas erwähnt. Wenn ja, dann versuche ich das dort reinzubekommen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Ja, genau.
Setze mal vorher diese Zeile ab:
PATH=$PATH:/opt/usr/bin:/usr/syno/synoman/webman/3rdparty/synOCR/bin_aarch64
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Damit klappt es, sowohl über SSH als auch über das Webinterface! Juhu!
Für meine Test-PDF braucht der Prozess allerdings 7 Minuten.

Muss ich diesen Befehl nach jedem Neustart wieder ausführen oder merkt sich die Syno den Inhalt der PATH-Variable?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Für deine aktuelle Session bleibt die Variable entsprechend besetzt / 'gefüllt'.

Allerdings verstehe ich nicht, warum es nicht über die GUI läuft … (dort passiert nichts anderes, als dein abgesetzter Befehl).

Ich habe nochmal etwas angepasst, damit du mit nachstehenden Befehl in der Shell auch keinen PATH mehr anpassen musst. So solltest du es auch im DSM Aufgabenplaner eintragen können:
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh

Bitte das nochmal mit dem neusten Build testen.
 

Apfelsaft

Benutzer
Mitglied seit
19. Jan 2017
Beiträge
26
Punkte für Reaktionen
3
Punkte
3
Hey geimist und community,

ich habe nach der Digitalisierung nun doch noch eine Herausforderung.

Das Durchsuchen nach Dateiinhalten klappt nun auf dem Mac aber unter Win10 nicht.
Win10 Indiziert keine Netzwerklaufwerke und übernimmt auch nicht die Indizierung von Synology.

Hat jemand einen Tipp. Muss noch was aktiviert werden oder gibt es einen Workaround?

Danke schonmal!
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Ich hätte einen kleinen Verbesserungsvorschlag => Maximale Anzahl an Backupdateien
Man kann die maximale Anzahl von Logs bestimmen, aber nicht die maximale Anzahl der Backupdateien.

Ich könnte das auch über einen Einzeiler auf der Konsole verwirklichen, aber das wäre wieder ein Script(chen) mehr.
 
  • Like
Reaktionen: geimist

steve45

Benutzer
Mitglied seit
26. Mrz 2021
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
Hallo ich versuche gerade das synOCR auf einem DS220 mit aarch64 zu installieren. Docker hab ich laufen, den ocrmypdf container auch.

Jetzt wollte ich das spk modifizieren, so dass der check auf die arch x64 unterbleibt, aber das modifizierte Paket wird nicht akzeptiert? -> error 150 oder in der UI "Invalid File Format". Woran kann das liegen?

Danke für eure Hilfe.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Wie du vielleicht gesehen hast, haben wir ja gemeinsam mit @mf_2 versucht, synOCR auf aarch64 zum Laufen zu bekommen. Dort lief es ja noch nicht über die GUI (also der Dockeraufruf blieb hängen), aber wohl über den Aufgabenplaner. Auf meine letzte Anpassung hat er noch kein Feedback gegeben.
  • hast du den aktuellen Build verwendet?
  • hast du auch ein aarch64 Image von OCRmyPDF geladen?
PS:
Was ist das für Modell "DS220"? Meinst du die Junior Version?
 
Zuletzt bearbeitet:

steve45

Benutzer
Mitglied seit
26. Mrz 2021
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
Über den TaskScheduler hab ich es jetzt auch am Laufen. Soweit taugt das schon mal als Workaround. Das Image das ich verwende ist von hier https://hub.docker.com/r/andy008/ocrmypdf da gibt einen Build für aarch64. Daran liegt es nicht.

Mein Problem ist eher dass ich das synOCR_v1.0.2.spk nicht installieren kann (also bei dem ich das preinst script geändert hab). Vielleicht mache ich ja nur was falsch beim wieder einpacken des spk?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Das kann schon sein. Du kannst es ja mit meiner Version vergleichen.

Bleibt ein Aufruf über den Button bei dir auch hängen?
Kannst du das ergründen, woran das liegt?
 

steve45

Benutzer
Mitglied seit
26. Mrz 2021
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
ich glaube wir reden aneinander vorbei. ich kann das Paket nicht installieren, weder per synopkg noch per web UI. im Web UI kommt illegal file format. auf der cmdline Error=150.

von welchem Button redest du denn? ohne installiertes Paket gibt's keinen Button. und was meinst du denn mit "meiner Version"? ich hab als Basis die von cphub.net
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.541
Punkte für Reaktionen
1.373
Punkte
234
Ich spreche vom aktuellen Build auf meinem Server (NICHT das für DSM7). Das solltest du mal testen.
 

steve45

Benutzer
Mitglied seit
26. Mrz 2021
Beiträge
9
Punkte für Reaktionen
0
Punkte
1
Ahh danke, jetzt ist es klar. Dieses Paket kann ich installieren. Werde alles testen und berichten! Danke bis hierhin schon mal. (y)
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat