synOCR synOCR - GUI für OCRmyPDF

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
"which docker" liefert leider kein Ergebnis.
Ich habe nun per "find" einmal nach docker gesucht und es scheint in /opt/usr/bin zu liegen:

Docker.png

Hinter deinem Link sehe ich eine Datei - es scheint eine Art Skript oder Makefile zu sein. Leider habe ich keine Ahnung, wie ich das ausführe - kann ich das einfach auf der Shell aufrufen oder muss ich das anders machen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Dann ist deine Installation nicht mit in die PATH-Variable aufgenommen. Ok, also unter /opt/usr/bin/docker

Ich muss das Paket etwas anpassen und melde mich dann nochmal.
Bzgl. des Imgages habe ich ja noch ein Edit nachgeschoben. Sonst müsstest du das Git-Repo zu dir clonen und anschließend mit docker bauen (die verlinkte Datei ist sozusagen die Bauanleitung).
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Vielen Dank für die schnelle Hilfe. Ich habe nun das vorkompilierte ARM-Image als Container erzeugt und versucht dein SPK zu installieren.
Leider bekomme ich dabei folgende Meldung:

synoOCR Fehler.png

Meine RS819 hat folgende DSM-Version: DSM 6.2.3-25426 Update 3
Folgende Datei habe ich genutzt: synOCR_master_latest_(2021-03-20_12-48)_d2a2ee2.spk

Was mache ich falsch?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Sorry, da hatte ich noch was übersehen. Bitte nochmal probieren.

Bitte in der GUI auch dein ARM64-Image auswählen!
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Jetzt komme ich bis zur Bestätigung der Einstellungen. Dann kommt leider folgende Meldung, sobald ich den Button "Übernehmen" anklicke: 1616243192920.png
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Jetzt läuft das Setup durch und ich kann die Konfiguration vornehmen.
Leider sehe ich in der Image-Auswahl das ARM64 Image nicht (müsste dennischancs/ocrmypdf:latest) sein:
1616244379339.png

Ich habe es dann trotzdem versucht und bekomme laut Log einen Fehler. Hier das Log: Was geht dort schief?

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): jbarlow83/ocrmypdf:latest (2021-03-19T07:41:06)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: normal
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
? update image [jbarlow83/ocrmypdf:latest] ? image is up to date
./synOCR.sh: line 1220: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
zum 1.:
Punkt: da fehlte noch eine Pfadanpassung. Irgendwann müssten wir durch sein …
Neuer Build ist online.

zu 2.:
ich liefere 2 Programme mit. Da scheitert bei dir natürlich die Ausführung (dient aber im Falle des ersten (pdfinfo) nur der Statistik). Ich hoffe, synOCR läuft dennoch erstmal durch.
Ein 2. Programm (yq) würdest du benötigen, wenn du mit einer externen YAML-Regeldatei arbeiten möchtest. Mal sehen, ob ich da 2 alternative Staticbuilds für aarch64 auftreiben kann.
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Punkt 1 ist gelöst, ich kann das Image wählen.
Punkt 2 hakt noch:

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): dennischancs/ocrmypdf:latest (2020-09-03T07:05:17)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: normal
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
? update image [dennischancs/ocrmypdf:latest] ? image is up to date
./synOCR.sh: line 1220: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
Was klappt da nicht?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
In der Zeile davor wird die Seitenzahl mit dem Programm pdfinfo ausgelesen und in der Fehlerzeile wird versucht, mit dem Ergebnis zu rechnen ? das führt zu dem Fehler. pdfinfo kann bei dir noch nicht laufen - ich hatte gehofft, dass synOCR trotz des Fehlers durchläuft. Ich habe die ganze Zeit gesucht, aber leider keine Alternative für aarch64 gefunden. Dafür ist jetzt ein Workarround eingebaut, sodass bei fehlendem pdfinfo auf die Seitenberechnung verzichtet wird.

Das Programm yq habe ich bereits für aarch64 gefunden und hinzugefügt.

Bitte mal wieder testen …
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Leider noch nicht ganz. Jetzt steigt er in Zeile 1231 aus:

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): dennischancs/ocrmypdf:latest (2020-09-03T07:05:17)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: normal
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
./synOCR.sh: line 1231: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------

Vielen Dank für deine Geduld! :)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.569
Punkte für Reaktionen
1.396
Punkte
234
Das verstehe ich gerade nicht so recht … :unsure:
Bitte nochmal versuchen. Es wird noch nicht funktionieren, aber ich benötige ein paar mehr Logausgaben. Ist halt schwierig, wenn man es nicht selbst testen kann.

Danke auch für deine Geduld
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Leider hat sich an der Fehlermeldung nicht viel verändert (oder ich übersehe es) - oder muss ich den Loglevel noch irgendwo einstellen?
Da steht ja immer Loglevel "normal" - kann man hier auch verbose, debug oä. einstellen?

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): dennischancs/ocrmypdf:latest (2020-09-03T07:05:17)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: normal
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
./synOCR.sh: line 1231: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
Edit: Habe das Loglevel in den Einstellungen auf 2 debug geändert. Logfile sieht aber noch genauso aus.
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Kein Problem. So, jetzt steht mehr drin.

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): dennischancs/ocrmypdf:latest (2020-09-03T07:05:17)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: debug
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
pdfinfo gefunden
pagecount_latest
pagecount 0
./synOCR.sh: line 1237: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Hier der neue Log:

-----------------------------------
| ==> installation info <== |
-----------------------------------

synOCR-user: root
synOCR-version: 1.0.2.2
Architecture: aarch64
DSM-build: 25426
Device: rs819 (2356825277)
current Profil: default
DB-version: 4
used image (created): dennischancs/ocrmypdf:latest (2020-09-03T07:05:17)
used ocr-parameter: -srd -l deu
replace search prefix: yes
renaming syntax: §y-§m-§d_§tag_§tit
Symbol for tag marking: #
Document split pattern:
source for filedate: ocr
ignored dates by search: 2021-02-29;2020-11-31
Docker Test: OK
Loglevel: debug
Application Directory: /usr/syno/synoman/webman/3rdparty/synOCR
Source directory: /volume1/temp/OCRTest/in/
Target directory: /volume1/temp/OCRTest/out/
BackUp directory: /volume1/temp/OCRTest/bak/


----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
pdfinfo gefunden
path: /usr/syno/synoman/webman/3rdparty/synOCR/bin/pdfinfo
pagecount_latest
pagecount 0
./synOCR.sh: line 1238: 0 + : syntax error: operand expected (error token is "+ ")
-----------------------------------
| synOCR exit with ERROR! |
-----------------------------------
 

mf_2

Benutzer
Mitglied seit
31. Aug 2008
Beiträge
152
Punkte für Reaktionen
4
Punkte
18
Das sieht besser aus, es scheint trotz Fehler durchzulaufen:

----------------------------------
| ==> Funktionsaufrufe <== |
----------------------------------
pdfinfo nicht gefunden
pagecount_latest 0
pagecount 0
ERROR at line 1230: pagecount_new=$(( $(get_key_value ./etc/counter pagecount) + $pagecount_latest))
ERROR at line 1231: ocrcount_new=$(( $(get_key_value ./etc/counter ocrcount) + 1))
ocrcount_new 1
pagecount_ID_new 0
ocrcount_ID_new 1

PROCESSING: ? Testdatei.pdf (Sat Mar 20 17:19:51 CET 2021)
temp. target file: /tmp/tmp.3hoRS5Fy07/Testdatei.pdf
[runtime up to now: 00:00:00]
Es läuft noch. Ich habe als Test eine 4MB PDF mit 5 Seiten genommen. Wie lange sollte das dauern?
Bzw. hast du ein gutes Test-PDF welches ich nutzen kann?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat