synOCR synOCR - GUI für OCRmyPDF

KGBist2000

Benutzer
Mitglied seit
10. Jan 2016
Beiträge
159
Punkte für Reaktionen
23
Punkte
18
Gibt es eine Option / Parameter damit leere Seiten automatisch aussortiert werden ?
 

KGBist2000

Benutzer
Mitglied seit
10. Jan 2016
Beiträge
159
Punkte für Reaktionen
23
Punkte
18
Danke für die schnelle Antwort . Schade.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234

tom0207

Benutzer
Mitglied seit
28. Dez 2012
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Servus , also ich nutze die Raute zur Tag Kennzeichnung. Wenn es eine Lösung über ein Schalter gibt würde ich die "bevorzugen
". Danke für Deine Mühe/Arbeit. SynOCR läuft bei mir perfekt.
VG Tom
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Ich verstehe nicht ganz. So ist doch der aktuelle Stand, dass die Raute als Tagkennzeichnung verwendet wird … :confused:
Es gibt derzeit nur kein Schalter zum Deaktivieren. Oder bezieht sich das auf meine Nachfrage, wer überhaupt eine Tagkennzeichnung nutzt?
 

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
643
Punkte für Reaktionen
54
Punkte
54
Sowohl die Suchfunktion in Windows (Explorer) als auch Mac (Finder) kann entsprechende PDFs raussuchen. Da braucht man keine zuästzliche 3rd App - so meine Meinung.
Soweit ich weiß kann die Windows Suche keine Netzwerk Shares indexsieren und somit auch die sich dort befindlichen PDFs eigentlich gar nicht auffinden. Wie macht ihr das dann? Wie findet ihr solche PDFs wieder?
 
Zuletzt bearbeitet:

KGBist2000

Benutzer
Mitglied seit
10. Jan 2016
Beiträge
159
Punkte für Reaktionen
23
Punkte
18
Ich verwende Synology Drive für PC und Smartphone.
 

LuxKeiwoker

Benutzer
Mitglied seit
30. Dez 2017
Beiträge
3
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen,

ich versuche gerade SynOCR auf meiner DS418j zum laufen zu bekommen. Da meine DS nur einen 64-bit ARM SoC von Realtek besitzt, funktioniert die standard Synology implementation von Docker bei mir nicht. Durch ein Posting auf StackOverflow hab ich allerdings ein Skript gefunden mit dem ich eine für ARM abgespeckte Variante von Docker installieren konnte. Nun habe ich Zugriff auf die Weboberfläche von Portainer, weis aber nicht wie es weiter gehen soll, da synOCR ja ein synology paket im spk-dateiformat ist. Zwar kann ich mit WinRAR die SPK datei entpacken, habe aber keine Ahnung was ich mit dem Inhalt im Portainer UI machen soll.

Hat jemand einen Rat?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Das SPK von synOCR musst du ganz einfach über das DSM Paketzentrum installieren (die Installation wird aber abbrechen, da explizit auf x86_64 getestet wird - die entsprechende Prüfung findest du im SPK in der Datei ./scripts/preinst, welche du modifizieren müsstest).

Damit du synOCR jetzt nutzen kannst, musst du
  1. deine Dockerinstallation auf der Commandline ansprechbar machen (also den Befehl 'docker' mit Parametern ausführen können)
  2. einen ocrmypdf-Container finden, der zu deiner CPU passt, oder ggf. selber bauen.
 

LuxKeiwoker

Benutzer
Mitglied seit
30. Dez 2017
Beiträge
3
Punkte für Reaktionen
0
Punkte
0
uff - ok, also das geht weit über meine Linux Kenntnisse hinaus. Ich glaube da muss ich an der Stelle mich wohl damit abfinden müssen dass synOCR nicht funktionieren wird.

Nun hab ich aber docker und portainer installiert, hab aber keine Ahnung wie ich die Pakete deinstallieren soll - apt-get kennt das syno linux nicht. Jemand eine Idee? Das ist das untenstehende Skript welche ich genutzt habe

Rich (BBCode):
#!/bin/sh
#/bin/wget -O - https://raw.githubusercontent.com/wdmomoxx/catdriver/master/install-docker.sh | /bin/sh
/bin/wget https://raw.githubusercontent.com/wdmomoxx/catdriver/master/catdsm-docker.tgz
tar -xvpzf catdsm-docker.tgz -C /
rm catdsm-docker.tgz
PATH=/opt/sbin:/opt/bin:/opt/usr/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
/opt/etc/init.d/S60dockerd
sudo docker run -d --network=host -v "/run/docker.sock:/var/run/docker.sock"  portainer/portainer:linux-arm64
echo "????Docker????"
echo "???????IP:9000??Docker UI"
 

tom9865

Benutzer
Mitglied seit
20. Feb 2013
Beiträge
75
Punkte für Reaktionen
0
Punkte
6
Hi,
erst einmal ein geniales Paket. Erster Test mit Profil nahe Standard hat gestern funktioniert. Leider hängt es jetzt wohl.
Meldet immer zwei Prozesse aktiv die sich auch über den Button in synOCR nicht abbrechen lassen.
Log wird auch nicht erstellt. Ordner passen soweit alle. Hatte nur noch einige weitere Tags in der Konfiguration hinzugefügt...
Kann man alles vom Paket löschen? Also auch heruntergeladene Docker Images? Mir fällt sonst nichts ein?
Kann ich noch irgendwo im System nach Logs ausschau halten?

-------------------------------------------------------------------------------------------------
Update: 03.01.20 - 16:45:
Erledigt,Neuinstalltion und weniger Kategorien haben zum Erfolg geführt.

Thx,
Tom
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Welche 2 Prozesse sind denn aktiv gewesen? synOCR.sh?

Ein Neustart der DS hätte es auch tun sollen. Wäre interessant, was sich da aufgehangen hat …

Beim Beenden gab es einen Fehler, der im nächsten Release behoben ist. Danke für die Info!
 

Peda86

Benutzer
Mitglied seit
04. Jan 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hallo, das ist zwar wahrscheinlich nicht direkt ein SynoOCR-Problem, aber vielleicht könnt Ihr mir trotzdem helfen: mein jbarlow83:eek:crmypdf Docker Paket startet sich leider ständig neu. Im Protokoll sehe ich diesen Eintrag:
ocrmypdf: error: the following arguments are required: input_pdf_or_image, output_pdf
OCR funktioniert grundsätzlich

Was könnte das sein?

Vielen Dank im Voraus!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Hallo Peda86 und herzlich willkommen hier im Forum :)

Warum möchtest du, dass der Container ständig läuft :confused:
Der Container wird wie die meisten anderen Programme nur für einen bestimmten Zweck für eine bestimmte Zeit gestartet - anders ist das nicht vorgesehen.
 

Peda86

Benutzer
Mitglied seit
04. Jan 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Dann hab ich wohl was falsch verstanden. Ich hab zuerst synocr installiert und dann das Docker Image installiert wobei das Paket automatisch neu startet. Ist das automatisch Neustarten das Problem?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
Einzige Vorraussetzung für synOCR ist das Synologypaket "Docker". Um den Rest kümmert sich synOCR (in der Konfiguration kannst du ja das gewünschte Image von ocrmypdf wählen).

Am besten, du löscht den selbst erstellten Container.
 

Peda86

Benutzer
Mitglied seit
04. Jan 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Danke für den Hinweis! Jetzt funktionierts. Wirklich tolles Tool hast Du da gebaut!
 

LabSen

Benutzer
Mitglied seit
02. Feb 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
1
Hallo

Ich habe das Tool heute auch erfolgreich in Betrieb genommen. Zwei Wünsche habe ich für ein potenzielles Update:

1. Datum Jahr die Möglichkeit in zweistellig 18, 19, 20 anstatt vierstellig 2018, 2019, 2020
2. Die Tags im Dateiname ohne # und mit "_" zwischen den Tags. Reihenfolge der Tags im Dateiname nach der Reihenfolge wie sie im Webinterface eingegeben wurden.

Ansonsten läuft auf meiner DS 1215+ alles bestens. Herzlichen Dank.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.546
Punkte für Reaktionen
1.379
Punkte
234
  1. Das Datum wird derzeit original aus dem Dokument entnommen und lediglich auf Gültigkeit validiert. Das soll irgendwann noch besser werden (sodass z.B. ausgeschriebene Monatsnamen erkannt werden können - die Möglichkeit von potenziell vielen Sprachen macht es da nicht einfacher).
  2. Die Tagkennzeichnung soll in Zukunft anpassbar sein - dass mit dem Trennzeichen weiß ich noch nicht
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat