synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Du kannst einen ausgeschriebenen Monatsnamen derzeit nicht als Datum verwenden. In Anbetracht der möglichen Abkürzungen und Mehrsprachigkeit ist das ohne externe Bibliothek nicht trivial. Das ist aber auf jeden Fall noch ein wichtiges Ziel für die Zukunft.
 

e91

Benutzer
Mitglied seit
26. Jul 2020
Beiträge
15
Punkte für Reaktionen
7
Punkte
53
Danke für den Hinweis! Wie kann ich die Benennung für allgemeine Dokumente machen?
In der GUI habe ich als OCR Rename-Syntax folgendes angegeben: "§y-§m-§d §tag"
Den §tag erhält er durch die Regeldatei. Bei allgemeinen Dokumenten wird §tag leer sein, d.h. die Datei hat dann nur das Datum als Namen. Kann ich dem Namen noch irgendwie etwas hinzufügen?
Falls du nur bei Dokumenten für welche keine Regel gegriffen hat, einen gesonderte Benennung vornehmen wills, könntest du das mit einem zusätzlichen Profil lösen. Dieses Profil müsste dann einfach die Datei in dem bisherigen Output-Ordner des ersten Profils abholen, die Umbenennung so machen wie du es möchtest und die Datei dann im finalen Output-Ordner (z. B. "allgemeine Dokumente") ablegen.
 
  • Like
Reaktionen: geimist

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Gute Idee.
Ich würde dann aber bei den OCR-Parametern des 2. Profils darauf achten, dass Dokumente mit erkannten Text (was ja hier immer der Fall wäre) übersprungen und auch nicht ein weiteres mal optimiert werden.
 
  • Like
Reaktionen: e91

Kaestorfer

Benutzer
Mitglied seit
14. Jun 2021
Beiträge
13
Punkte für Reaktionen
3
Punkte
3
Servus,

hatte nun auf DSM7 geupdatet. Update lief dann auch sauber durch mit SynOCR. Allerdings steht nun immer wieder, dass es eine Aktualisierung gibt, aber wenn ich drauf klicke lande ich nur im Programm und da kann ich es ja nicht updaten, oder?
 

Anhänge

  • 2021-07-28 08_02_12-Window.png
    2021-07-28 08_02_12-Window.png
    21,7 KB · Aufrufe: 10

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.896
Punkte für Reaktionen
1.517
Punkte
274
Das Update kannst Du manuell von hier herunterladen und installieren.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Oder direkt von cphub.net
Es gibt ein Problem in Verbindung mit dem Paketserver, welches ich noch nicht gefunden habe.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Nein, meinerseits nicht. Wer sich aber die Mühe machen möchte, kann gerne einen Pullrequest erstellen.
 

shiQzaL

Benutzer
Mitglied seit
01. Mrz 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hi, ich habe aktuell DSM 7 (DS218+) installiert und die neuste synOCR Version: 1.1.902 am laufen.

Allerdings zeigt mir die Anwendung immer folgende Meldung an:

A C H T U N G:
synOCR verfügt noch nicht über die notwendigen Berechtigungen!
Bitte erstelle im Aufgabenplaner eine Aufgabe mit nachstehenden Skript (als root)
(die Aufgabe muss mindestens einmal ausgeführt werden)

/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh

Ich habe das Script schon stündlich über den Aufgabenplaner der DS als root eingeplant, aber dier Meldung wird weiterhin angezeigt.
Ich habe das Script auch schon über SSH also root ausgeführt - trotzdem bleibt die Meldung bestehen.

Mache ich irgendwas falsch? Komme nicht so recht weiter. Den Fehler hatte ich auch schon bei Version 1.1.901.

Kann hier vielleicht jemand weiterhelfen oder einen Tipp geben?

Vielen Dank!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Was ist denn die Ausgabe, wenn du das Skript über die Konsole aufrufst?

Prinzipiell sollte synOCR über den Konsolenaufruf korrekt arbeiten. Die erweiterten Berechtigungen sollen lediglich die 'User Experience' in der GUI verbessern (Aufruf über den Button / Anzeige nicht erledigter Aufgaben).

Warum die nötige Anpassung bei dir jetzt noch nicht greifen, müssten wir gemeinsam ergründen.
 

shiQzaL

Benutzer
Mitglied seit
01. Mrz 2020
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hi geimist, danke für deine Antwort.

Also synOCR arbeitet auch korrekt. Lege ich ein Dokument in den INPUT-Ordner, wird dieses verarbeitet und landet im OUTPUT-Ordner.

synOCR_1.png

Bei mir ist es die 'User Experience' in der GUI, die nicht verbessert wird.
Der manuelle Sync Button wird nicht angezeigt und auch nicht der Menüpunkt Zeitplaner.


synOCR_2.png

Oder soll das so sein wie auf meinen Screenshot? Ich bin synOCR Neuling, deshalb bin ich nicht sicher, wie es genau aussehen sollte. Ich hatte mich an den Screenshots auf cphub orientiert.

Vielen Dank & beste Grüße
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Erst einmal gut, dass es grundsätzlich funktioniert. Aber natürlich sollte das nicht so sein, wie jetzt in deinem Fall. Entweder wird die Anpassung nicht korrekt erkannt oder sie wird nicht korrekt ausgeführt. Das werden wir ergründen.

Du hast eine PN

EDIT (ganz vergessen):
… und auch nicht der Menüpunkt Zeitplaner.
Das ist im DSM7 normal, weil dafür die GUI als 'echter' root laufen müsste, was nicht mehr möglich ist. Daher bleibt nur die Möglichkeit mit dem DSM-Aufgabenplaner.
 
Zuletzt bearbeitet:

Erwin Lottermann

Benutzer
Mitglied seit
03. Aug 2021
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,
ich bin auf meiner Suche nach einem OCR-Tool auf synOCR gestoßen.

Nach dem ich im ersten Anlauf meine DiskStation (DS414) erstmal auf DSM 7 aktualisiert habe und dann das neue Paket installieren wollte kam eine Fehlermeldung, dass meine 32-Bit Hardware nicht unterstützt wird.

Gibt es eine Möglichkeit synOCR auf anderem Wege zu installieren?
Andernfalls wünsche ich mir bei der Softwarekompabilität einen Hinweis, dass zwangsweise eine 64-Bit Architektur vorhanden sein muss und meine DS-414 nicht mehr als kompatibel aufgelistet wird.

Ich freue mich auf positive Rückmeldung.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
Die entscheidende Voraussetzung für synOCR ist Docker (weil synOCR nur eine Benutzeroberfläche für den Dockercontainer OCRmyPDF ist).
Docker gab es lange nur für x86_64 Intel/AMD-CPUs, inzwischen aber auch für ARM64-CPUs.

Tut mir leid, dass ich die da nicht weiterhelfen kann.

Edit:
OCR ist sehr rechenintensiv und RAM-lastig. Selbst wenn es auf deine DS laufen würde, käme das NAS wahrscheinlich auf die Art an seine Grenzen.
 

Modiso

Benutzer
Mitglied seit
11. Mrz 2017
Beiträge
7
Punkte für Reaktionen
0
Punkte
1
@geimist
Hallo, ich habe irgendwo gelesen, dass man die CPU /RAM Nutzung für den Dockercontainer erhöhen kann, weiß aber leider nicht mehr wo ich das finden kann. Vielleicht einen Tipp für mich? DANKE!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.567
Punkte für Reaktionen
1.392
Punkte
234
In den Einstellungen eines bestehenden Containers kann man die CPU Priorität und die Speicherauslastung einstellen.
Da synOCR den Container OCRmyPDF nur temporär erstellt, ist eine Änderung über die GUI hier nicht möglich.

Bildschirmfoto 2021-08-04 um 08.40.20.png
 
Zuletzt bearbeitet:

Modiso

Benutzer
Mitglied seit
11. Mrz 2017
Beiträge
7
Punkte für Reaktionen
0
Punkte
1
@geimist
Aber über die Console ist das doch möglich, oder? Meine das irgendwo gelesen zu haben...
 

Modiso

Benutzer
Mitglied seit
11. Mrz 2017
Beiträge
7
Punkte für Reaktionen
0
Punkte
1
Nicht wirklich. Möchte aber ca. 800 pdf durchlaufen lassen und dachte vielleicht bringt mir das eine Zeitersparnis. :)
Vielen Dank für die Info!
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat