synOCR synOCR - GUI für OCRmyPDF

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.890
Punkte für Reaktionen
1.510
Punkte
274
@geimist : Stephan - glaube Deine Seite geht wieder - aber Zertifikat scheint nicht zu ziehen...
 
Zuletzt bearbeitet:

Fartman

Benutzer
Mitglied seit
21. Jul 2010
Beiträge
475
Punkte für Reaktionen
0
Punkte
22
Alles gut, hab jetzt die 1.2.0 am laufen. Danke.
 

Extron

Benutzer
Mitglied seit
26. Jul 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo,

ich habe eine Frage. Ich würde gerne meine Dokumente automatisch drehen lassen, damit ich sie nicht kopfüber habe.

Dazu habe ich folgende OCR-Option eingestellt, jedoch funktioniert das nicht.

-srd -l deu

Kann mir einer helfen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Kopfüber ist wohl die größte Herausforderung beim Drehen. Man kann die Empfindlichkeit einstellen. Suche mal im Thread nach --rotate-pages-threshold
 

Extron

Benutzer
Mitglied seit
26. Jul 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Kopfüber ist wohl die größte Herausforderung beim Drehen. Man kann die Empfindlichkeit einstellen. Suche mal im Thread nach --rotate-pages-threshold
Hat funktioniert, Danke!

Jetzt habe ich noch zwei Fragen, und zwar kann sind die Outputs nun immer PDF/A Dateitypen, besteht die Möglichkeit ein normales PDF als Output zu generieren?

Und die zweite Frage wäre, wieso funktioniert Remove Background bei mir nicht?

Hier ein Auszug aus dem Logfile:

NotImplementedError: --remove-background is temporarily not implemented
← OCRmyPDF-LOG-END

┖➜ failed! (target file is empty or not available)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234

Extron

Benutzer
Mitglied seit
26. Jul 2022
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Vielen Dank :)

Entschuldige, dass ich so viel frage, aber ich habe noch ein Problem, und zwar scannt mein Scanner manchmal Seiten etwas schief ein und kann man diese Seiten automatisch begradigen lassen?
 
Zuletzt bearbeitet von einem Moderator:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Dafür ist der OCRmyPDF-Parameter -d zuständig. Den hast du aber schon gesetzt. Bei mir funktioniert das meistens auch.
 

78er

Benutzer
Mitglied seit
26. Jan 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Hallo :)

ich weiß zwar nicht ob diese Frage schon mal gestellt wurde ... aber ich frage einfach mal ...

Kann man mehrere RegEx Abfragen in einer YAML-Regel anwenden? Müsste man diese dann irgendwie kennzeichnen?

z.B.
tagname_RegEx1:
tagname_RegEx2:
usw.
Oder funktioniert das dann über die subrules?
searchstring: (?<=Rechnung Nr.)\s\d+\-\d+
isRegEx: true
...

Danke schon mal für die rm.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Wie HIER beschrieben, kannst du mehrere Regelblöcke hintereinanderschreiben. Jeder Regelblock wird durch den eindeutigen Regelnamen gekennzeichnet. In jedem Regelblock kannst du eigene RegExe definieren.
 

78er

Benutzer
Mitglied seit
26. Jan 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Sorry - habe mich falsch ausgedrückt ... :-|

Meine Frage zielte mehr darauf ab, ob ich in der Benennung der Datei 2 oder 3 RegEx Funde einfügen / ausgeben kann oder tatsächlich nur 1x.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Jeder Tag der erfüllten Regeln kommt in den Namen (sofern §tag in der Umbenennungssyntax der GUI gesetzt ist). Werden mehrere Regeln erfüllt, so landen auch mehrere Tags im Namen. Oder habe ich dich immer noch falsch verstanden?
 

78er

Benutzer
Mitglied seit
26. Jan 2021
Beiträge
4
Punkte für Reaktionen
0
Punkte
1
Ich fürchte ja ...
Mir ist bewusst, dass ich die unter tagname

tagname: Buchhandlung Thalia

eingetragenen Wörter in der Benennung wiederfinde. Mir geht es aber darum, ob ich nach mehreren RegEx ausdrücken suchen und diese dann in der Benennung kombinieren kann.

z.B.
RegEx(1) Summe
RegEx(2) Name des Geschäfts

Ausgabe der Dateibenennung: xx.xx.2022_50,99_Thalia
 

jhess

Benutzer
Mitglied seit
14. Apr 2016
Beiträge
41
Punkte für Reaktionen
5
Punkte
8
Hallo mal wieder!

BIs vor kurzem hat synocr prima funktioniert - auch die automatische Aufgabe im Aufgabenplaner der DSM (alle 15 min las root). hat zuversichtlich die gescannten Dokumente in den Output Ordener geschaufelt...

Nun wird die Aufgabe nicht mehr automatisch ausgeführt - hat sich irgendetwas an der notwendigen Konfiguration geändert? Ich benutzte die aktuellste 1.2 Version auf DSM 7...

Habe ich ein Update oder eine Änderung an den Rechten verpasst?

Manuell gestartete Scans laufen nach wie vor... Neustart der DSM habe ich probiert...

Soweit, beste Grüße,
jh
 

jhess

Benutzer
Mitglied seit
14. Apr 2016
Beiträge
41
Punkte für Reaktionen
5
Punkte
8
@geimist - das ist schlimm - na dann, viel Glück!

Was machen wir nur alle, wenn unsere Server oder das tolle Internetz mal großflächig ausfallen... ?

Müssen wir dann wieder Briefe schreiben? Brrr...

Herzliche Grüße,
jh
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Für „schlimm“ fallen mir andere Ereignisse in der Welt ein. Aber der eine oder andere hat sich wahrscheinlich gewundert. Daher die Info.

Diesmal hat es nur einen halben Tag gedauert. Die Downloadseite ist wieder erreichbar 😊
 

psychochicken80

Benutzer
Mitglied seit
17. Mrz 2022
Beiträge
8
Punkte für Reaktionen
1
Punkte
53
Ich habe nun endlich auch wieder etwas getestet (Version 1.2.0.10). Es funktioniert ziemlich gut, bei der Ermittlung des OCR-Datums fallen mir aber einige Unregelmäßigkeiten auf.
Im Prinzip werden einige Datümer nicht gefunden. Merkwürdig ist dabei, dass diese durchaus in der synOCR_searchfile_*.txt als normales Datum (also etwas 13.04.2022) drinstehen. Im Log werden diese nicht mal erwähnt. Außerdem habe ich auch schon Fälle gesehen, bei denen sich von den gefundenen Datümern (ich weiss, es heisst Daten) mal eben für das ältere und nicht das jüngere Datum entschieden wird.
Was darf ich euch liefern, damit dieses Verhalten analysiert werden kann?

Gruß
Stefan
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.545
Punkte für Reaktionen
1.377
Punkte
234
Das beste wäre eine Beispieldatei. In dem Fall würde sich das bestimmt @Gthorsten mal näher ansehen. Die Datei kannst du gern auf meinen Server legen (Uploadlink in der Signatur). Oder du schickst sie ihm persönlich.
 
  • Like
Reaktionen: Gthorsten


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat