synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
PRs kann ja jeder machen, aber nicht jeder einpflegen.
Dabei muss ich aber auch sagen, dass ich mit dem Git-Workflow auch noch nicht vertraut bin. Aber das kann man ja lernen :)
 
  • Like
Reaktionen: Tommes und Gthorsten

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Im Endeffekt ändert es aber die Art und Weise wie das. Projekt weiter betrieben wird.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.669
Punkte für Reaktionen
1.566
Punkte
314
Das sehe ich nicht so, auch wenn ich mit GitHub, einem Pull Request sowie einigen anderen Dingen auch noch nicht ganz grün bin.

Mittlerweile habe ich meine Pakete auf GitHub so umstrukturiert, das man z.B. durch einen PR einen lokalen Klon erstellen, Änderungen im Code vornehmen und zur Selbstkontrolle mit dem Synology Toolkit direkt ein SPK packen kann. Somit kann jeder, der möchte, sich direkt auf das Wesentliche konzentrieren und muss sich nicht erst mit der Struktur und/oder einer möglichen, individuellen Paketerstellung rumschlagen. Sind die Änderungen vorgenommen und funktioniert alles, kann ich mir den PR in Ruhe anschauen, selbst Änderungen vornehmen oder weitere Änderungen vom Einreicher einfordern. Gefällt mit das Ergebnis, kann ich den PR in mein Main-Branch einfließen lassen. Gefällt mir der PR nicht, kann ich diesen auch abweisen. Das geschieht völlig unabhängig von einer aktuellen Release-Version des Paketes. Erst wenn ich genug Änderungen gesammelt habe und ich den Zeitpunkt für angebracht halte, schnüre ich ein neues SPK. Alternativ kann man natürlich auch Zwischenversionen schnüren und anbieten, ganz wie man mag.

Möchte ich synOCR z.B. etwas gutes tun, indem ich das GUI-Backend mit Updates versorge, kann ich das über einen PR regeln. Stephan könnte den PR dann irgendwann annehmen, aber vorerst nicht in einem Release Paket anbieten. Somit kann ich, wenn ich bock habe, sein System aktuallieren und Stephan kann, wenn er Bock hat, das an die Leute verteilen. Das nur als grobes Beispiel. Denn mit GitHub kann man noch viel mehr Blödsinn anstellen...

GitHub und das Synology Toolkit wären auch die nächsten logischen Schritt, will man seine Pakete irgendwann mal in der SynoCommunity unterbringen wollen, da diese Palttform auf GitHub aufbaut. Leider bin ich aktuell noch zu doof zu verstehen, was die von mir wollen, damit ich meine Pakete dort parken kann. Aber gut... irgendwann bekomm ich das hin. Und ich weiß, das auch Stephan alias @geimist großes Interesse daran hat, seine Pakete ebenfalls dort zu platzieren.

Tommes
 
  • Like
Reaktionen: geimist und Gthorsten

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.669
Punkte für Reaktionen
1.566
Punkte
314
Mit den ganzen GUI-Sachen habe ich eigentlich rein gar nichts am Hut
Naja, komm... so ganz stimmt das ja nun auch wieder nicht. Ich habe deine bestehende GUI nur ein wenig gepimpt... und alles Andere ist über die Jahre einfach so entstanden und das gebe ich natürlich gerne weiter. Von deinen postgres Datenbank- und Docker Gedöhns habe ich wiederum keine Ahnung. Von daher helfen wir uns einfach nur gegenseitig, da wir als Syno-3rdParty-Developer zu einer aussterbenden Rasse gehören.
 

Gthorsten

Benutzer
Mitglied seit
22. Mai 2021
Beiträge
151
Punkte für Reaktionen
42
Punkte
28
Nun da hast du recht, aber trotzdem ändert es was. Heute macht Stephan ja alles selber, weiß was er einbaut und kann das bewerten. Oder er lagert ganze Module aus, so wie bei der datunsssuche an mich.
Dann können aber viele dran mitarbeiten und letztendlich muss einer dann sich immer alles neue angucken, es bewerten und entscheiden.
Ich wollte das ja nicht schlecht reden, aber ich finde es ändert was an der Arbeitsweise
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
Ja und nein. Auch heute schon schlagen User Änderungen vor. Das erfolgt teils durch Posten von Code hier im Thread, teils durch PNs, teils durch eigene user auf @geimist privater Git-Instanz. PRs vereinfachen das ganze da die Jungs dann nicht selbst versuchen müssen die erhaltenen Codeschnippsel an der richtigen Stelle einzupflegen. Das ist dann Aufgabe der PR-Ersteller und @geimist muss nur noch prüfen obs an der richtigen Stelle ist, Sinn ergibt und ggf. seinen Standards für sauberen Code entspricht. Die Kontrolle bleibt bei den Repository-Besitzern, es kommt nur mehr Strutur rein.
Ob das jetzt gut oder schlecht ist, weil ggf. die kleine und extrem hilfreiche Familie hier im Thread dabei auf der Strecke bleibt, steht natürlich auf einem anderen Blatt.
 
Zuletzt bearbeitet von einem Moderator:

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.669
Punkte für Reaktionen
1.566
Punkte
314
@Gthorsten
That's the way of life denn Stillstand ist der Tod! ;)
 
  • Like
Reaktionen: Gthorsten

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.669
Punkte für Reaktionen
1.566
Punkte
314
Einerseits Phrasen, anderseits ist das, grade bei der Paketentwicklung schon immer so gewesen. Mit jedem Major Release des DSM wehen einem neue Winde um die Nase, egal ob von DSM 5 auf 6, 6 auf 7 oder ganz aktuell… von DSM 7.1 auf DSM 7.2. Bei letzterem können wir (bis auf weiteres) unsere Apps nämlich nicht mehr im DSM Tab öffnen, sondern müssen dafür einen neuen Tab aufmachen.

Die Macher von CPHub z.B. haben es bis heute nicht geschafft, ihren Paketserver an DSM 7 anzupassen, geschweige denn überhaupt noch irgendeinen nennenswerten Support zu leisten. @geimist kann da ein Lied von singen. Das war einer der Gründe auf GitHub auszuweichen um mich dann irgendwann der SynoCommunity anzuschließen. Aber ich drifte wieder ab… Sorry.

Es wird jedenfalls nicht langweilig und wenn du nicht am Ball bleibst und Änderungen sowie Strategiewechsel in Kauf nimmst, bist du hier falsch.
 

DeeKay1

Benutzer
Mitglied seit
20. Jun 2020
Beiträge
100
Punkte für Reaktionen
23
Punkte
24
@geimist
Frage: Werden targetfolder angelegt sofern sie noch nicht existieren?
Falls ja, wäre es ein ziemlich nettes Feature wenn man entweder §tagname_RegEx auch im targetFolder verwenden könnte oder es ein separates
§targetfolder_RegEx gibt.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
Es gibt eine neue Beta.
  • @st3623:
    Ich hab jetzt mal alle temporären Dateien aus dem Zielordner verbannt. Bitte testet es mal gründlich, damit auch nichts verloren geht.
  • @DeeKay1:
    Das Datumsskript wurde auf Version 1.0.4 aktualisiert (thx @Gthorsten). Bitte mal deine Problemdatei testen.
  • @Thonav:
    synOCR startet mit dieser Version in einem neuen Fenster. Es sollte also auch mit DSM7.2 nutzbar sein

Download der Beta: DSM6 | DSM7



Das gesamte Changelog der aktuelle Beta:
1.3.99.6 [2023-03-11]
BUGFIXES:

- [YAML] caseinsensitive was not definable
- [GUI] fixed syntax error that caused a navigation error in the GUI
- [SHELL] if two separation pages follow each other, this was result in an empty PDF file (thx @DeeKay1)
- [SHELL] if metadata was previously written, the PDF lost its PDF/A property.
An updated version of PyPDF2 (>= 3.0.0) will help for this
Target files are now tagged with PDF version 1.7 (PDF/A), but are not yet fully compliant with the standard
- [GUI] synOCR starts in a new window (adjustment to DSM7.2) (thx @Tommes) [only DSM >= 7.0]
IMPROVEMENT:

- [GUI] profile changes automatically when another name is selected in the listbox (thx @HolerZ)
- [GUI] the warning for an invalid source directory now also contains the name of the affected profile
- [SHELL] update find_dates.py to version 1.0.4 (thx @Gthorsten)
- [SHELL] update PyPDF2 version 2.3.1 to pypdf version 3.5.1
- [SHELL] no temporary data is stored in the destination folder now
IMPLEMENTATIONS:

- [YAML] >multilineregex: true< can be set at subrule and for tagname_RegEx
this will set the parameter -z for grep to find results over multi lines
- [GUI] support for follow machine translated languages (by DeepL)
- Korean
- Norwegian
 
Zuletzt bearbeitet:

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.199
Punkte für Reaktionen
1.024
Punkte
224
Ein Klick auf DSM7 lädt bei mir synOCR_DSM6_master_latest_[1.3.99.6] … BETA.spk herunter, Stephan.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
Da hilft nur ein Downgrade des DSM o_O

Sorry, war falsch verlinkt. Hab ich nun korrigiert.
 
  • Like
Reaktionen: gaerti

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
@geimist
Frage: Werden targetfolder angelegt sofern sie noch nicht existieren?
Falls ja, wäre es ein ziemlich nettes Feature wenn man entweder §tagname_RegEx auch im targetFolder verwenden könnte oder es ein separates
§targetfolder_RegEx gibt.
Ja, die Ordner werden ggf. angelegt.
RegEx für den Dateipfad ist derzeit nicht implementiert.
 

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.890
Punkte für Reaktionen
1.510
Punkte
274
Moin Männers und Danke für die neue Beta. Soeben installiert und, wie von Euch mitgeteilt, öffnet sich die Oberfläche in einem neuen Fenster.
Alles ok. Habe auch gleich eine Datei (Anlage) durchgejagt und leider habe ich den Eindruck, dass die Erkennung ein wenig schlechter ist. Parallel ließ ich die Datei auf anderer DS durch paperless-ngx durchjagen - das Ergebnis war hier besser. Gibt es eine Erklärung oder bilde ich es mir ein?
Grüße!!
 

Anhänge

  • IMG_0152.jpeg
    IMG_0152.jpeg
    389,8 KB · Aufrufe: 12

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.199
Punkte für Reaktionen
1.024
Punkte
224
Gleiche OCRmyPDF-Parameter (bei synOCR: Konfiguration → OCR-Optionen und Umbenennung | bei Paperless-ngx: Anpassungen in der .yaml oder .env)? Ansonsten ist das tatsächlich merkwürdig, da gleiche Texterkennung.
 
Zuletzt bearbeitet:

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.890
Punkte für Reaktionen
1.510
Punkte
274
Ja, nichts verändert. Eins noch - der Signalton ertönt nicht unter der neuen Beta...

Ergebnisse der Erkennung:
1. SynOCR

Luge
wird nicht zur Wahrheit, falsches wird nicht richtig
und das Bose wird nicht gut, nur weil es von einer Mehrheit
akzeptiert wird.
Eine

2. paperless-ngx

Eine Luge
wird nicht zur Wahrheit, falsches wird nicht richtig
und das Böse wird nicht gut, nur weil es von einer Mehrheit akzeptiert wird.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.536
Punkte für Reaktionen
1.372
Punkte
234
An dem ganzen OCR-Gedöns wurde nichts geändert. Du könntest mal eine andere OCRmyPDF-Version probieren. Ich habe keine Ahnung, welche in Paperless Verwendung findet.
Ja, nichts verändert. Eins noch - der Signalton ertönt nicht unter der neuen Beta...
Auch hier wurde nichts geändert. Der Piep funktioniert nur, wenn der Task / Überwachung über den User root gestartet wurde - nur der darf piepsen.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat