Was sagt denn das Container-Log? Startet und läuft der Container korrekt? Oder gibt es dort Fehlermeldungen?Auf einmal zeigt er mir neue Scans allerdings nicht mehr in der Inbox ein
...so ich habe nun den gleichen Workflow, erste Erfahrungen:Also ich habe ein Dokument, daß ich mehrfach durch ecoDMS habe ocr'en lassen, da kam jedesmal "Sanitä" beim OCR heraus. Mit synOCR hatte ich endlich das gewünschte Ergebnis "Sanitär". Und es war kein unklarer Scan.
Ich lege jetzt den OCR-Output von synOCR im scaninput-Ordner ab und lasse bei den PDF/A mit durchgeführtem OCR keinen weiteren OCR mehr laufen - gemäss der jetzt geänderten Einstellungen.
D.h. workflow ist jetzt: Scanner per FTP in den synOCR-Eingangsordner - synOCR nach ecoDMS scaninput, kein weiteres OCR bei vorhandenem OCR.
REGEX:(?i)\b(([0-9]?[0-9])[. ][ ]?([0-9]?[0-9][. ]|Jan.*|Feb.*|Mär.*|Apr.*|Mai|Jun.*|Jul.*|Aug.*|Sep.*|Okt.*|Nov.*|Dez.*)[ ]?([0-9]?[0-9]?[0-9][0-9]))\b
Ausnahmen waren eher wenn mehr Leerzeichen erkannt wurden als von meiner Regel vorgesehen …
… [ ]? …
[ ]?
steht für die Anzahl 0 oder 1 Leerzeichen[ ]*
steht für eine beliebige Anzahl von Leerzeichen[ ]+
steht für 1 oder mehr LeerzeichenAls Code gepostet könnte man das besser lesenREGEX?i)\b(( …
Danke für deine Tips, das mit dem Code habe ich hoffentlich richtig verstanden...[ ]?
steht für die Anzahl 0 oder 1 Leerzeichen
[ ]*
steht für eine beliebige Anzahl von Leerzeichen
[ ]+
steht für 1 oder mehr Leerzeichen
Als Code gepostet könnte man das besser lesen
ecoDMS
date stream content 2022-02-19 08:30:15 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-19 09:30:15,088 | WARN| Document not found!" 2022-02-18 12:30:01 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 13:30:01,660 | WARN| Document not found!" 2022-02-18 12:12:04 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 1\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 12:12:04 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit9122634278912727970.pdf\"\n" 2022-02-18 12:12:04 stdout ERROR: "Reading object 8 0 R with type: Number\n" 2022-02-18 12:12:04 stdout ERROR: "[PDF2PDF] Page rotation: 0\nReading object 7 0 R with type: Number\n" 2022-02-18 12:12:00 stdout ERROR: "Detected 68 diacritics\n" 2022-02-18 12:11:58 stdout ERROR: "\"13:11:58,859\" DECTECT OS\n" 2022-02-18 12:11:58 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 12:11:57 stdout ERROR: "Changes allowed: true\n" 2022-02-18 12:11:57 stdout ERROR: "<</ID[<487E1BD1982C3EFDBEEDD7585CE8A178><487E1BD1982C3EFDBEEDD7585CE8A178>]/Info 2 0 R/Root 1 0 R/Size 12>>\n" 2022-02-18 11:52:49 stdout ERROR: "[EcoDMSSplitImg] Processing page 2 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 11:52:49 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 11:52:49 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit8254217092724859723.pdf\"\n" 2022-02-18 11:52:49 stdout ERROR: "Reading object 13 0 R with type: Number\n" 2022-02-18 11:52:49 stdout ERROR: "Reading object 8 0 R with type: Number\n" 2022-02-18 11:52:49 stdout ERROR: "[PDF2PDF] Page rotation: 0\nReading object 12 0 R with type: Number\n" 2022-02-18 11:52:47 stdout ERROR: "Empty page!!\n" 2022-02-18 11:52:46 stdout ERROR: "Empty page!!\n" 2022-02-18 11:52:46 stdout ERROR: "\"12:52:46,355\" DECTECT OS\n" 2022-02-18 11:52:45 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 11:52:45 stdout ERROR: "[PDF2PDF] Page rotation: 0\nReading object 7 0 R with type: Number\n" 2022-02-18 11:52:37 stdout ERROR: "\"12:52:37,521\" DECTECT OS\n" 2022-02-18 11:52:36 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 11:52:36 stdout ERROR: "Changes allowed: true\n" 2022-02-18 11:52:36 stdout ERROR: "<</ID[<2069D36FDAD4D640131910F0C13ABECD><2069D36FDAD4D640131910F0C13ABECD>]/Info 2 0 R/Root 1 0 R/Size 17>>\n" 2022-02-18 11:32:16 stdout ERROR: "[EcoDMSSplitImg] Processing page 2 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 11:32:16 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 11:32:16 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit4945752660985116016.pdf\"\n" 2022-02-18 11:32:16 stdout ERROR: "Reading object 13 0 R with type: Number\n" 2022-02-18 11:32:16 stdout ERROR: "Reading object 8 0 R with type: Number\n" 2022-02-18 11:32:16 stdout ERROR: "Reading object 12 0 R with type: Number\n" 2022-02-18 11:32:16 stdout ERROR: "[PDF2PDF] Page rotation: 0\n" 2022-02-18 11:31:26 stdout ERROR: "\"12:31:26,870\" DECTECT OS\n" 2022-02-18 11:31:26 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 11:31:25 stdout ERROR: "[PDF2PDF] Page rotation: 0\nReading object 7 0 R with type: Number\n" 2022-02-18 11:31:17 stdout ERROR: "Error in boxClipToRectangle: box outside rectangle\nError in pixScanForForeground: invalid box\nError in boxClipToRectangle: box outside rectangle\nError in pixScanForForeground: invalid box\n" 2022-02-18 11:31:16 stdout ERROR: "\"12:31:16,375\" DECTECT OS\n" 2022-02-18 11:31:15 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 11:31:14 stdout ERROR: "Changes allowed: true\n" 2022-02-18 11:31:14 stdout ERROR: "<</ID[<E1BC543C16BB83E8E85DB455DD601A5F><E1BC543C16BB83E8E85DB455DD601A5F>]/Info 2 0 R/Root 1 0 R/Size 17>>\n" 2022-02-18 08:57:09 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:09,214 | WARN| Document not found!" 2022-02-18 08:57:05 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:05,202 | WARN| Eingabeparameter falsch oder unvollständig!" 2022-02-18 08:57:05 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:05,045 | WARN| Document not found!" 2022-02-18 08:57:03 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:03,147 | WARN| Eingabeparameter falsch oder unvollständig!" 2022-02-18 08:57:02 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:02,989 | WARN| Document not found!" 2022-02-18 08:57:01 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:01,793 | WARN| Eingabeparameter falsch oder unvollständig!" 2022-02-18 08:57:01 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:57:01,630 | WARN| Document not found!" 2022-02-18 08:56:58 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:56:58,444 | WARN| Eingabeparameter falsch oder unvollständig!" 2022-02-18 08:56:26 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:56:26,278 | WARN| Document not found!" 2022-02-18 08:56:04 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-18 09:56:04,176 | WARN| Document not found!" 2022-02-18 08:46:52 stdout ERROR: "[EcoDMSSplitImg] Processing page 2 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 08:46:52 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 2\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 08:46:52 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit8728708203156078121.pdf\"\n" 2022-02-18 08:46:52 stdout ERROR: "[PDF2PDF] Page rotation: 0\n" 2022-02-18 08:46:43 stdout ERROR: "\"09:46:43,537\" DECTECT OS\n" 2022-02-18 08:46:42 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 08:46:42 stdout ERROR: "[PDF2PDF] Page rotation: 0\n" 2022-02-18 08:46:32 stdout ERROR: "\"09:46:32,935\" DECTECT OS\n" 2022-02-18 08:46:32 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 08:46:31 stdout ERROR: "Changes allowed: true\n" 2022-02-18 08:46:31 stdout ERROR: "<</ID[<CD7338E89FAB57C2ABB736B432E0800C><CD7338E89FAB57C2ABB736B432E0800C>]/Root 1 0 R/Size 14>>\n" 2022-02-18 08:45:49 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 1\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-18 08:45:49 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit3072440212812488966.pdf\"\n" 2022-02-18 08:45:49 stdout ERROR: "[PDF2PDF] Page rotation: 0\n" 2022-02-18 08:45:41 stdout ERROR: "\"09:45:41,888\" DECTECT OS\n" 2022-02-18 08:45:41 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-18 08:45:40 stdout ERROR: "Changes allowed: true\n" 2022-02-18 08:45:40 stdout ERROR: "<</ID[<5306008433BC73C129B68C83AE8517F4><5306008433BC73C129B68C83AE8517F4>]/Root 1 0 R/Size 10>>\n" 2022-02-17 11:38:16 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 12:38:16,688 | WARN| Document not found!" 2022-02-17 11:37:36 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 12:37:36,998 | WARN| Document not found!" 2022-02-17 11:37:30 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 12:37:30,295 | WARN| Document not found!" 2022-02-17 11:37:30 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 12:37:30,139 | WARN| Document not found!" 2022-02-17 11:35:28 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 12:35:28,094 | WARN| Document not found!" 2022-02-17 09:49:58 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:49:58,722 | WARN| Document not found!" 2022-02-17 09:49:58 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:49:58,361 | WARN| Document not found!" 2022-02-17 09:47:59 stdout "de.ecodms.plugin.EcoDMSClassifyPlugin | handleClientRequest | 2022-02-17 10:47:59,201 |ERROR| Keine Backup-Einstellungen gefunden. \nde.applord.ecodms.ecodmsjavaclient.exception.EcoDMSException: Keine Backup-Einstellungen gefunden.\n\tat de.ecodms.plugin.EcoDMSClassifyPlugin.doBackup(EcoDMSClassifyPlugin.java:926)\n\tat de.ecodms.plugin.EcoDMSClassifyPlugin.doBackup(EcoDMSClassifyPlugin.java:895)\n\tat de.ecodms.plugin.EcoDMSClassifyPlugin.handleClientRequest(EcoDMSClassifyPlugin.java:476)\n\tat de.ecodms.plugin.EcoDMSClassifyPlugin.newMessage(EcoDMSClassifyPlugin.java:125)\n\tat de.ecodms.ecoActiveMQConsumer.EcoActiveMQConsumer.onMessage(EcoActiveMQConsumer.java:349)\n\tat org.apache.activemq.ActiveMQMessageConsumer.dispatch(ActiveMQMessageConsumer.java:1433)\n\tat org.apache.activemq.ActiveMQSessionExecutor.dispatch(ActiveMQSessionExecutor.java:131)\n\tat org.apache.activemq.ActiveMQSessionExecutor.iterate(ActiveMQSessionExecutor.java:202)\n\tat org.apache.activemq.thread.PooledTaskRunner.runTask(PooledTaskRunner.java:133)\n\tat org.apache.activemq.thread.PooledTaskRunner$1.run(PooledTaskRunner.java:48)\n\tat java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)\n\tat java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)\n\tat java.lang.Thread.run(Thread.java:748)" 2022-02-17 09:42:52 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:42:52,038 | WARN| Document not found!" 2022-02-17 09:42:46 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:42:46,687 | WARN| Document not found!" 2022-02-17 09:41:26 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:41:26,652 | WARN| Document not found!" 2022-02-17 09:38:57 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:38:57,610 | WARN| Document not found!" 2022-02-17 09:38:57 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 10:38:57,430 | WARN| Document not found!" 2022-02-17 08:50:08 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 09:50:08,138 | WARN| Document not found!" 2022-02-17 08:50:07 stdout "de.ecodms.plugin.EcoDMSArchivePlugin | handleClientRequest | 2022-02-17 09:50:07,744 | WARN| Document not found!" 2022-02-17 08:49:37 stdout ERROR: "[EcoDMSSplitImg] Processing page 1 of 1\n[EcoDMSSplitImg] Check for separator page...\n" 2022-02-17 08:49:37 stdout ERROR: "PARAMS BARCODE ()\n[EcoSIMSSplit] Check file: \"/opt/ecodms/workdir/tiffsplit/ecodmssplit3944976030794466848.pdf\"\n" 2022-02-17 08:49:37 stdout ERROR: "Reading object 8 0 R with type: Number\n" 2022-02-17 08:49:37 stdout ERROR: "[PDF2PDF] Page rotation: 0\nReading object 7 0 R with type: Number\n" 2022-02-17 08:49:30 stdout ERROR: "\"09:49:30,296\" DECTECT OS\n" 2022-02-17 08:49:29 stdout ERROR: "[ecoQOCR] OCR Data Path (1): /opt/ecodms/ecodmsserver/tools/tessdata\n" 2022-02-17 08:49:28 stdout ERROR: "Changes allowed: true\n" 2022-02-17 08:49:28 stdout ERROR: "<</ID[<4C34B344233994C6498FF53F6022BECC><4C34B344233994C6498FF53F6022BECC>]/Inf
Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.
Als Dankeschön schalten wir deinen Account werbefrei.