Volltextsuche im Dateisystem (DSM 4.0-2219)

Status
Für weitere Antworten geschlossen.

dex24

Benutzer
Mitglied seit
06. Mai 2012
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen,

ich bin seit einer Woche stolzer Besitzer einer DS212J und wirklich sehr zufrieden. Die einzige Funktion die mir aktuell fehlt ist die Möglichkeit der Volltextsuche. In der FileStation gibt es zwar die Möglichkeit der erweiterten Suche nur leider wird hier nicht mittels Volltext also nach dem Inhalt der Dateien/Dokumente gesucht. Hier dreht sich alles um den Dateinamen und dies unabhängig davon, ob ich in den Einstellungen der gemeinsamen Ordner die Indexierung in der Option "Datei Neuordnung aktivieren" entsprechend selektiert habe.

Hat jemand eine Idee wie ich wirklich den Inhalt also Text von PDF, XLS, DOC etc. Dateien indexieren und dann nach dem Volltext über das Webfrontend der DS212J suchen kann?

Die Möglichkeit mittels Windows dies zu bewerkstelligen ist mir schon bewusst - hilft mir leider nur bedingt etwas, wenn ich über das Internet zugreife...

Wäre nett, wenn mir jemand weiterhelfen würde!

Gruß
Sascha
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Stand heute gibt es keine fertige Volltextsuche für die DS, die ein Webinterface hat. Auf der Linux-Kommandozeile kannst per 'grep' suchen ...

Es gibt DokumentManagementSysteme (DMS), die man auf der DS installieren kann und die dann auch eine Suche anbieten und es gibt Anwendungen wie Zarafa, die auch eine Suche in für ihre Dokumente anbietet.

Es gibt auch Leute, die Google-ähliche Suchmaschinen installiert haben (wobei das ja mehr als nur eine Volltextsuche wäre). Es gibt auch ein Projekt hier im Forum, sich etwas zu programmieren ...

Itari
 

sonoio

Benutzer
Mitglied seit
22. Nov 2011
Beiträge
284
Punkte für Reaktionen
3
Punkte
18
Hallo,

welches DMS wäre das denn, was schon auf der DS installiert worden ist? Würde mich auch interessieren.
Gruß, SONOiO
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0

sonoio

Benutzer
Mitglied seit
22. Nov 2011
Beiträge
284
Punkte für Reaktionen
3
Punkte
18
Danke!
 

dex24

Benutzer
Mitglied seit
06. Mai 2012
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen,

erstmal möchte ich mich für das Feedback bedanken. Ich denke aber, dass beide Wege nicht wirklich sachgerecht sind. Grep ist her ein Linux Tool/Befehl ohne graphische- bzw. Weboberfläche. Ein OpenSource DMS auf die NAS zu installieren ist für mich persönlich etwas oversized, wenn die einzige Anforderung in der Volltextsuche besteht.

Aus meiner Sicht ist die Volltextsuche auf jeden Fall noch eine Funktion die Synology in späteren Updates in der File-Station berücksichtigen sollte/könnte. Ansonsten lässt die NAS ja wirklich kaum Wünsche offen!

Vielen Dank meinerseits noch mal für die Antworten!


Gruß
Sascha
 

WHS2

Benutzer
Mitglied seit
20. Jan 2010
Beiträge
83
Punkte für Reaktionen
1
Punkte
8
ich hatte selbiges Problem. Ich verwende jetzt Copernic Desktop Search Professional.
Im Gegensatz zur kostenlosen Version indiziert die Prof Version auch übers Netzwerk, d.h. auch die DS.
Alle üblichen Files werden indiziert, xls, doc, pst, pdf, txt , du kannst also nach Stichwort durchforsten.
Geht wahnsinnig schnell.

Die Prof Version kannst Du 30 Tage testen und gucken, obs Dir gefällt, guck hier www.copernic.com.
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
dass beide Wege nicht wirklich sachgerecht sind. Grep ist her ein Linux Tool/Befehl ohne graphische- bzw. Weboberfläche

das zu skripten, ist eine leichte Übung ... lese dir mal mein Shell-Tutorial hier im Forum durch, da findest eine Idee im Kapitel 12 ...

als vergleichbares Tool mit Web-GUI wie der Copernic wäre z. B. auch der ajaxplorer http://ajaxplorer.info/features/ zu nennen

Itari
 

DiSa

Benutzer
Mitglied seit
12. Mai 2012
Beiträge
11
Punkte für Reaktionen
0
Punkte
0
Ich experimentiere aktuell mit "regain" auf der DS-212+. Regain ist eine Volltext-Search-Engine auf Basis von Apache Lucene. Voraussetzungen sind:
- Java Runtime / SDK auf der Synology
- Tomcat-Server für die Abfrage über das Web-Interface
- plus ein paar IPKG Packages, damit der Crawler alles vernünftig indizieren kann

Erste Experimente sehen recht vielversprechend aus, wenn es einigermaßen stabil läuft, schreibe ich vielleicht eine kurze Anleitung.
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Ich experimentiere aktuell mit "regain" auf der DS-212+. Regain ist eine Volltext-Search-Engine auf Basis von Apache Lucene. Voraussetzungen sind:
- Java Runtime / SDK auf der Synology
- Tomcat-Server für die Abfrage über das Web-Interface
- plus ein paar IPKG Packages, damit der Crawler alles vernünftig indizieren kann

Erste Experimente sehen recht vielversprechend aus, wenn es einigermaßen stabil läuft, schreibe ich vielleicht eine kurze Anleitung.

Das liest sich gut ... allerdings denke daran, dass die Lösung nicht für alle DiskStation einfach wird, weil nicht alle Java und Tomcat schaffen (und auch auf der DS212+ die Performance stimmen muss, sonst wird es öde).

Hast dir die Ajaxplorer-Geschichte mal angeschaut???

Itari
 

WHS2

Benutzer
Mitglied seit
20. Jan 2010
Beiträge
83
Punkte für Reaktionen
1
Punkte
8
Hallo itari,
ja eine Anleitung das wäre eine gute Idee, wenn man die DS als Server einsetzt und möglichst alle Daten drauf liegen hat, muß man sie auch finden.
Ich bin momentan auf Copernic Desktop Search Professional umgestiegen, was ich auch gänzlich empfehlen kann.
Die Freeware Version indiziert alledingd nur den lokale Rechner, die Prof Version (unter 25Euro) auch Netzwerkfreigaben.
Die Prof Version kann man 30 Tage kostenlos testen. Läuft stabil und schnell. die Freeversion setze ich schon seit mehreren Jahren ein.
 

DiSa

Benutzer
Mitglied seit
12. Mai 2012
Beiträge
11
Punkte für Reaktionen
0
Punkte
0
Nein, Ajaxplorer habe ich mir noch nicht angesehen, scheint mir aber auch keine vollständige Volltextsuche zu sein, oder?
Was Java und Tomcat angeht, so ist auch die 212+ hart an der Grenze. Insbesondere beim Crawlen der Dateien muss man dem Java-Prozess schon seine 400-500 MB Speicher zugestehen :(, aber das kann man ja zu Zeiten laufen lassen, wenn die Station sonst nicht benutzt wird.
Wie gesagt, ich experimentiere gerade ein wenig, aber ich denke schlechter als die Photo-Indizierung der Synology wird es auch nicht werden ... ;)
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Die Freeware Version indiziert alledingd nur den lokale Rechner, die Prof Version (unter 25Euro) auch Netzwerkfreigaben.

ich hatte mir vor langer Zeit mal den Copernic angeschaut und dann verworfen, weil er bei 3 PCs auch 3 x indiziert statt einmal einen zentralen Index vorzuhalten (und auch zentral auf dem Server zu indizieren). Vielleicht kannst du ja darüber berichten, ob das mittlerweile anders ist ...

Itari
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0

michael m1

Benutzer
Mitglied seit
22. Jun 2009
Beiträge
270
Punkte für Reaktionen
0
Punkte
0
Hi,

ich bin auch schon einige Zeit dran den Indexer für die DS zu fertigen.
Habe schon einiges gemacht, C, Objective-C und Java.
Leider ist für die DS keiner dieser Ansätze vorteilhaft und überlege jetzt, mit HTML PHP und XML die Indexierungsgeschichte zu realisieren.
MySQL ist für eine Indexierung nicht geeignet, da diese zu langsam ist. Ich werde mal mit SQLite probieren.

Michael
 

michael m1

Benutzer
Mitglied seit
22. Jun 2009
Beiträge
270
Punkte für Reaktionen
0
Punkte
0
Den Ajaxplorer habe ich mir mir mal angeschaut und muss sagen, das dort einiges manuell gemacht werden muss. In Punkto Medataten gibt es nur eine Zeile und in der freien Version gibt es keine Label. Also im Gesamteindruck recht Übersichtlich, aber wie auf Ordnerebene eine manuelle statische Verwaltung. Ist halt ein Dateimanager mit ein paar netten Features. Ist aber nicht das was ich mir unter Produktiven Management Tool vorstelle.

Hilfreich wäre vielleicht mit ein paar Syno Kenner über skype mal engeren Kontakt zu knüpfen und über Möglichkeiten zu sprechen.
Ich habe viele Möglichkeiten gesucht,, gefunden, verworfen, weil Software und Hardware nicht so einfach zusammen zu bringen war.

Probleme sind die verschiedenen Prozessorarchitekturen, der teilweise geringe Speicher und CPU Leistung.
Viele Probleme könnten sich lösen lassen wenn Java als Umgebung auf der DS sein könnte, ist aber wegen der Hardware teilweise Problematisch.
Mit PHP, XML und Python ist die Frage, ob es die Leistung bringt?
Ausserdem ist es noch ein grosser Ausfwand die einzelnen Konnektoren für die verschiedenen Dateiformate zu Programmieren.
Also für das Backend habe ich seit Monaten nach einer guten Lösung gesucht und ich denke, das ein guter Ansatz wäre sich mit anderen Syno Kenner aus zu tauschen.
Also bei Interesse, sendet mir eine email ich sende dann die Skype Adresse zurück.

Michael
 

michael m1

Benutzer
Mitglied seit
22. Jun 2009
Beiträge
270
Punkte für Reaktionen
0
Punkte
0
Also mittlerweile habe ich das Gefühl ohne Java geht nix.

Hat denn jemand schon mal Java auf die DS installiert und kann mal was zur Prozessorauslastung und Speicherverbrauch sagen?
Mittlerweile bin ich ziemlich gestresst und habe jetzt ein paar Wochen nur damit verbracht Lösungen zum Indexieren auf einer DS
zu suchen nur ausschliesslich mit einer PHP Umgebung.

Alles ist in PHP machbar, klar, aber nur mit Unterstützung von Java Bibliotheken.

michael
 

michael m1

Benutzer
Mitglied seit
22. Jun 2009
Beiträge
270
Punkte für Reaktionen
0
Punkte
0
Danke,

aber nun bin ich mir nicht sicher welche Java Versionen ich nun laden muss?

DS 509+: FreeScale MPC 8533 PPc 64 Bit ???
DS410j: Marvel Kirkwood mv6281 ARM 16 Bit ???

Java SE Embbed 6, 7 Schätze mal Java 1.6 und Java 1.7.

Welche Prozessorversionen sind denn jetzt für wen oder was?

ARMv6/7 Linux - Headless
ARMv7 Linux - Headless - Server Compiler
ARMv7 Linux - Headful
ARMv5 Linux - Headless
e600 core
e500v2 core
x86 Linux Small Footprint - Headless - Schätze mal für Intel Prozessoren.

In JAVA SE EMBEDDED SYSTEM REQUIREMENTS
stehen auch einige informationen, aber wie bekomme ich Verhaus, welche glib usw. ich auf dem System habe ?
Kann ich mir da auch aussuchen wieviel MB RAMM Java auch verbrauchen darf?

Für Hilfe bin ich dankbar.

michael
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat