Volume abgestürzt DS916+

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Hallo,
ich weiß, das Thema taucht hier des Öfteren auf, hab aber zu meinem Problem noch keinen ähnlichen Eintrag gefunden.

Vor zwei Tagen ist das Volume abgestürzt, bis dahin hat die 916+ zwei Jahre lang klaglos den Dienst versehen. Verbaut sind zwei WD40 im Raid1-Verbund. Das Merkwürdige ist, dass nach Aus- und wieder einschalten der DS das Volume wieder ganz normal arbeitet, alles im grünen Bereich, Festplatten top in Ordnung, S.M.A.R.T-Schnelltest ergab keine Fehler.

Greift man dann auf die DS zu, kann es sein, dass plötzlich wieder das Volume abstürzt. Zunächst kam der Verdacht auf, dass dies durch eine Datei verursacht wird. Allerdings kann auf diese Datei von einem Rechner im Netz ohne Probleme zugegriffen werden. Beim Zugriff von einem anderen Rechner aus, wurde dann der Absturz wieder verursacht.

Ich denke aber, es muss etwas mit dem DSM nicht in Ordnung sein. Während der Untersuchungen zur Ursache, kam eine Meldung, dass mit dem Volume etwas nicht in Ordnung sei und dazu mehr im Protokoll stehen würde. Beim Aufruf des Protokoll kam es dann wieder zu einem Volume-Absturz.

Hat jemand dafür eine Erklärung oder eine Idee, was da schief hängt?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
1. Bitte keine Smarttests machen (sinnfrei und unnötig Last für die HDD)
2. Smartwerte posten (Speichermanager => HDDs => Integritätsstatus => Smart)
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Bis ID 193 sieht alles gut aus. Du hast aber vergessen zu scrollen, darunter sind noch weitere IDs.
 

Wollfuchs

Benutzer
Sehr erfahren
Mitglied seit
06. Sep 2020
Beiträge
1.143
Punkte für Reaktionen
261
Punkte
159
Spricht was gegen, volume neu erstellen, daten wieder aufs nas schieben?

also, ausser, das es zeit kostet, je nach datenmenge?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Spricht was gegen, volume neu erstellen
Also Augen zu und durch? Motor macht komische Geräusche, also einfach mal neustarten?

Es muss ja einen Grund haben warum das Volume abgestürzt ist. Die Smartwerte sind erst mal der erste Anhaltspunkt. Da hier ID1 bei beiden HDDs auf 0 steht, wird wohl auch der Rest unter ID193 ok sein. Aber nachgucken sollte man trotzdem, speziell ID200.

Ich hatte bisher keinen Absturz vom Volume. Ich weiß daher nicht, ob in den Logs dazu was genaueres zu finden ist (siehe Protokollcenter bzw. über die Konsole => /var/log ).
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
So hier nun die restlichen Werte, das mit dem Protokollcenter wollte ich schon prüfen, dann stürzt aber das Volume auch ab.

Soweit ich das hier laienhaft beurteilen kann, sind auch die restlichen Werte der FP in Ordnung:

1606284190166.png

1606284242670.png

Kurios ist das aber schon.
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Spricht was gegen, volume neu erstellen, daten wieder aufs nas schieben?

also, ausser, das es zeit kostet, je nach datenmenge?
Nein, eigentlich nicht, bin gerade dabei die Daten zu sichern, damit sollte das dann kein Problem sein. Allerdings weiß ich noch nicht, ob die Sicherung überhaupt funktioniert hat. Vermutlich stürzt das Volume auch dabei ab.
 

Wollfuchs

Benutzer
Sehr erfahren
Mitglied seit
06. Sep 2020
Beiträge
1.143
Punkte für Reaktionen
261
Punkte
159
Motor macht komische Geräusche, also einfach mal neustarten?
naja ... auch wenn eine Auto Analogie vielleicht nicht ganz passt, ich greife sie trotzdem mal auf.

Landstrasse ... scheinbar unendlich lang .. Tempomat auf 80 Knoten und ab dafuer.
In unregelmaessigen Abstaenden schreit der Bordcomputer, dass der Motor evtl.
defekt ist.
Also nicht ganz kaputt, denn der Wagen faehrt ja noch .. nur irgendwie defekt.
Jetzt kann man sagen .. ja neee, jedes neu starten stresst den Anlasser, den Motor und auch
Kruemmer und Auspuff, da lass ich ihn lieber laufen. So kann ich regelmaessig im Bordcomputer
durchklicken, was alles noch in Ordnung ist.

Und Aus- und Einschalten der DS war ja die erste Selbsthilfe in dem Fall und hat nix gebracht,
die Sache aber auch nicht verschlimmert.

Ist das so ein ext4 oder dieses neue, mit Selbstheilungskraeften gesegnetes btrfs auf den Platten?

War nicht bis vor Kurzem die Standardvorgehensweise, Volume im Eimer, dann neu aufsetzen...?

Auch wenn die Ursache dadurch sicher nicht klarer wird, interessant waere doch, ob der Fehler
dann reproduzierbar, wieder auftritt.

Aber mal naiv .. wenn die Start Stop Zeiten alle identisch sind, bis auf die Spin Up und Power On
Zeiten, kommt die Zweite Platte im Verbund dann eventuell einfach nicht hoch?
Kackt das Volume ab, wenn die Kiste aus dem Hibernate kommen soll oder wenn sie ne zeitlang
normal lief?
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
FS ist btrfs

Warum das Volume abstürzt, ist leider nicht so ohne weiteres feststellbar auch der Zeitpunkt nicht wirklich. Nach einem Reboot läuft es anscheinend ohne Probleme, keine Fehler und alles soweit o.k. Man kann darauf zugreifen, Daten bearbeiten und speichern. Bei einer Datei (Datenbankfile für eine Client-Serveranwendung) crasht das Volume u.U. aber nicht nur deswegen. Heute morgen war das Volume auch wieder abgestürzt und heute Nacht war nur der Cloud-Sync im Gange (weiß aber nicht, ob der das verursacht hat).

Wen ich das Volume entferne und neu erstelle, sind ja die Daten alle weg oder kann es sein, dass nur das Volume neu erstellt wird, aber Daten noch da sind?
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Aber mal naiv .. wenn die Start Stop Zeiten alle identisch sind, bis auf die Spin Up und Power On
Zeiten, kommt die Zweite Platte im Verbund dann eventuell einfach nicht hoch?
Kackt das Volume ab, wenn die Kiste aus dem Hibernate kommen soll oder wenn sie ne zeitlang
normal lief?

So mal ein kurzer Zwischenstand: Der Hinweis auf die zweite Platte mit Startschwierigkeiten war möglicherweise entscheidend (man soll natürlich den Tag nicht vor dem Abend loben). Nach dem der Ruhezustand deaktiviert wurde, läuft das System nun stabil.

Wirklich beruhigen tut das nicht. Frage ist, ob man das so lassen kann, nur die zweite Platte tauscht oder alle beide.
 
  • Like
Reaktionen: peterhoffmann

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
6.057
Punkte für Reaktionen
1.855
Punkte
254
Frage ist, ob man das so lassen kann
Die Antwort ist davon abhängig wie wichtig die Daten sind und wie die Backupstrategie ausschaut. Das kannst du dir nur selber beantworten.

Die Platten sind noch recht frisch mit ihren 8000 Stunden, Fehler sind in den Smartwerten keine zu sehen. Dennoch würde mich ein solches Verhalten schon etwas nervös machen. Mindestens eine Platte hat wohl Probleme beim Neustart. Das kann so bleiben, beim Durchlaufen der HDDs egal sein, aber auch schlimmer werden und im laufenden Betrieb irgendwann Probleme machen.
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Guten Morgen, so ich nochmal mit dem vorerst letzten Stand:
1. Speichertest hat Fehler ergeben, wurde ausgeführt, weil auch checksum mismatch immer wieder bei verschiedenen Dateien im Protkoll angezeigt wurden.
2. Speicher ausgebaut (wegen genauer Bezeichnung)
3. Nach Wiedereinbau stürzt Volume nun kurz nach erfolgreichem Start ab. Vermutlich Folge des Ausbau
4. Speicher ist bestellt.

Die Datensicherung auf extern hat nicht, bzw. nur teilweise funktioniert, weil das Volume immer dann abstürzte, wenn eine Datei mit checksum mismatch aufgetreten ist.

Nun zur eigentlichen Frage: Kann man die zwei Festplatten aus der 916+ mit DSM 6.2.3-25426 in eine 416play mit dem gleichen Releasestand einbauen um die Daten zu retten? In der 416 sind derzeit 3 Festplatten mit Hybrid Raid und btrfs installiert. Und geht das dann auch rückwärts wieder gut?
 

blurrrr

Benutzer
Sehr erfahren
Mitglied seit
23. Jan 2012
Beiträge
6.204
Punkte für Reaktionen
1.104
Punkte
248
Wenn es Dir nur um die Daten geht und es ein Raid1 ist, solltest Du auch schon mit 1 HDD hinkommen (halt zusätzlich in die 416play eingebaut) und von dort aus die Daten sichern können. Das hat auch nix mit dem Release-Stand zu tun (Du bootest ja nicht davon), sondern grabbelst Dir nur die Daten dort runter - quasi wie bei einer externen HDD.
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Hallo blurrrr, danke für die Info. Ja es ist SHR mit 1 Platte Datenschutz. Kann ich die im laufenden Betrieb einfach einstecken?
 
Zuletzt bearbeitet von einem Moderator:

Wollfuchs

Benutzer
Sehr erfahren
Mitglied seit
06. Sep 2020
Beiträge
1.143
Punkte für Reaktionen
261
Punkte
159
wenn die DS916+ HotSwap kann .. dann ja. Sonst waere runterfahren vorher nicht die duemmste Idee.
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Habe jetzt die erste Festplatte in meine funktionierende DS416play eingebaut. Ging auch sofort auf Warnstatus, konnte aber den Inhalt der Festplatte in der Filestation sehen. Kopieren war aber nicht möglich, hat irgendwann die Inhalte nicht mehr angezeigt. Im Protokollcenter kam die Warnung I/O-Fehler und das LW hätte den Grenzwert fehlerhafter Sektoren überschritten. Alles sehr merkwürdig, weil in der DS916+ war davon keine Rede, alle FP im besten Zustand.

Frage: rein theoretisch müsste dann doch von der zweiten Platte (falls nicht defekt) das Sichern der Daten von Platte noch möglich sein, wenn ich die in mein 416 einhänge?
 

blurrrr

Benutzer
Sehr erfahren
Mitglied seit
23. Jan 2012
Beiträge
6.204
Punkte für Reaktionen
1.104
Punkte
248
Also wenn nicht beide Platten hin sind, solltest Du zumindestens von einer die Daten noch sichern können. Ich würde das alte NAS einfach komplett auslassen solange und wenn es mit der ersten HDD nicht funktioniert hat, halt mit der zweiten HDD versuchen. Wenn das auch schon alles nicht mehr funktioniert.... schwierig... :rolleyes:
 

timcor

Benutzer
Mitglied seit
16. Mrz 2017
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Also wenn nicht beide Platten hin sind, solltest Du zumindestens von einer die Daten noch sichern können. Ich würde das alte NAS einfach komplett auslassen solange und wenn es mit der ersten HDD nicht funktioniert hat, halt mit der zweiten HDD versuchen. Wenn das auch schon alles nicht mehr funktioniert.... schwierig... :rolleyes:
Habe einen Fehler gemacht. Ich wollte von der ersten Platte in meiner funktionierenden 416 die Daten auf ein an die 416 angehängtes USB-Laufwerk sichern. Das ging höllisch langsam und brach dann auch ab. Nachdem ich die Platte ein zweites Mal eingesetzt und dann via Windows-Client verbunden habe, hat es funktioniert. Konnte Gottseidank alle Daten retten. Jetzt kann ich das komplette Volume auf der 916+ platt machen, neu anlegen und zunächst auch mal beobachten, ob die Platten überhaupt noch gut sind. Und ob es der Speicherbaustein war, neuer ist im anrollen.

Danke an alle für die Unterstützung. werde ein finale Info posten
 
  • Like
Reaktionen: blurrrr


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat