Alle 4 Laufwerke kritisch - i/o-Fehler - warum, was nun?

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
133
Punkte für Reaktionen
2
Punkte
18
Hallo zusammen,

ich habe eine DS916+ mit 4 WD-Red 6TB Platten (und einer DX517 mit 5x 6TB Ironwolf).

Vorgestern hatten wir am späten Abend einen Stromausfall. Alles war aus, dann kam der Strom ganz kurz (1-2 Sekunden) wieder - und dann war er wieder für ein paar Minuten aus.
Die DS916+ ist danach wieder hochgefahren - aber es gab natürlich ein paar Meldungen im Protokoll.
Bei Volumen 1 (4 Laufwerke des DS916+) UND Volumen 2 (5 Laufwerke DX517) wurde automatisch die Datenträgerintegrität geprüft.

Die beiden Backups meiner wichtigen Daten (C2-Cloud und weitere DS außer Haus) wurden in der Nacht NICHT automatisch ausgeführt.

Gestern Vormittag habe ich mich dann von Außen in die DSM eingeloggt und habe die beiden Backups manuell gestartet - wurden auch problemlos durchgeführt.
Abends habe ich noch 3 Docker Container gestartet, die ich vergessen habe, auf automatischen Start zu setzten.

Die Datenintegrität von Volumen 1 (4 interne Platten) war lt. Speichermanager fast fertig - noch ca. 20 Minuten verbleibend.

Ich hatte mir vorsorglich per Express eine kompatible USV bestellt, die Abends noch geliefert wurde. Ich habe die DS916+ also heruntergefahren und die USV angeschlossen. Dazu musste ich sie aus dem Regal ziehen, was nach vorne kippen, um an den USB-Anschluss zu kommen. Die USV wurde problemlos erkannt und ich habe es so eingestellt, dass die DS916+ bei Stromausfall nach 30 Sekunden runterfahren soll.

Heute Morgen hatte ich plötzlich ca. 30 E-Mails von meiner DS mit i/o Fehlern aller 4 Laufwerke.
Alle 4 Laufwerke sind auf "Kritisch" gesetzt und auf Schreibgeschützt.
Im lokalen Netzwerk konnte ich mich einloggen - der S.M.A.R.T. Schnelltest für alle 4 Laufwerke war ok.
Habe dann beim googlen herausgefunden, dass ein "i/o Fehler" auch ein "schlechter Kontakt" sein könnte.
Ich wollte die DS dann runterfahren, alle Laufwerke ziehen und noch mal neu einstecken - vielleicht haben die sich durch das Kippen der DS zum Anschließen der USV ja gelockert...
Da habe ich aber die Meldung bekommen, dass die DS nicht heruntergefahren werden kann / sollte, da aufgrund der Laufvirusprobleme ein Datenverlust drohe.

Also habe ich das Herunterfahren abgebrochen.

Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.

Nun wollte ich von außerhalb wieder auf die DS zugreifen - geht aber nicht. VPN kann ich auch nicht herstellen.

Was nun?
Haben die Festplatten tatsächlich ein Problem?
Oder hat das Netzteil ggf. ein Problem und bekommt die Platten nicht 100% versorgt?
Oder ist ggf. die ganze DS916+ defekt?

Danke!
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.071
Punkte für Reaktionen
6.080
Punkte
569
SMART Werte Details alle HDDs posten, keinen SMART Test machen!
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
133
Punkte für Reaktionen
2
Punkte
18
Ok... leider komme ich aber momentan nicht auf die DS - ich hoffe, dass ich, wenn ich heute Abend zu Hause bin aus dem internen LAN noch drauf komme.
Mein Synology Account zeigt die DS zwar online - aber ich kann mich nicht verbinden.

Ich finde es nur komisch, dass alle 4 Festplatten gleichzeitig Probleme machen.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.071
Punkte für Reaktionen
6.080
Punkte
569
Abwarten, deine Aktionen waren halt auch nicht sehr "glücklich" ausgeführt.
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
133
Punkte für Reaktionen
2
Punkte
18
Ok.
Was hätte ich anders machen sollen?
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
133
Punkte für Reaktionen
2
Punkte
18
Hier wird doch Hot-Swapping unterstützt.... Wieso sollte ich die Platte nicht herausziehen?

Auch in der offiziellen Anleitung zum Tausch gegen eine größere Festplatte bzw. ersetzten einer defekten Festplatte beschreibt Synology, dass man die DS nicht herunterfahren muss.
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.593
Punkte für Reaktionen
910
Punkte
174
Laufen die Platten als RAID bzw, SHR?
 

Ulfhednir

Benutzer
Sehr erfahren
Mitglied seit
26. Aug 2013
Beiträge
3.503
Punkte für Reaktionen
1.093
Punkte
194

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.170
Punkte für Reaktionen
1.653
Punkte
308
Hier wird doch Hot-Swapping unterstützt.... Wieso sollte ich die Platte nicht herausziehen?
Nur weil die Hard- und Software das unterstützt, heißt das nicht, dass deine Aktion ("Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.") ohne Folgen bleibt.

Ja, die laufen im SHR.
Nach deiner Aktion müsstest du eigentlich laufen durch liefen ersetzen.
 
  • Haha
Reaktionen: mb01 und Jagnix

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.593
Punkte für Reaktionen
910
Punkte
174
Ja, die laufen im SHR.
Dann bin ich bei @synfor Sobald ich eine Platte aus einem SHR ziehe, ist es degradiert (und wird sich auch lautstark bemerkbar machen). Stecke ich eine Platte ein und stoße die Reparatur an, ist alles wieder paletti (nachdem die Reparatur durch ist). So wie Du es beschrieben hast, wurde keine Reparatur angestoßen, noch hatte die Zeit durchzulaufen. Ich weiß ehrlich gesagt nicht, was passiert, wenn ich eine Platte aus den Raid ziehe und sie dann wieder einstecke. Ich hoffe für Dich dass das SHR erkennt, dass es nichts tun muss, weil eh alles beim Alten geblieben ist.
Du wirst es ja bald sehen. Poste mal die SMART-Werte (wie von @ctrlaltdelete vorgeschlagen, vielleicht findet sich da etwas).
 

Crady

Benutzer
Mitglied seit
02. Aug 2014
Beiträge
133
Punkte für Reaktionen
2
Punkte
18
Wie gesagt - komme extern nicht auf die DS.
Muss warten, ob ich heute Abend im internen LAN auf die DS komme.
 

himitsu

Benutzer
Sehr erfahren
Mitglied seit
22. Okt 2018
Beiträge
2.904
Punkte für Reaktionen
337
Punkte
123
Ich habe dann im laufenden Betrieb die Platten jeweils einzeln herausgezogen, bis die LED der Platte ausgegangen ist - und dann wieder reingesteckt.
Ähhhh, ja.
Und danach auch jeweils die RAID-Reparatur wieder angestoßen?

Ohne. wird die Platte nicht wieder ins RAID auf genommen und ab der zweiten Platte war es das dann, da zuviele Platten im RAID fehlen.




Damit hast'e doch dein RAID wundervoll zerlegt.
Wenn aus, dann ließen sich alle Platten abziehen, aber wenn aktiv, dann wird im dem RAID vermerkt, dass jene Platten "futsch" sind und "normal" bekommst du sie dann nicht mehr ins RAID rein.

Bei nur einer Platte raus, kann man dann das Reparieren anstoßen, wobei die Daten auf der Platte quasi überschrieben werden, mit
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.593
Punkte für Reaktionen
910
Punkte
174
Sagte ich ja bereits. Nur ob das Ziehen und Stecken ein und derselben Platte ein RAID chrasht - mal sehen.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.071
Punkte für Reaktionen
6.080
Punkte
569
Genau das meinte ich, während der Reparatur des Raid eine Platte ziehen ist eine super Idee.
 
  • Haha
Reaktionen: RichardB

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.071
Punkte für Reaktionen
6.080
Punkte
569

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.593
Punkte für Reaktionen
910
Punkte
174
Leute wir können uns jetzt alle zerkugeln (ich nehme mich selbst als erster an der Nase). Wenn das RAID gecrasht ist, hilft sowieso nur zurückspielen des Backups.
Was bleibt, ist die Frage, wieso 4 Laufwerke gleichzeitig einen I/O-Fehler melden. Das wäre doch interessant zu klären.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.071
Punkte für Reaktionen
6.080
Punkte
569
Ich denke die IO-Fehler kommen vom ziehen der Platten.
 

RichardB

Benutzer
Sehr erfahren
Mitglied seit
11. Jun 2019
Beiträge
3.593
Punkte für Reaktionen
910
Punkte
174
Denke ich nicht. Lt. TE kamen die Meldungen, nachdem die USV eingebunden wurde (ich geh mal davon aus, dass die DS runtergefahren, umgesteckt und wieder hochgefahren wurde). Da war was von einem Kippen die Rede, nur davon lösen sich imho keine Festplatten, vor allem nicht alle 4. Der Grund für die Fehlermeldung bliebt für mich vorerst rätselhaft.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat