DS: I/O error occurred to hard disk N. Slot N defekt? Oder eher die Festplatten?

Status
Für weitere Antworten geschlossen.

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Hallo,
das Thema passt hier nicht ganz rein, hab aber kein passenderes (unter)Forum gefunden. Verschiebt bitte, wenn nötig.

Ich bekomme seit Wochen Mails von einer DS1813+, auf welcher ein RAID6 mit 8x4TB Platten läuft (24/7).

Die Mail hat folgenden Inhalt:
"The hard disk 3 on your Diskstation had an I/O error, but it is working properly now after several retries. It might have been caused by bad sectors. If this error occurs again, please back up your data and run the S.M.A.R.T. test on your hard drive to examine the hard drive status."

Da der freie Speicherplatz sowieso knapp wurde, wurden 8 neue 6TB Platten gekauft und im Rahmen dieses Stück-für-Stück-Umtausches der Platten
wurde auch schon 3 mal eine neue 6TB Platte im Slot 3 ausgetauscht.
Die neu gekauften Platten sind keine Serverplatten, dennoch aber von Synology in der Kompatibilitätsliste aufgeführte: WD60EZRX - 00MVLB1 mit einem einfach einzuhaltenden Kommentar: "After installing a new drive, it is recommended to power off and then power on your NAS to enable power management settings." (Hab ich aber nicht gemacht, da ich mich nicht getraut habe, während des Reparaturprozesses, das NAS runterzufahren)

Die erste ausgetauschte wurde mir nach anderthalb Tagen schon als vermutlich defekt gemeldet auf der Datenträger-Informationsseite. (Entsprechende Mail wie oben erwähnt kam auch).

Die zweite fiel schon nach viel kürzerer Zeit aus, mit dem Vermerk "Abgestürzt" auf der Datenträger-Informationsseite. (Mail kam).

Die dritte wird nun auch angemeckert. (Mail kam).

Dies alles geschah/geschieht im Reparaturmodus des Raids, was es ein wenig unheimlich macht, da ich jedes Mal Angst um meine Daten bekomme. Es dürfen zwar zwei Platten gleichzeitig ausfallen, aber das muss ja nicht sein...und wenn eine neue reinkommt und eine andere gerade wieder ausfällt, werd ich nervös... auch, weil eine neue Platte knapp 3 Tage braucht, bis sie vollständig im Raidverbund integriert ist.

Da ich hie und da gelesen habe, das die neuen 8TB Platten noch für sehr viele Ausfälle sorgen, hab ich mir 6TB Platten besorgt, da diese in den Kommentaren der User nicht so arge Probleme bereiteten.

Auch gehe ich -da es sich immer um dem Slot Nummer 3 handelt- nicht davon aus, das die beiden Festplatten wirklich defekt oder verantwortlich für die Probleme sind, die ich mit der DS nun habe.

Aber hier fehlen mir noch Erfahrungswerte, die ich gerne hier von Euch lesen würde ;-)
Kann es sein, das der Slot 3 ne Macke hat? Gibt es hier Beobachtungen oder Erfahrungen ähnlich wie meine gerade geschilderten? Abhilfe? Ideen? Rat? Gekauft wurde das NAS im Jahr 2013. Etwas "Garantie" hätte ich noch, theoretisch.


Anbei noch ein paar Screenshots:

Die Meldung, die auch per Mail kommt, wenn eine Platte Mukken macht:
abgestürzt_i.png


Smartstatus der alten 4TB Platte, die seit knapp 2 Jahren gelaufen ist:
smart.jpg
(Einen Smart Test der neuen Platten habe ich nicht gemacht.)

Der Ausfall der zweiten ausgetauschten 6TB Platte wird mit "Abgestürzt" kommentiert:
abgestürzt.jpg

Entsprechende Probleme beim schreiben auf das NAS und Angst um die Datenkonsitenz:
fserror.png
neuzuordnungreboot.jpg
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.686
Punkte für Reaktionen
2.086
Punkte
829
Könntest Du bitte einmal einen Screenshot aller SMART-Werte der Platte posten, um die es geht. Die Werte bekommst Du unter Start / Speicher-Manager / HDD/SSD / Button "Integritätsstatus" / 2. Reiter "S.M.A.R.T.-Informationen". Bitte das Fenster so groß ziehen, dass alle Werte zu sehen sind.
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Die beiden anderen Platten sind im Moment ausgebaut und es scheint, als gibt es keine Möglichkeit den SMART-Status einer extern über USB-HUB angeschlossen Platte anzuzeigen...

Ergo hier nur die Info der Platte, die momentan im Slot#3 eingebaut ist:
(für diese Platte kamen gestern 2 und vorgestern 1 Mail derart: "DS: I/O error occurred to hard disk 3")

smart#3.jpg

Ich wollte jetzt noch die Ergebnisse nach einem schnellen SMART-Test hinterherschieben, da die Platten bis dato noch keinen automatischen Test durchlaufen haben, allerdings steht der Test, der angeblich nur etwa 2 Minuten dauern soll, jetzt schon seit 15 Minuten auf 90%.... und ich muss nun leider in die Heia :)

Danke jedenfalls für die Nachfrage!

Ich habe auch Synology selbst mal angeschrieben, aber es ist/war zu erwarten, dass die mindestens eine Woche brauchen um vielleicht unter umständen eventuell reagieren. Also warte ich da noch bis nach dem Wochenende.
synoanswer.jpg
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.686
Punkte für Reaktionen
2.086
Punkte
829
Die Daten liefern keinen Anhaltspunkt für die Fehlermeldung. Allerdings fällt auf, dass der LCC recht hoch ist, aber das ist ein anderes Thema und hat keine Eile. Interessant wären die SMART-Werte der anderen Platten.
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Hi,
die anderen Platten werde ich wohl erstmal nicht mehr ins RAID einbauen können. Wohl aber versuche ich, die SMART-Werte über ein Windows Programm auszulesen, so ich denn ein geeignetes gefunden habe, und stelle diese dann hier zur Verfügung.

Ich vermute allerdings, dass diese ähnliche Werte aufweisen, denn sie kommen ja aus derselben Charge und sind ebenfalls ungebraucht+neuverpackt hier angekommen.

Darf ich derweil Fragen, welche Werte Du anvisierst, aus denen Du etwas erlesen könntest?

Dein Hinweis auf LCC war ein interessanter und hat mich auf neues Territorium gestoßen. Hier ein interessanter Link zum Thema LCC: WD Green Besitzer, wie hoch ist euer "Load Cycle Count"?
 
Zuletzt bearbeitet:

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.686
Punkte für Reaktionen
2.086
Punkte
829
Crystal Disk Info kann ich Dir empfehlen.

Ich schaue primär auf ID 1, 5, 7, 196, 197, 198 und 200. Probleme mit 10 und 11 sind mir noch nicht untergekommen. 199 hat mit den Übertragungswegen zu tun (Steckverbinder z.B.), legt aber keine Degeneriung der internen Plattenhardware nahe.
 

Frogman

Benutzer
Mitglied seit
01. Sep 2012
Beiträge
17.485
Punkte für Reaktionen
8
Punkte
414
Fehler bei ID11 sind typisch bei zu hohen Plattentemperaturen. Oder ganz am Ende des Lebenszyklus, wenn die Mechanik des Kopfes den Geist aufgibt.
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Aha, danke euch beiden! Ich werde mal recherchieren, was diese Zahlen zu bedeuten haben :)

Anbei auch noch 2 SMART-Screenshots. (Man kann ja auch die Platten ein-/ausbauen, um den S.M.A.R.T. Status abzufragen, *ohne* das Raid reparieren zu lassen...ist mir in der Hektik gar nicht eingefallen, sorry)

Der erste von der Platte, die zuerst mukiert wurde, die andere hat fast identische Werte, entsprechend spare ich mir den Screenshot.
smart#3.jpg

Der zweite von einer Platte, die seit ca. 2 Jahren dort Läuft. Dort werden viel mehr Werte angezeigt.
smart#2jahre.jpg

Evtl. könnt Ihr mir ja dazu Eure Gedanken schreiben, während ich im Netz nachschaue, wie das alles zusammenspielt...
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Nachtrag: Es scheint wohl sinnig, die SMART-Werte *VOR* und *nach* dem Regenerieren eines Raids auszulesen und zu vergleichen. Also beim Einbau und einige Tage später nocheinmal.

Die Platte, die ich jetzt in Slot #3 gebaut habe, werde ich mir in 3 Tagen nocheinmal angucken, nachdem das Raid -hoffentlich- aus dem degraded Modus herausgekommen ist.
Im Moment sieht ja alles sehr unauffällig aus.
neue_platte#3.jpg
 

Frogman

Benutzer
Mitglied seit
01. Sep 2012
Beiträge
17.485
Punkte für Reaktionen
8
Punkte
414
Yep, jungfräulich und unauffällig.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.686
Punkte für Reaktionen
2.086
Punkte
829
Die SMART-Werte von Datenträger 3 aus Beitrag #8 zeigt Werte über 0 sowohl bei der Raw_Read_Error_Rate als auch bei Current_Pending_Sector.
 

Frogman

Benutzer
Mitglied seit
01. Sep 2012
Beiträge
17.485
Punkte für Reaktionen
8
Punkte
414
Der zweite von einer Platte, die seit ca. 2 Jahren dort Läuft. Dort werden viel mehr Werte angezeigt.
..
Datenträger 8 ist eine Seagate-Platte - die verwenden andere Maßstäbe bzw. Interpretationen. Die hohen Zahlen bspw. bei Raw-Read-Error und Seek-Error müssen Dich dort nicht beunruhigen, im Gegensatz zu den Werten von Datenträger 3.
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Guten Abend,
völlig unspektakulär, nach der erfolgreichen Integration dieser Platte ins Raid, nun dieser Screenshot. Zu dem obigen Bild, aus meinen letzten Post, hat sich -jott sei jedankt- nix getan.
#3nach_integration.jpg

Wie das mit Fehlern aber ist, die kommen immer dann, wenn man es nicht braucht und/oder erwartet.

Bis dato wurde ich verschont, von Mail, die mir einen defektiven Zustand des Raids (oder der HW) andeuteten.

Nichts desto Trotz kamen vorher aber diverse Mails, aber ist ein Problem vorhanden. Es lässt sich nur im Moment noch Zeit sich wieder zu zeigen.

Meine ursprüngliche Intention, herauszufinden, ob es sich um einen Defekt des Slots #3 handeln könnte, wurde nicht erfüllt. Ich habe zwar mehr gelernt über die SMART Werte und auch so bin ich -wie immer- schlauer als zuvor (Danke Euch an dieser Stelle), aber das Problem ist nicht aus der Welt und ich weiss noch nicht, was ich davon halten soll...

Es geht also weiter... hab ja noch 2 Schächte zu tauschen... jetzt mit Platten, die vorher als fehlerhaft angezeigt wurden. Da bin ich mal gespannt.
 

rumknapser

Benutzer
Mitglied seit
02. Mai 2013
Beiträge
329
Punkte für Reaktionen
6
Punkte
24
Schönen Sonntach,

also nun sind alle Platten ausgetauscht und die Platten, die nicht zurückgeschickt wurden, scheinen auch "normal", d.h. keine auffälligen SMART-Werte zu haben.
Was auch dem eventuell defekten SLOT#3 in der DS geworden ist, weiss ich nicht, denn er hat sich bis dato nicht mehr gemeldet.
Ich habe 3x intensive SMART-Tests laufen lassen, es scheint sich beruhigt zu haben.

Das einzige, was bleibt (oder durch die defekten Platten gekommen ist), sind die Dateisystemfehler, die mich davon abhalten, die RAID-Kapazität voll auszunutzen.
Dafür mache ich aber einen gesonderten Thread auf. Habe hier schon einige Tipps gelesen darüber, aber keine Lösung gefunden.

Synology hat sich erwartungsgemäß auch nicht auf meine detaillierten Anfragen gemeldet, bzgl. des defekten SLOTS, ergo schicke ich die Kiste wieder zurück an den Auslieferer.

Vielen Dank an Euch für die Unterstützung!
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat