SMART-Test hängt seit 24h bei 90%, Interpretation SMART-Attribute

Status
Für weitere Antworten geschlossen.

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

das Problem, dass der SMART-Test bei 90% hängt, scheint ja kein Unbekanntes zu sein. Jetzt hat es eine meiner beiden WD RED 3 TB Platten auch erwischt. Die DS213J meldet, dass der Datenträger schwer fehlerhaft sei und ausgetauscht werden soll. Mache ich. Jedoch würde mich interessieren, an welchen Parametern die DS213J das festmacht, da m.E. beide eingebauten Platten relativ ähnliche Werte haben.
Schwer fehlerhaft:
2017-05-30 HD1.JPG

Normal:
2017-05-30 HD2.JPG

Ich habe leider auch keine genau Beschreibung über den Zusammenhang zwischen Wert - Schlechtester Wert - Schwellwert und Rohdaten gefunden. Wenn ich die beiden Screenshots vergleiche, wären (würde ich als Laie sagen) die IDs 1 und 200 ausschlaggebend für die Meldung der NAS. Soweit so gut. Wie muss ich bei Screenshot 2 die Werte der ID 1 interpretieren?
Wert: 200
Schlechtester Wert: 200
Schwellwert 51
Rohdaten: 0

Laut Wiki würde ich das so lesen: Die aktuelle Lesefehlerrate liegt bei 200, der schlechtest jemals gelesene Wert bei 200, ab einen Schwellwert von 51 wird es problematisch. Bei der Fehlerrate also müsste ich unter 51 bleiben?

Dann: Rohdaten 0, Status OK.

Im Screenshot 1 beträgt der Wert der Rohdaten 48. Was mich irritiert ist, dass *beide* Werte, also 0 und 48 unter dem Schwellwert von 51, demnach müsste doch alle i.O. sein?

Was lese ich hier falsch heraus bzw. wie müssen die Werte korrekt interpretiert werden?

Oder gibt die NAS den Fehler nur wegen der Multi-Zone-Error-Rate, ID200 aus, derren Wert zwingend auf 0 sein muss? Aber da wird ja auch der Status "OK" ausgegeben..

Beste Grüße
Steffen
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Interessant sind immer nur die Rohdaten. Hier hat Platte 1 mindestens einmal Fehler bei den von dir angesprochenen IDs, die wiederum auch der Grund für den langsamen bzw. unvollständigen SMART Check sind.
Wenn die Rohdaten weiter ansteigen, wird es kritisch und die Platte sollte getauscht werden.
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Hallo Puppetmaster,

vielen Dank für die schnelle Antwort!

Sind denn die Werte der Raw-Read-Error-Rate und Multi-Error-Rate so schlecht? Habe nirgends Referenz-Werte gefunden, welchen Rate max. bei den WD-Platten auftreten darf. Dachte, der Schwellwert wäre die maximal tolerierbare Rate.

Die Werte werden ja alle mit Status "OK" ausgegeben. Wieso gibt die DS2013J eine Warnung "Schwer fehlerhaft" aus. Woran macht die Diskstation das fest? Laut SMART ist die Platte doch ok, oder?

Beste Grüße
Steffen
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.828
Punkte für Reaktionen
2.258
Punkte
829
Das ist eine Frage der Interpretation. Die Plattenhersteller definieren ihre Schwellwerte so, dass möglichst wenige Leute aufgrund eines Status, der nicht mehr "Ok" ist, einen Garantiefall aufmachen. Synology wiederum warnt, wenn Fehlerwerte auftauchen. Beides ist kein sicheres Indiz - Platten können dann noch funktionieren, wenn der SMART-Status nicht mehr "Ok" ist, sie sterben aber auch schon, wenn alle Rohdaten-Werte unkritisch sind. Dennoch halte ich den Ansatz von Synology für den richtigen, weil Fehlerwerte bei ID 1, 200 usw. auf Probleme hindeuten und damit auf eine höhere Ausfallwahrscheinlichkeit.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Die Bewertung der einzelnen SMART Werte ist, wie oft, eine reine Interpretation. Entscheidend ist auch, ob sich die Werte in naher Zukunft noch verändern/erhöhen. Sie sollten in jedem Fall beobachtet werden, um einem plötzlichen Ausfall zu entgehen.
Als Beispiel: meine zwei Dauerläufer in der 214+ laufen seit drei Jahren und haben Rohwerte von 0.
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Die beiden Platten laufen auch seit ca. 2,5Jahren dauerhaft in der NAS. Wenn ich mich recht entsinne, hat sich der Raw-Read-Error-Rate in letzter Zeit nicht verändert. Bin mir aber nicht 100% sicher - schaue jetzt erst drauf, da die Distkstation sich gemeldet hat. Der Wert ist auch inkrementell, wenn ich das recht verstanden habe, also pro Fehler wird er vergrößert und gibt keinen irgendwie gearteten Durchschnittswert an.
Im WD-Forum wurde in den Beiträgen ein paar Mal drauf hingewiesen, dass wohl auch wichtig ist, dass die ID5, reallocated sector count, wichtig ist, wenn die Platte defekte Sektoren erkannt hat, diese als defekt markiert hat und neue aus einer Plattenreserve holt. Ist ja hier auch nicht der Fall.

@dill88 Ja, denke auch, dass es besser ist früher zu warnen denn zu spät. Werde die HD austauschen und ersetzen.

Dachte aber, dass man anhand der SMART-Werte sicher sagen kann ob und vielleicht sogar was an einer Platte defekt ist. Letztendlich kaufe ich, aus Sicherheitsgründen, eine neue Platte für das RAID1, ohne zu wissen ob die Platte wirklich defekt ist oder die Werte sich im zu erwartenden Rahmen bewegen, was Lese-Schreibfehler angeht. Und natürlich können die Platten auch ohne jegliche Fehlermeldung im SMART ausfallen, deswegen macht man ja Spiegelung usw.
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.828
Punkte für Reaktionen
2.258
Punkte
829
Na ja, defekt ist sie derzeit nicht, Du kannst ja noch damit arbeiten. Die SMART-Werte deuten meiner Einschätzung nach nur darauf hin, dass die Wahrscheinlichkeit eines Defekts gestiegen ist. ID 200 wird von einigen Leuten im Forum, die offensichtlich tiefer in der Materie stecken, als kritisch betrachtet. Insofern sollte man m.E. nicht nur auf ID 5 schauen.
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
So, da ich jetzt auf einer anderen Seite noch gelesen habe, dass die Rohwerte herstellerspezifisch sind und alles Mögliche bedeuten können, habe ich jetzt WesternDigital direkt angeschrieben, dass sie ein Statement zum Health-Status der Festplatte abgeben. Das SMART bringt ja nichts, wenn jeder Hersteller die Werte der Rohdaten selbst interpretiert, aber nicht angibt wie. Habe auch keine Tabelle oder Ähnliches gefunden, bei der die Werte erläutert werden. Mal sehen, vielleicht kommt ja was Belastbares bei raus.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Habe auch keine Tabelle oder Ähnliches gefunden, bei der die Werte erläutert werden.

Nicht? Das Netz ist doch voll davon... Beispiel

Und was soll WD jetzt genau dazu sagen ausser ihrer eigenen Interpretation? Fakt ist, wenn die Rohwerte >0 sind, dann gibt es mindestens einmal Schäden an der Platte. Wie die im Einzelfall zu bewerten sind, kann man auch nur im Einzelfall erörtern. Wichtig ist eben die Veränderung der Werte.
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Zitat aus dem Link: "Vendor specific raw value.) Stores data related to the rate of hardware read errors that occurred when reading data from a disk surface. The raw value has different structure for different vendors and is often not meaningful as a decimal number."

Different structure for different vendors. Vendor specific...

Das meine ich ja gerade. Seagate oder andere haben Werte von ID1, welche sehr hoch sein können. Diese sind dann nomal. Ich möchte von WD wissen, welche Grenzen für ihre Platten normal sind, so dass ich einordnen kann, ob die Platte nun noch ok ist als Spiegel und die Wahrscheinlichkeit eines Ausfalls meinetwegen um 20% gestiegen ist oder aber das mit dem ID1=48 die Platte sofort ohne Wenn und Aber in den Schrott gehört. Muss ja dann auch schauen, was ich mit der Platte nach dem Ausbau mache..

Wenn ich keine Tolerenzen habe, dann könnten man ja gleich sagen, alle Werte>0 (mal abgesehen von Zeiten und Temperatur) bedeuten, dass die Platte ein Fall für den Schrott ist.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Du kannst ja auf die Antwort warten.

WD ist da ziemlich linear bei diesem Wert. Intakte Platten haben einen Wert = 0, wie bei mir seit Jahren. Gibt es Fehler, erhöht sich dieser Wert zukzessive.

Kritischer ist aber eh der Wert aus ID 200 zu interpretieren. Und dieser ist nicht "vendor specific".
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.828
Punkte für Reaktionen
2.258
Punkte
829
Sehe das wie Puppetmaster. WD (wie die anderen Hersteller) hat die Frage im Grunde schon beantwortet mit Werten, ab denen der SMART-Status nicht mehr "Ok" ist. Auf diese Interpretation würde ich mich überhaupt nicht verlassen.
 
Zuletzt bearbeitet:

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Mal schauen, was WD dazu sagt.

Ach ja, habe gerade nochmals nach ID200 gesucht: https://kb.acronis.com/content/9136 Dort sagen sie wieder, der Wert ist nicht so dramatisch. Warum auch immer. Nur ein regelmässiges Backup wird empfohlen. Scheint so, dass der Parameter wohl auf einen Schaden (wie Du schon sagtest) hindeutet, aber jetzt nicht gleich ausgetauscht werden müsste (meine Interpretation). Zumindest nicht hektisch.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Ja, ist halt eine individuelle Entscheidung und wie wichtig es ist, dass deine DS läuft. Backup deiner Daten wirst du ja sicher haben.
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
Natürlich, Backup ist da und läuft. Sonst würde ich nicht hier so entspannt sitzen und über die Attribute reden. Ist halt ein Thema, mit dem man sich erst genauer beschäftigt, wenn irgendwo ein rotes Ausrufezeichen auftaucht und man verstehen will, was da gerade passiert ist - und wie's am besten zu lösen ist.
 

Timmm

Benutzer
Mitglied seit
12. Feb 2011
Beiträge
120
Punkte für Reaktionen
2
Punkte
18
Ich habe auch gerade das Problem, dass sich der ausführliche S.M.A.R.T. Test bei 90% aufhängt. Ich habe hier im Forum gelesen, dass man eine Datenbereinigung durchführen kann. Aber unter aktueller DSM Version scheint es diese Option nicht mehr zu geben. Weiß jemand Rat, wie man den Test zum Abschluss bringt?

Gruß Timmm
 

SteffenJ

Benutzer
Mitglied seit
31. Mai 2017
Beiträge
18
Punkte für Reaktionen
0
Punkte
1
So, habe jetzt mit WD zweimal Kontakt gehabt, leider ohne Erfolg. Es wurde nur auf das Standard-Tool verwiesen.

Aktueller Satus: Habe eine neue HD in die NAS eingebaut, sicher ist sicher. Die von der Diskstation als defekt monierte, baute ich in meinem PC ein und formatierte sie unter Win7 neu. Vor der Formatierung gab der Data Lifeguard aus, dass zuviele schlechte Sektoren vorhanden sind, nach der Formatierung ist alles in Ordnung, keine Fehler, alle SMART-Tests bestanden. Leider weiss ich jetzt immer noch nicht, ob ich die HD jetzt sicher benutzen kann. Diese Info hätte ich mir eigentlch von WD erwartet. Zumal die Formatierung ja irgendetwas geändert haben muss.
 

CAPMAGIC

Benutzer
Mitglied seit
25. Sep 2012
Beiträge
18
Punkte für Reaktionen
0
Punkte
0
Hi,

kann mir jemand von euch sagen, ob ich bei den SMART Werten meiner Platte einen Tausch in Erwägung ziehen sollte oder sie erst mal weiter beobachten sollte, ob die Werte sich weiter verschlechtern?

170904 Datenträger 4 SMART Werte - schwer fehlerhaft.JPG

Danke.
Viele Grüße
Capmagic
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.828
Punkte für Reaktionen
2.258
Punkte
829
Du kannst sie m.E. beobachten, wenn Du Dich um mindestens ein Backup kümmerst.
 

arghmage

Benutzer
Mitglied seit
04. Apr 2016
Beiträge
265
Punkte für Reaktionen
0
Punkte
16
Etwas älterer Thread ... aber egal.

Bei mir hängt eine WD Red auch seit über 24h beim Smart-Test bei 90%
Der einzig auffällige Wert ist Multi-Zone Error Rate (steht bei 5), also kann der Hänger beim Smart-Test eigentlich nur daran liegen.
Habe die Platte mal am PC mit dem WD-Tool gecheckt, da bricht schon der Kurztest mit Fehler ab.
Zum Glück habe ich noch 2 Monate Garantie, also lasse ich die Platte tauschen.
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat