SMART - LoadCycleCount Werte besser

Status
Für weitere Antworten geschlossen.

Drain

Benutzer
Mitglied seit
08. Nov 2009
Beiträge
144
Punkte für Reaktionen
0
Punkte
0
Hallo zusammen,

habe eine WD20EARS verbaut und mir anfänglich Gedanken wegen der hohen LCC-Werte gemacht. Da dies offenbar aber bei niemandem Probleme bereitet hat, habe ich auch nichts unternommen und einfach mal nur beobachtet und mir die Werte von Zeit zu Zeit notiert. Dabei ist mir aufgefallen, daß die LCC-Werte seit einiger Zeit nicht mehr so stark ansteigen.

Die letzte Spalte zeigt den durchschnittlichen LCC-Anstieg pro Tag zur letzten Ablesung an. Interessant, oder?

SMART-Werte.png

Hat das vielleicht mit einem Update des DSM zu tun? Kann man irgendwo sehen, wann das letzte mal upgedatet wurde? Kann mich nicht mehr genau daran erinnern, wann ich das durchgeführt hab. Die Einschaltzeiten der Diskstation haben sich nicht geändert.

Wollte diese Info mal an alle weitergeben, die sich Gedanken um Ihre LCC-Werte machen.

Grüße Drain
 

bohne

Benutzer
Mitglied seit
05. Jan 2011
Beiträge
1.709
Punkte für Reaktionen
4
Punkte
58
Hallo Drain,

soweit ich weiß wurde das explizit für die WD-Platten bei einem Update des DSM behoben. An die Version kann ich mich aber nicht erinnern.
 

scythe42

Benutzer
Mitglied seit
16. Sep 2011
Beiträge
90
Punkte für Reaktionen
0
Punkte
0
LLC kann dir mal mehr oder weniger egal sein. Der Load/Unload Cycle Count hat keine Aussage drüber, ob deine Platte langsam einen Abgang macht.

Der Wert gibt an wie oft die HDD in der Landing Zone Position gelandet ist. Notebooks parken ihre Köpf gerne alle 5-10 Sekunden, wenn keine Aktivität vorhanden ist. Einfach mit dem Zweck des Stromsparens. Linux ist hier je nach Kernel, Filesystem und Hardware ähnlich "unverschämt" und da kann oft mehrfach im Hintergrund für eine Zeitlang mehrfach die Minute auf die Platte zugegriffen werden. Ist aber auch nicht der Normalfall. Meistens ist einfach was schlecht konfiguriert, wenn es kein Notebook ist. Meist 'ne reine Chipsatz Treiber Geschichte bzw. Bug im Kernel für bestimmte Hersteller, bei denen in der Distri ein Patch wg. Known Issues vergessen wurde.

Mach dir erst Sogen, wenn der LLC Wert dauerhaft über 100 pro Stunde erreicht. Damit wären die Betriebswerte locker in einem Jahr überschritten. Bei deinen 100 pro Tag, kann deine Platte noch weit mehr als 10 Jahre so weiter machen. Mach dich also nicht selbst nervös.

Und die Betriebswerte sind absolut nach "Cover Your Ass" angegeben, damit mal sich rechtlich gegen Klagen abgesichert hat.

Unabhängig davon fallen Platten meist mechanisch recht zügig in einer kurzen Zeitspanne aus und die SMART Werte dienen dann nur noch einer Post-Mortem Analyse...

Was für weit verbreitete Hersteller Werte sind denn wirklich interessant?

001 Read Error Rate
Selbsterklärend, was das ist. Aber der Wert und dessen Interpretation ist oft abhängig vom Hersteller. Manche machen das alle 100 Lesefehler, manche bei jedem und andere wiederum gar nicht. Einige auch nur wenn so und so viele Lesefehler innerhalb eines bestimmten Zeitraumes aufgetreten sind. Hier heisst es Googeln, wie der Wert für deine HDD interpretiert werden muss.

005 Reallocated Sectors Count
Die Mutter allen Uebels. Wenn die HDD Probleme beim Lesen/Schreiben mit einem Sektor hat, dann werden die Daten in einem der vorhandenen Reservesektoren verschoben. Geht auf die Performance, da die HDD immer wieder die Köpfe in den reservierten Bereich schicken muss. Gehen die Werte schnell dauerhaft hoch, dann wird die Platte nicht mehr lange leben. Bei neuen Platten kann es passieren, dass am Anfang der Wert sehr schnell ansteigt, dann aber stabil bleibt. Darf bei 24/7 bzw. Server Platten nicht am Anfang auftreten, da diese eine Burn-In Phase in der Qualitätssicherung hinter sich haben, die über das das normale hinausgeht.

010 Spin Retry Count
Deutet auf mechanische Probleme hin und zählt wie oft versucht werden musste die Platte auf volle Geschwindigkeit zu bringen (ab dem zweiten Versuch wird gezählt). Steigt der Wert schnell über einen kurzen Zeitraum an, dann geht es zu Ende mit der Platte. Das kann sich aber auch nur um wenige Minuten handeln, wenn der Motor im Eimer ist.

188 Command Time Out
Und jetzt der "Vater" allen Uebels. Gibt die Anzahl der abgebrochenen Befehle auf Grund eines HDD Timeouts an. Der Wert hier sollte eigentlich immer 0 sein. Ist er höher kann oft ein Problem mit der Verkabelung, Controller Hardware/Chipsatz oder Treiber auf Softwareseite geben. In dem Falle steigt der Wert weiter an bis das Problem gelöst ist. Sollte der Wert immer mal wieder ansteigen, dann sollte man die Platte beobachten. Wird meistens nur für 24/7 bzw. Server Platten von der Firmware unterstützt, da RAID Controller das gerne nutzen. Ist ein sehr schöner Indikator für den Gesundheitszustand einer Platte, da er mehr oder wenige alle Probleme zählt wenn irgendetwas zu lange als normal gedauert hat, egal warum.

196 Reallocation Count
Wie oft Remap Operationen (siehe Reallocated Sectors Count) versucht wurden. Es werden auch fehlgeschlagene Versuche gezählt

198 Uncorrectable Sector Count
Wie oft Daten in einem Sektor nicht gelesen/geschrieben werden konnten. Hängt natürlich wieder mit Reallocation Count und Reallocated Sectors Count zusammen

Sollten andere Werte plötzlich stark ansteigen, dann mal im Netz die genaue Bedeutung nachgucken.

Schauen wir uns doch mal aus Spass die beiden WD20EARX in einer recht neuen DS211+ eines Bekannten an:

Rich (BBCode):
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   179   158   021    Pre-fail  Always       -       8050
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       18
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       1827
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       16
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       12
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       416
194 Temperature_Celsius     0x0022   116   113   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   179   158   021    Pre-fail  Always       -       8050
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       18
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       1827
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       16
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       12
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       416
194 Temperature_Celsius     0x0022   116   113   000    Old_age   Always       -       36
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

Sieht doch gut aus oder? Oder irgendwelche Einwände? Jedenfalls besser als die WD20EARX die mit meiner DS kamen...

PS: Jemand interesse an den SMART Werten meiner 22 WD2002FYPS? Ne, keine Lust die über die dumme Adaptec Software zu holen...
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Da dies offenbar aber bei niemandem Probleme bereitet hat ...

Doch schon ... darüber gibt es viele Diskussionen hier im Forum ... sind allerdings meist schon 1-2 Jahre älter.

Itari
 

Drain

Benutzer
Mitglied seit
08. Nov 2009
Beiträge
144
Punkte für Reaktionen
0
Punkte
0
Doch schon ... darüber gibt es viele Diskussionen hier im Forum ... sind allerdings meist schon 1-2 Jahre älter.

Itari
Da haben sich doch eher viele beschwert und Angstgefühle bekommen, aber keiner hatte tatsächlich deswegen einen FP-Ausfall, oder?
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Richtig, bislang gibt es keine Beiträge darüber, ob eine Platte wegen eines zu hohen LCC ausgefallen ist. Ich persönlich würde sagen, Platten sind - wie Toner - Verbrauchsmaterial. Wenn du eine gute Backup-Strategie realisierst, ist auch der Ausfall einer Platte durch zu hohen LCC kaum beeinträchtigend.

Itari
 

itari

Benutzer
Mitglied seit
15. Mai 2008
Beiträge
21.900
Punkte für Reaktionen
14
Punkte
0
Dazu ein sehr interessanter Link

da wird nocheinmal recht anschaulich erklärt, warum, wieso und wie man sich behelfen kann (wdidle3 ... hdparm ...) - der Lösungsansatz, Linux dazu zu überreden, weniger zu protokollieren, hab ich im Zusammenhang mit einer DiskStation noch nicht als erfolgsversprechend gelesen, deswegen würden mich da erst praktische Erfolgsmeldungen überzeugen können, sofern es jemand ausprobiert hat.

Itari
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat