Smart damage oder doch nur Fehler 40?

Thorfinn

Benutzer
Sehr erfahren
Mitglied seit
24. Mai 2019
Beiträge
1.744
Punkte für Reaktionen
417
Punkte
103
Ich glaub ich bin zu blind/blöd/begriffsstutzig und bauche ein wenig Hilfe.
Sitzt der Fehler doch nur 40 cm vor dem Bildschirm oder gibt es ernstzunehmende Probleme?

Ich bekomme:
There is one log of severity err on <name of Diskstation>. Go to Log Center to check the details.
The content of the log is as follows:
smart_damage

Platte A und B sind im SHR Verbund, Platte 3 (WDC WD60EFAX-68SHWN0) läuft für sich alleine.
Smarttools meldet für die 3 Platten:


=== START OF INFORMATION SECTION ===
Model Family: Western Digital Red (CMR)
Device Model: WDC WD60EFPX-68C5ZN0
Serial Number: WD-WX32D93DRAYU
LU WWN Device Id: 5 0014ee 2c0ae8461
Firmware Version: 81.00A81
User Capacity: 6,001,175,126,016 bytes [6.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sun Jul 28 14:00:02 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 225 225 021 Pre-fail Always - 3733
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 11
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 2682
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 10
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 1
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 9
194 Temperature_Celsius 0x0022 115 111 000 Old_age Always - 35
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0





=== START OF INFORMATION SECTION ===
Model Family: Western Digital Red (CMR)
Device Model: WDC WD60EFPX-68C5ZN0
Serial Number: WD-WX12D932T5DN
LU WWN Device Id: 5 0014ee 215fd6538
Firmware Version: 81.00A81
User Capacity: 6,001,175,126,016 bytes [6.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sun Jul 28 14:01:01 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 225 225 021 Pre-fail Always - 3716
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 11
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 2682
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 10
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 1
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 9
194 Temperature_Celsius 0x0022 114 111 000 Old_age Always - 36
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0





=== START OF INFORMATION SECTION ===
Model Family: Western Digital Red (SMR)
Device Model: WDC WD60EFAX-68SHWN0
Serial Number: WD-WX21D19A8CTD
LU WWN Device Id: 5 0014ee 210f23710
Firmware Version: 82.00A82
User Capacity: 6,001,175,126,016 bytes [6.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sun Jul 28 14:02:01 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 230 229 021 Pre-fail Always - 3491
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 190
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 042 042 000 Old_age Always - 43057
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 189
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 122
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 73
194 Temperature_Celsius 0x0022 114 108 000 Old_age Always - 36
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
Habe diese Fehlermeldung noch nicht gehört/gesehen.
Die SMART Werte sind ok.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.767
Punkte für Reaktionen
3.740
Punkte
468
Ich würde die 3. Platte auf Verdacht tauschen. Die um einiges älter und eh eine SMR.

"smart_damage" hat wohl damit zu tun, dass ein Smart-Test fehlgeschlagen ist. Vielleicht lässt sich ja über den Zeitpunkt der Meldung die Platte zuordnen.
 

Benie

Benutzer
Contributor
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
8.473
Punkte für Reaktionen
3.510
Punkte
344
Wie voll ist den die HDD Nr.2? Jevoller desto doller mit SMR HDDs
 

Thorfinn

Benutzer
Sehr erfahren
Mitglied seit
24. Mai 2019
Beiträge
1.744
Punkte für Reaktionen
417
Punkte
103
vielen Dank für die Antworten.

"Auf Verdacht tauschen" naja es ist die Platte auf die die Klienten Backups ablegen. 43.000 Stunden sind ja kein Alter.
Die Platte ist ein Volume für sich und zu ca 85% genutzt - war sie quasi immer, da die Klienten die Backups rotieren.

Screenshot 2024-07-30 at 13-59-50 Hyndla.png
Der Storage Manager zeigt zu allen HDD "Healthy" grün an.

Die Smart Tests laufen mittels smartctl 6.5 montags 14:00, und die werden fehlerfrei und ohne nennenswerte Meldung abgewickelt.

Die "smart_damage" Meldung kommt wöchentlich sonntags 7:30 - Da läuft der "quick health test" vom Storage Manager.
Nach dem "extended health test" kommt die "smart_damage" Meldung nicht.
Weiss jemand was Synology da "unter der Haube" verwendet?
vielleicht ist das ja nur was was die EFAX Platten von WD nicht unterstützen.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.767
Punkte für Reaktionen
3.740
Punkte
468
Im Speicher-Manager kannst du den Schnelltest doch auch manuell pro Platte ausführen und siehst, wann der letzte Lauf war.
Mach das mal, damit du siehst, welche der Platten das auslöst. Bei mir laufen die Tests immer zeitgleich.

1722343982473.png

Ich verstehe die "smart_damage"-Meldung so, dass der Test erst gar nicht fertig geworden ist, sondern abgebrochen/abgestützt ist. Ob es dann bei "Healthy" bleibt, weiß ich nicht. Steht im Protokoll-Center bei den Laufwerks-Logs was dazu?

PS: Ich vermute, dein "Smart Test" montags um 14 Uhr ist kein Test, sondern nur ein Auslesen der Werte.
 

Thorfinn

Benutzer
Sehr erfahren
Mitglied seit
24. Mai 2019
Beiträge
1.744
Punkte für Reaktionen
417
Punkte
103
in den Log Protokollen steht nix ausser "smart_damage"

also zurück zum Storage Manager - Health info - SMART: Drive 3 leuchtet orange "Attention Required".

ad 1) Den Quick Test stosse ich also nochmal wie @Benares vorschlägt manuel an: und siehe da: Healthy!
ad 2) kann sein, aber warum finde ich dann darin keine Verdächtigest. (Deshalb ja meine Frage nach diesem blöden Fehler 40)

Weil jetzt alles Grün ist tausche ich erstmal keine Platte "Auf Verdacht", warte den nächsten full extended test ab (welcher 734 Minuten dauern soll) und in der Zwischenzeit bedanke ich mich herzlichst für die Unterstützung.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.767
Punkte für Reaktionen
3.740
Punkte
468
Ist schon komisch. Du kannst ja mal die Platte 3 bei dem zyklischen Schnelltest rausnehmen und schauen, ob die Meldung dann am Sonntag ausbleibt.

1722345737207.png

in den Log Protokollen steht nix ausser "smart_damage"
ohne Bezug zu einem Laufwerk?
Bei mir steht da in der vorletzten Spalte immer, zu welchem Laufwerk die Meldung gehört.
1722346050707.png
 

Thorfinn

Benutzer
Sehr erfahren
Mitglied seit
24. Mai 2019
Beiträge
1.744
Punkte für Reaktionen
417
Punkte
103
nochmals Danke - es schaut so aus das das testen von Drive 3 (WD60EFAX) nicht immer klappt, die sporadisch abgeschlossenen Tests liefern aber keine substantiellen Fehlermeldungen.

ich verschieb mal den Zeitpunkt der Test in ruhigere Zeitfenster.

1722346437356.png
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
Die WD60EFAX ist eine SMR und verursacht den Fehler.
Edit: Das hatte ich übersehen.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.767
Punkte für Reaktionen
3.740
Punkte
468
Also richtig geraten, Laufwerk 3. Vielleicht wirklich nur ein Kompatibilitätsproblem mit den Tests oder weil die Platte doch recht voll ist. Ist das schon lange so?
Trotz SMR müssten die Tests eigentlich klappen.
Denke über ne neue nach oder nimm sie halt aus dem Test raus.
 

Thorfinn

Benutzer
Sehr erfahren
Mitglied seit
24. Mai 2019
Beiträge
1.744
Punkte für Reaktionen
417
Punkte
103
Ja das ist die SMR Platte - Die ist seit 42000 Stunden in Betrieb: one drive=one volume, ext formatiert.
Jahrelang unter DSM 6 war da nix.
Seit dem upgrade auf DSM 7 zicken die Tests sporadisch.

Ich schaub mal die Quotas der Backup Nutzer ein wenig runter, damit die Platte nicht so dolle voll ist und verleg die Test in ruhigere Zeitfenster um 7:30 bollert hier so mancher Klient sein erstes "Backup" Richtung NAS.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat