Vermeintlich defekte Festplatte / auffällige S.M.A.R.T.-Testwerte

Infinious

Benutzer
Mitglied seit
21. Jan 2019
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Hallo liebe Community,

ich habe seit knapp einem Jahr 4x Seagate Exos X18 18TB. Seit geraumer Zeit meckert mein Speicher-Manager, dass die Festplatte im S.M.A.R.T.-Test auffällig geworden ist. Die Meldung laut Test ist "Es wurden schwerwiegende Fehler gefunden. Wir empfehlen, die Festplatte auszutauschen.".
Da Synology sich schlauerweise entschieden hat, das Auslesen der S.M.A.R.T.-Werte in der GUI anzuzeigen, habe ich mir diese über ssh angeschaut.

Relevante Werte waren/sind -soweit ich das bewerten kann- in Ordnung. Für das Umrechnen der Rohgrenzwerte habe ich den Seagate Error Rate Calculator benutzt, der mir allerdings bei z.B. der Rear_Error_Rate anzeigt: "No errors were ever seen." mit einer Wahrscheinlichkeit von 0,00000000%.

Hier auch nochmal ein Auszug aus dem Terminal:
Bildschirmfoto 2024-10-22 um 23.40.21.png

Wie genau würdet ihr damit umgehen? In der Übersicht im Speicher-Manager sagt mir das NAS übrigens, dass alles "In Ordnung" sei. Wie ich bereits an Informationen gesammelt habe, sollte man auf diese Aussage allerdings nicht vertrauen.
Bildschirmfoto 2024-10-22 um 23.42.12.png


Hier auch noch ein Ausschnitt aus den S.M.A.R.T.-Tests. Gelaufen hat die Festplatte erst 7.500 Stunden.
Bildschirmfoto 2024-10-22 um 23.43.53.png

Falls relevant, hier noch ein paar Infos zum NAS:

Synology DS920+, 8GB RAM. DSM Version DSM 7.2.1-69057 Update 5. Da ich auf dem System Docker laufen habe, gehen die Platten auch nicht in den Ruhemodus. Damit habe ich bereits die letzten fünf Jahre sehr gute Erfahrungen gemacht, sogar mit WD Blue/Green. :D
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
Nimm mal den Befehl mit kleinem a:
smartctl -ia -d sat /dev/sata4
Edit: Die Werte sehen gut aus.
 

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.168
Punkte für Reaktionen
1.133
Punkte
194
Bei den Werten sehe ich erstmal auch nix . Aber bin da auch nicht so ganz der Profi wie andere.

Was für ein Raid Verbund hast du?
Und hast du ne saubere Datensicherung?
 

Infinious

Benutzer
Mitglied seit
21. Jan 2019
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Nimm mal den Befehl mit kleinem a:
smartctl -ia -d sat /dev/sata4
Edit: Die Werte sehen gut aus.
Danke für deine Hilfe. Ich habe die Ausgabe hier als Spoiler angehängt:

smartctl -ia -d sat /dev/sata4
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Exos X18
Device Model: ST18000NM000J-2TV103
Serial Number: ZR55P3KF
LU WWN Device Id: 5 000c50 0dd17a62e
Firmware Version: SN02
User Capacity: 18,000,207,937,536 bytes [18.0 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: Unknown(0x0fe0) (minor revision not indicated)
SATA Version is: SATA >3.2 (0x1ff), 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Wed Oct 23 11:21:03 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 41) The self-test routine was interrupted
by the host with a hard or soft reset.
Total time to complete Offline
data collection: ( 559) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: (1559) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x70bd) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Read_Error_Rate 0x000f 080 064 044 Pre-fail Always - 90532981
3 Spin_Up_Time 0x0003 090 090 000 Pre-fail Always - 0
4 Start/Stop_Count 0x0032 100 100 020 Old_age Always - 17
5 Retired_Sectors_Count 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 090 060 045 Pre-fail Always - 901134644
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7535
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Drive_Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 17
18 Head_Health_Self_Assessment 0x000b 100 100 050 Pre-fail Always - 0
187 Reported_Un-correctable 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature 0x0022 061 055 000 Old_age Always - 39 (Min/Max 36/43)
192 Emergency_Retract_Count 0x0032 100 100 000 Old_age Always - 3
193 Load-Unload_Count 0x0032 100 100 000 Old_age Always - 318
194 Temperature 0x0022 039 045 000 Old_age Always - 39 (0 22 0 0 0)
197 Pending-Sparing_Count 0x0012 100 100 000 Old_age Always - 0
198 Uncorrectable_Sector_Count 0x0010 100 100 000 Old_age Offline - 0
199 Ultra_DMA_CRC_Error 0x003e 200 200 000 Old_age Always - 0
200 Pressure_Measurement_Limit 0x0023 100 100 001 Pre-fail Always - 0
240 Head_Flight_Hours 0x0000 100 253 000 Old_age Offline - 51105815862637
241 Lifetime_Writes_From_Host 0x0000 100 253 000 Old_age Offline - 59538388121
242 Lifetime_Reads_From_Host 0x0000 100 253 000 Old_age Offline - 2601964129852

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Interrupted (host reset) 00% 7455 -
# 2 Extended offline Completed without error 00% 6752 -
# 3 Extended offline Completed without error 00% 6005 -
# 4 Extended offline Completed without error 00% 5274 -
# 5 Extended offline Completed without error 00% 4551 -
# 6 Extended offline Completed without error 00% 3822 -
# 7 Extended offline Completed without error 00% 3085 -
# 8 Extended offline Completed without error 00% 2328 -
# 9 Extended offline Completed without error 00% 888 -
#10 Extended offline Completed without error 00% 142 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

Infinious

Benutzer
Mitglied seit
21. Jan 2019
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
Bei den Werten sehe ich erstmal auch nix . Aber bin da auch nicht so ganz der Profi wie andere.

Was für ein Raid Verbund hast du?
Und hast du ne saubere Datensicherung?
Ich habe die Platten im RAID10 laufen. Wichtige Daten sind mehrfach an verschiedenen Standorten gesichert :)
 

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.168
Punkte für Reaktionen
1.133
Punkte
194
Ok dann würde ich jetzt mir da nicht so die großen Sorgen machen.

Am besten die Mail Benachrichtung aktiv haben . DA bekommst sofort mit wenn das Volume doch ne Macke hat
 
  • Like
Reaktionen: Infinious

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
  • Like
Reaktionen: Infinious

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468
Vorsicht: Disk4 muss nicht unbedingt auch sata4 sein. Auf die Seriennummer achten.
 

Infinious

Benutzer
Mitglied seit
21. Jan 2019
Beiträge
5
Punkte für Reaktionen
0
Punkte
1
ist das die selbe HDD?
Danke @Benares und @ctrlaltdelete für eure Aufmerksamkeit, ihr habt recht - mein Fehler. Die korrekte HDD ist in dem Falle auf sata2. Hier die richtigen Logs im Spoiler / ggf. zur bessere Lesbarkeit auf Pastebin:

https://pastebin.com/P48teEUY

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)


Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org





=== START OF INFORMATION SECTION ===


Model Family: Exos X18


Device Model: ST18000NM000J-2TV103


Serial Number: WR501AGQ


LU WWN Device Id: 5 000c50 0e0709eb8


Firmware Version: SN02


User Capacity: 18,000,207,937,536 bytes [18.0 TB]


Sector Sizes: 512 bytes logical, 4096 bytes physical


Rotation Rate: 7200 rpm


Form Factor: 3.5 inches


Device is: In smartctl database [for details use: -P show]


ATA Version is: Unknown(0x0fe0) (minor revision not indicated)


SATA Version is: SATA >3.2 (0x1ff), 6.0 Gb/s (current: 6.0 Gb/s)


Local Time is: Wed Oct 23 19:24:02 2024 CEST


SMART support is: Available - device has SMART capability.


SMART support is: Enabled





=== START OF READ SMART DATA SECTION ===


SMART overall-health self-assessment test result: PASSED





General SMART Values:


Offline data collection status: (0x82) Offline data collection activity


was completed without error.


Auto Offline Data Collection: Enabled.


Self-test execution status: ( 121) The previous self-test completed having


the read element of the test failed.


Total time to complete Offline


data collection: ( 567) seconds.


Offline data collection


capabilities: (0x7b) SMART execute Offline immediate.


Auto Offline data collection on/off support.


Suspend Offline collection upon new


command.


Offline surface scan supported.


Self-test supported.


Conveyance Self-test supported.


Selective Self-test supported.


SMART capabilities: (0x0003) Saves SMART data before entering


power-saving mode.


Supports SMART auto save timer.


Error logging capability: (0x01) Error logging supported.


General Purpose Logging supported.


Short self-test routine


recommended polling time: ( 1) minutes.


Extended self-test routine


recommended polling time: (1574) minutes.


Conveyance self-test routine


recommended polling time: ( 2) minutes.


SCT capabilities: (0x70bd) SCT Status supported.


SCT Error Recovery Control supported.


SCT Feature Control supported.


SCT Data Table supported.





SMART Attributes Data Structure revision number: 10


Vendor Specific SMART Attributes with Thresholds:


ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE


1 Read_Error_Rate 0x000f 083 064 044 Pre-fail Always - 190926587


3 Spin_Up_Time 0x0003 090 090 000 Pre-fail Always - 0


4 Start/Stop_Count 0x0032 100 100 020 Old_age Always - 15


5 Retired_Sectors_Count 0x0033 100 100 010 Pre-fail Always - 0


7 Seek_Error_Rate 0x000f 089 060 045 Pre-fail Always - 764348264


9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7519


10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0


12 Drive_Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 15


18 Head_Health_Self_Assessment 0x000b 100 100 050 Pre-fail Always - 0


187 Reported_Un-correctable 0x0032 100 100 000 Old_age Always - 0


188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0


190 Airflow_Temperature 0x0022 061 054 000 Old_age Always - 39 (Min/Max 35/45)


192 Emergency_Retract_Count 0x0032 100 100 000 Old_age Always - 3


193 Load-Unload_Count 0x0032 100 100 000 Old_age Always - 322


194 Temperature 0x0022 039 046 000 Old_age Always - 39 (0 23 0 0 0)


197 Pending-Sparing_Count 0x0012 100 100 000 Old_age Always - 1


198 Uncorrectable_Sector_Count 0x0010 100 100 000 Old_age Offline - 1


199 Ultra_DMA_CRC_Error 0x003e 200 200 000 Old_age Always - 0


200 Pressure_Measurement_Limit 0x0023 100 100 001 Pre-fail Always - 0


240 Head_Flight_Hours 0x0000 100 253 000 Old_age Offline - 253759552757084


241 Lifetime_Writes_From_Host 0x0000 100 253 000 Old_age Offline - 59580734089


242 Lifetime_Reads_From_Host 0x0000 100 253 000 Old_age Offline - 2047268533720





SMART Error Log Version: 1


No Errors Logged





SMART Self-test log structure revision number 1


Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error


# 1 Extended offline Completed: read failure 90% 7499 69232


# 2 Extended offline Completed: read failure 90% 7499 69232


# 3 Short offline Completed: read failure 70% 7499 69232


# 4 Short offline Completed: read failure 90% 7450 69232


# 5 Short offline Completed: read failure 90% 7431 69232


# 6 Extended offline Completed: read failure 90% 7403 69232


# 7 Extended offline Completed: read failure 90% 6684 69232


# 8 Extended offline Completed: read failure 90% 5940 69232


# 9 Extended offline Completed: read failure 90% 5196 69232


#10 Extended offline Completed: read failure 90% 4476 69232


#11 Extended offline Completed: read failure 90% 3732 69232


#12 Extended offline Completed: read failure 90% 3012 69232


#13 Extended offline Completed: read failure 90% 2270 69232


#14 Extended offline Completed: read failure 90% 831 69232


#15 Extended offline Completed: read failure 90% 87 69232





SMART Selective self-test log data structure revision number 1


SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS


1 0 0 Not_testing


2 0 0 Not_testing


3 0 0 Not_testing


4 0 0 Not_testing


5 0 0 Not_testing


Selective self-test flags (0x0):


After scanning selected spans, do NOT read-scan remainder of disk.


If Selective self-test is pending on power-up, resume after 0 minute delay.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
Die HDD wird ausfallen, bitte tauschen.
 
  • Like
Reaktionen: Infinious

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468
Und beim Tausch wieder auf die Seriennummer achten (sollte draufstehen), Disk4 muss nicht unbedingt die 4. von links sein.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat