! Warung Speicher Pool 1 sind Probleme aufgetreten

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.297
Punkte für Reaktionen
1.708
Punkte
308
Ah deswegen zeigen viele WD-Platten bei ID192 den gleichen Wert wie bei ID193.

Andererseits sind die Infos auf der verlinkten Seite widersprüchlich.
"Power-off Retract Count S.M.A.R.T. parameter indicates the number of power off cycles."
vs.
"This parameter is considered informational by the most hardware vendors. The value is counted every time the heads are loaded off the media (i.e. every time the machine is powered down, put to sleep or is idle)."

Wenn die Maschine im Schlafzustand oder idle ist, gabs doch gar kein Power Of. Und wozu ist dann ID12 Power_Cycle_Count dann da?
 

SkullCastle

Benutzer
Mitglied seit
30. Sep 2022
Beiträge
33
Punkte für Reaktionen
2
Punkte
8
Das verstehe ich nicht, fehlerhafte Sektoren auf Laufwerk und du hast Laufwerk 2 dann getauscht?
Lese ich auch gerade. Habe aber Laufwerk1, welches defekt war gegen ein neues getauscht. Bin mir 1000% sicher zumal ja die daraus resultierenden Fehlermeldung auch weg ging. Die würde ja sonst nicht gelöscht.
Habe so langsam den Verdacht, dass das NAS vielleicht einen Weg hat.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
ID12 ist bei mir identisch mit Neustart der DS
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Poste mal die SMART Werte von beiden HDDs, sind das beides Seagate?
smartctl -ia -v 1,raw48:54 -v 7,raw48:54 -v 195,raw48:54 /dev/sata1
smartctl -ia -v 1,raw48:54 -v 7,raw48:54 -v 195,raw48:54 /dev/sata2
 

SkullCastle

Benutzer
Mitglied seit
30. Sep 2022
Beiträge
33
Punkte für Reaktionen
2
Punkte
8
=== START OF INFORMATION SECTION ===
Model Family: Seagate IronWolf
Device Model: ST12000VN0007-2GS116
Serial Number: ZJV2VCTF
LU WWN Device Id: 5 000c50 0b375501e
Firmware Version: SC60
User Capacity: 12,000,138,625,024 bytes [12.0 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Fri Jan 31 15:02:29 2025 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 567) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off supp ort.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: (1118) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x50bd) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VA LUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 08 3 065 044 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 09 1 091 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 10 0 100 020 Old_age Always - 6
5 Reallocated_Sector_Ct 0x0033 10 0 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 07 5 060 045 Pre-fail Always - 0
9 Power_On_Hours 0x0032 09 7 097 000 Old_age Always - 2940
10 Spin_Retry_Count 0x0013 10 0 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 10 0 100 020 Old_age Always - 6
187 Reported_Uncorrect 0x0032 10 0 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 10 0 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 05 7 054 040 Old_age Always - 43 (Min/Max 40/44)
192 Power-Off_Retract_Count 0x0032 10 0 100 000 Old_age Always - 92
193 Load_Cycle_Count 0x0032 10 0 100 000 Old_age Always - 126
194 Temperature_Celsius 0x0022 04 3 046 000 Old_age Always - 43 (0 22 0 0 0)
195 Hardware_ECC_Recovered 0x001a 00 8 003 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 10 0 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 10 0 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 20 0 200 000 Old_age Always - 0
200 Pressure_Limit 0x0023 10 0 100 001 Pre-fail Always - 0
240 Head_Flying_Hours 0x0000 10 0 253 000 Old_age Offline - 2919h+58m+45.201s
241 Total_LBAs_Written 0x0000 10 0 253 000 Old_age Offline - 31690581760
242 Total_LBAs_Read 0x0000 10 0 253 000 Old_age Offline - 3499872511

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Es könnte auch ein "sterbendes" Netzteil sein, welches nicht mehr genug Saft liefert.
 

SkullCastle

Benutzer
Mitglied seit
30. Sep 2022
Beiträge
33
Punkte für Reaktionen
2
Punkte
8
oh oh oh - hier die zweite - ID 192 ist aber krass

=== START OF INFORMATION SECTION ===
Model Family: Seagate IronWolf
Device Model: ST12000VN0007-2GS116
Serial Number: ZJV38WVJ
LU WWN Device Id: 5 000c50 0b3f57a22
Firmware Version: SC60
User Capacity: 12,000,138,625,024 bytes [12.0 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Fri Jan 31 15:03:37 2025 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 567) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: (1090) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x50bd) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 080 064 044 Pre-fail Always - 0
3 Spin_Up_Time 0x0003 089 087 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 085 085 020 Old_age Always - 15828
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 1296
7 Seek_Error_Rate 0x000f 085 060 045 Pre-fail Always - 0
9 Power_On_Hours 0x0032 057 057 000 Old_age Always - 37857
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 086 086 020 Old_age Always - 14923
187 Reported_Uncorrect 0x0032 001 001 000 Old_age Always - 105
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 058 053 040 Old_age Always - 42 (Min/Max 39/42)
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 926
193 Load_Cycle_Count 0x0032 092 092 000 Old_age Always - 16606
194 Temperature_Celsius 0x0022 042 047 000 Old_age Always - 42 (0 14 0 0 0)
195 Hardware_ECC_Recovered 0x001a 009 001 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Pressure_Limit 0x0023 100 100 001 Pre-fail Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 37620h+06m+33.644s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 90027654600
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 75309795827

SMART Error Log Version: 1
ATA Error Count: 105 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 105 occurred at disk power-on lifetime: 37273 hours (1553 days + 1 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 58 a4 d1 01 Error: UNC at LBA = 0x01d1a458 = 30516312

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 88 80 a8 d1 41 00 34d+22:59:31.883 READ FPDMA QUEUED
60 00 18 60 a8 d1 41 00 34d+22:59:31.883 READ FPDMA QUEUED
60 00 20 00 a8 d1 41 00 34d+22:59:31.883 READ FPDMA QUEUED
60 00 30 30 8a d1 41 00 34d+22:59:31.330 READ FPDMA QUEUED
60 00 c8 18 89 d1 41 00 34d+22:59:31.329 READ FPDMA QUEUED

Error 104 occurred at disk power-on lifetime: 37273 hours (1553 days + 1 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 34d+22:56:43.662 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 34d+22:56:43.662 READ FPDMA QUEUED
60 00 b0 ff ff ff 4f 00 34d+22:56:43.644 READ FPDMA QUEUED
60 00 50 ff ff ff 4f 00 34d+22:56:43.644 READ FPDMA QUEUED
60 00 00 ff ff ff 4f 00 34d+22:56:43.644 READ FPDMA QUEUED

Error 103 occurred at disk power-on lifetime: 37273 hours (1553 days + 1 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 34d+22:48:06.128 READ FPDMA QUEUED
ea 00 00 00 00 00 a0 00 34d+22:48:06.121 FLUSH CACHE EXT
61 00 08 18 2e 21 40 00 34d+22:48:06.120 WRITE FPDMA QUEUED
60 00 00 ff ff ff 4f 00 34d+22:48:06.120 READ FPDMA QUEUED
ea 00 00 00 00 00 a0 00 34d+22:48:06.105 FLUSH CACHE EXT

Error 102 occurred at disk power-on lifetime: 37273 hours (1553 days + 1 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 ff ff ff 4f 00 34d+22:47:55.236 READ FPDMA QUEUED
60 00 40 ff ff ff 4f 00 34d+22:47:55.206 READ FPDMA QUEUED
60 00 08 ff ff ff 4f 00 34d+22:47:55.199 READ FPDMA QUEUED
60 00 20 ff ff ff 4f 00 34d+22:47:55.198 READ FPDMA QUEUED
60 00 40 ff ff ff 4f 00 34d+22:47:55.192 READ FPDMA QUEUED

Error 101 occurred at disk power-on lifetime: 36258 hours (1510 days + 18 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 f8 91 a0 0d Error: UNC at LBA = 0x0da091f8 = 228626936

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
60 00 00 68 91 a0 4d 00 7d+12:27:48.179 READ FPDMA QUEUED
60 00 38 ff ff ff 4f 00 7d+12:27:48.178 READ FPDMA QUEUED
2f 00 01 13 00 00 a0 00 7d+12:27:48.101 READ LOG EXT
ef 10 02 00 00 00 a0 00 7d+12:27:48.101 SET FEATURES [Enable SATA feature]
ec 00 00 00 00 00 a0 00 7d+12:27:48.098 IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 22505 -
# 2 Extended offline Completed without error 00% 22327 -
# 3 Short offline Completed without error 00% 22117 -
# 4 Short offline Completed without error 00% 21763 -
# 5 Short offline Completed without error 00% 21347 -
# 6 Short offline Completed without error 00% 20641 -
# 7 Short offline Completed without error 00% 19935 -
# 8 Short offline Completed without error 00% 19223 -
# 9 Extended offline Completed without error 00% 19037 -
#10 Short offline Completed without error 00% 18769 -
#11 Short offline Completed without error 00% 18124 -
#12 Short offline Completed without error 00% 17412 -
#13 Short offline Completed without error 00% 16805 -
#14 Short offline Completed without error 00% 16156 -
#15 Short offline Completed without error 00% 15544 -
#16 Extended offline Completed without error 00% 15243 -
#17 Short offline Completed without error 00% 14943 -
#18 Short offline Completed without error 00% 14446 -
#19 Short offline Completed without error 00% 13940 -
#20 Short offline Completed without error 00% 13432 -
#21 Short offline Completed without error 00% 12858 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Die ist tot.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Du hast die falsche HDD getauscht!!!
Info2024/07/01 15:01:27ST12000VN0007-2GS116ZJV38WVJLaufwerk 1Die Anzahl fehlerhafter Sektoren auf diesem Laufwerk ist gestiegen.
SATA2 ist Laufwerk 1
Edit: Vergleiche die Seriennummern!!!
Edit02: die Werte in Post 28 sind von SATA2 oder?
Edit03: Beim Tauschen der HDDs immer die Seriennummern vergleichen
 
Zuletzt bearbeitet:

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Hast du die getauschte noch?
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Für mich schon. Welche Frage ist noch offen? Hast du meine Edits gelesen?
 

SkullCastle

Benutzer
Mitglied seit
30. Sep 2022
Beiträge
33
Punkte für Reaktionen
2
Punkte
8
Für mich schon. Welche Frage ist noch offen? Hast du meine Edits gelesen?
Das die Synology im Speicherpool angibt, beide Platten sind in Ordnung sei mal dahin gestellt, das man eh nicht weiß wie DSM das errechnet - Aber wieso geht die bei Totalausfall einer platte nicht direkt in dauerpiepen und macht wer weiß was, statt nur zu sagen Warnung und wenn der Fehler dauerhaft bleibt einfach nur den Status beobachten ?
Als die Platte "drohte" zu sterben hat das Teil ein Mordstheater gemacht und nun... naja . werde als neue Platte besorgen und tauschen..

DANKE DIR
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
SATA01: Laufwerk 2
Code:
Serial Number: ZJV2VCTF
5 Reallocated_Sector_Ct 0x0033 10 0 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 09 7 097 000 Old_age Always - 2940

SATA02: Laufwerk 1
Code:
Serial Number: ZJV38WVJ
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 1296
9 Power_On_Hours 0x0032 057 057 000 Old_age Always - 37857
Edit: SMART ID 2 nachträglich eingefügt!
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
Weil die HDD bisher aller fehlerhaften Sektoren neu zuweisen konnte und somit noch funktioniert
Code:
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.732
Punkte für Reaktionen
6.511
Punkte
569
ja, wieso?
 

Anhänge

  • 1738333217851.png
    1738333217851.png
    190,6 KB · Aufrufe: 6

SkullCastle

Benutzer
Mitglied seit
30. Sep 2022
Beiträge
33
Punkte für Reaktionen
2
Punkte
8
War ein Gedankenfehler. Hatte Wissen wollen wie das Rescue von denen funktioniert. aber ist ja nur 3 Jahre inklusive.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat