Bei Reparaturversuch zweites Laufwerk abgestürzt

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Ich habe ein SHR aus 4 * 4TB WD40EFPX-68C6CN0 Platten. Die sind auch noch garnicht so alt haben ca 10000 Stunden auf der Uhr. Nach Stromausfall war die vierte Platte abgestürzt. Ich habe sie dann aus dem Volume entfernt und den Platteneinschub für ca 20 Sekunden herausgezogen, um sie wieder einbinden zu können. Als ich sie wieder eingeschoben habe, ist mir leider gleich Platte Nr. 2 abgestürzt.
Ich bin jetzt etwas verunsichert was ich falsch gemacht habe. Jetzt hab ich halt ein Volume in dem noch 2 von 4 Platten laufen, wenn noch eine Platte versagt bedeutet es Datenverlust. ein frisches Backup läuft gerade noch.
Aber wie sollte ich jetzt weiter machen? Und vor allem was habe ich falsch gemacht, dass gleich noch eine Platte abgestürzt ist.

Andere Frage: Ich wollte gerade die Ergebnisse des SMART Tests Exportieren aber wie geht das nur? Ich hab mich gerade dabei erwischt wie mit dem Inspektor in ext-3 Dom gewühlt habe. Da muss es einen besseren weg geben als irgendwelche Screen-Shots zu machen oder?
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.751
Punkte für Reaktionen
3.728
Punkte
468

ForgottenRealmX

Benutzer
Mitglied seit
10. Mrz 2017
Beiträge
40
Punkte für Reaktionen
7
Punkte
8
Kann schonmal passieren. Wenn die Platten die 10k Stunden durchgelaufen sind und jetzt gleich zwei ausfallen, riecht es nach einem Serienfehler. Lass das Backup laufen, schick die 2 Platten ein, wenn noch Garantie drauf ist (sollte, 10k sind etwas über ein Jahr) und bestell hoffe, dass nicht bald auch noch die nächsten aussteigen.
Wir hatten schon ähnliche Fälle mit Festplatten. 10 Stück bestellt, nach nem halben Jahr sind 4 auf einmal ausgefallen.
 

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Danke für den Tip @Benares
Schade das man es nicht über Oberfläche exportieren kann. Ich werd mir das CLI Kommando merken.

SDA
Code:
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-3.10.108] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD40EFPX-68C6CN0
Serial Number:    WD-WX12A82CMUCS
LU WWN Device Id: 5 0014ee 26ab84039
Firmware Version: 81.00A81
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 1.5 Gb/s)
Local Time is:    Tue May 28 19:46:35 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   207   207   021    Pre-fail  Always       -       2608
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       16
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   087   087   000    Old_age   Always       -       9968
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       15
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       1
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       15
194 Temperature_Celsius                                              0x0022   115   110   000    Old_age   Always       -       32
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       17
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SDB
Code:
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-3.10.108] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD40EFPX-68C6CN0
Serial Number:    WD-WX92D62F2EJE
LU WWN Device Id: 5 0014ee 215631f21
Firmware Version: 81.00A81
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue May 28 19:49:11 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   210   203   021    Pre-fail  Always       -       2475
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       20
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   087   087   000    Old_age   Always       -       9968
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       19
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       5
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       17
194 Temperature_Celsius                                              0x0022   116   109   000    Old_age   Always       -       31
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       8
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SDC
Code:
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-3.10.108] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD40EFPX-68C6CN0
Serial Number:    WD-WX92D62P5926
LU WWN Device Id: 5 0014ee 26ab84432
Firmware Version: 81.00A81
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue May 28 19:49:34 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   206   205   021    Pre-fail  Always       -       2675
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       17
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   087   087   000    Old_age   Always       -       9968
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       16
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       2
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       15
194 Temperature_Celsius                                              0x0022   114   108   000    Old_age   Always       -       33
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SDD
Code:
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-3.10.108] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD40EFPX-68C6CN0
Serial Number:    WD-WX92D62P576Z
LU WWN Device Id: 5 0014ee 26ab841d4
Firmware Version: 81.00A81
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue May 28 19:49:46 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   216   207   021    Pre-fail  Always       -       2183
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       21
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   087   087   000    Old_age   Always       -       9968
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       20
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       19
194 Temperature_Celsius                                              0x0022   116   107   000    Old_age   Always       -       31
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   200   000    Old_age   Always       -       7
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.751
Punkte für Reaktionen
3.728
Punkte
468
Außer den teilweise etwas hohen Werten bei ID 199 (UDMA_CRC_Error_Count), was auf Kontakt-Probleme schließen lässt. fällt mir jetzt nichts Besonderes auf.
Vielleicht die DS mal etwas entstauben.
Aber vielleicht hab ich auch was übersehen. Bitte warte auch mal die Rückmeldung von anderen ab.
 

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Danke @Benares mit dem entstauben hat du wohl recht. Ich wollte sowie mal wieder die Wollmäuse raus jagen. Als ich das zum letzten mal vor über einen Jahr mit Platten raus nehmen gemacht habe, sind mir gleich 3 Platten abgeraucht von dem letzten Set. Die waren aber auch schon Jahre über ihrem Verfallsdatum deswegen hab ich mir dann gleich neue gekauft.
Insofern hab ich da immer etwas Bammel dass mir sowas wieder passiert.

Vielen Dank schon mal, ich Werde die Kiste dann runter fahren und morgen nach einer ordentlichen Reinigung wieder hoch fahren. Drückt mir bitte die Daumen dass nicht noch mehr abschmiert.
Dann melde ich mich nochmal.
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.400
Punkte
564
Für mich sehen die Werte bis auf die 199 auch gut aus. Auffällig ist, dass bei 3 Platten die 199 zu hoch ist. Das ist ungewöhnlich.
Ich würd mal nen RAM-Test machen
 

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Danke @plang.pl werde ich morgen mal machen. Ist das der Speicher-Test der mit Synology Assistant gemacht wird?
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.400
Punkte
564
Ja, mit dem Assistant machen. Währenddessen steht die DS nicht zur Verfügung!
Danach muss man über die Konsole kucken, ob der Test ohne Fehler verlief. I.d.R. gilt: Wenn keine Warnung erscheint, war der Test ohne Befund. Ich würde es aber manuell prüfen
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.542
Punkte für Reaktionen
5.741
Punkte
524
Ja, genau.
Ich finde die CRC Error der HDD 1-3 auch seltsam.
 

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Statusmeldung:

Ich habe heute, mit Druckluft, die Wollmäuse gründlich aus dem Gehäuse gejagt und auch die Festplatten-Anschlüsse damit gereinigt. Dann habe die Kiste hochgefahren... Volume 1 mit 2/4 Platten kritisch. Soweit so gut es Laufwerk 1 und 3 Laufen noch. Laufwerk 2 abgestürzt und Laufwerk 4 nicht zugewiesen. So wie ich die DS runter gefahren habe.

Dann habe ich Laufwerk 2 aus dem Volume entfernt und wieder eingehängt um dann mit 2 und 4 eine Reparatur zu versuchen. Der Reparaturversuch endete damit dass der Festplatteneinschub gleich deaktiviert wurde.
Um zu verifizieren ob es an der Platte oder dem Einschub liegt hab ich 2 und 4 dann getauscht. Reparaturversuch Nr. 2 hat zwar auch nicht geklappt aber der Festplatteneinschub wurde nicht deaktiviert.

Reparaturversuch Nr. 3 mit Einschub 2 (vorher HDD 4) hat dann begonnen zu rödeln. Ich lasse ihn jetzt erstmal arbeiten die ETA schwankt zwischen 10 Stunden und 2 Tagen.

Leider hab ich den Memory-Test im Eifer des Gefechts vergessen. Das werde ich gleich danach machen. Je nach dem werde ich dann noch einen Reparaturversuch mit der verblieben Platte wagen.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.751
Punkte für Reaktionen
3.728
Punkte
468
Lösch im Protokoll-Center bitte auch mal, nach Durchsicht, das Laufwerks-Prokoll. Oft macht der DSM den Laufwerkszustand am Vorhandensein von Fehlermeldungen dort fest.
 

tAntChen

Benutzer
Mitglied seit
12. Sep 2011
Beiträge
151
Punkte für Reaktionen
19
Punkte
18
Die Reparatur mit der einen Platte hat funktioniert, die DS läuft jetzt mit 3 von 4 Platten. Der Memory-Test ist ohne zu murren durchgelaufen. Aber eine Reparatur mit dem anderen Laufwerk ist leider nicht möglich, das bricht immer ab. In der HDD/SSD Übersicht wird die Platte als "In Ordnung" bezeichnet. Aber die ist wohl möglich echt defekt.

Hier noch mal die SMART Werte

Code:
smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-3.10.108] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red (CMR)
Device Model:     WDC WD40EFPX-68C6CN0
Serial Number:    WD-WX92D62F2EJE
LU WWN Device Id: 5 0014ee 215631f21
Firmware Version: 81.00A81
User Capacity:    4,000,787,030,016 bytes [4.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed May 29 22:03:55 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   204   203   021    Pre-fail  Always       -       2783
  4 Start_Stop_Count                                                 0x0032   100   100   000    Old_age   Always       -       27
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   087   087   000    Old_age   Always       -       9976
 10 Spin_Retry_Count                                                 0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       26
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       9
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       21
194 Temperature_Celsius                                              0x0022   117   109   000    Old_age   Always       -       30
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   162   162   000    Old_age   Always       -       86
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.400
Punkte
564
Die SMART-Werte sehen bis auf ID199 gut aus, was auf ein Kontaktproblem zwischen DS <-> Platte schließen lässt
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.542
Punkte für Reaktionen
5.741
Punkte
524
Oder auch ein defekt der HDD.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat