Speicherpool 1 ist abgestürzt

Dani Düsentrieb

Benutzer
Mitglied seit
03. Jan 2008
Beiträge
216
Punkte für Reaktionen
3
Punkte
18
Hallo Zusammen,

zu dem Thema habe ich schon etliche Einträge gefunden aber keines was das verhalten meiner Station beschreibt.
Ich betreibe eine DS720+ mit DSM 6.2.4 in der neuesten Version an einer USV. Am Mittwoch meldete sich die Station mit einem Pipton und an der Station leuchtete die Status LED gelb alle anderen LEDs waren aus. Zugriff per DSM Fehlanzeige. Also die Station durch langes drücken auf den Powerschalter ausgeschaltet. Nach dem Neustart ist die Station wieder komplett hochgefahren und alles lief ohne Probleme.
Die Station hat nach dem Neustart mir zwei Mail gesendet, eine mit der Info zu den Laufwerken mit abnormalem Status, hier stehen beide Platten drin und eine mit der Info Prüfsummen stimmen nicht überein. Dort steht folgende Info:
auf einem Volume wurden Dateien mit nicht übereinstimmender Prüfsumme erkannt. Öffnen Sie das Protokoll-Center und kontrollieren Sie die Dateipfade der fehlerhaften Dateien. Wenn Sie die Dateien bereits gesichert haben, versuchen Sie, sie mit der gesicherten Version wiederherzustellen. Weitere Informationen zur Problembehebung finden Sie hier.
Im Protokoll-Center finden sich aber gar keine Einträge zu dem Vorfall. Man sieht nur die Einträge das die Station nicht richtig heruntergefahren wurde und wie danach alle Dienste wieder gestartet werden.
Beide Platten werden per Auto SMART-Test geprüft und weisen keine Probleme auf. Auch die Datenbereinigung wird einmal im Monat auf dem Speicherpool ausgeführt.
Wenn ich im Protokoll Center keine Einträge für den Vorfall finde gibt es evtl. noch Protokolle auf den ich per Konsole zugreifen könnte? Wie kann ich solchen Komplettausfällen Vorbeugen?

Gruß Daniel
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.672
Punkte für Reaktionen
5.841
Punkte
524

Dani Düsentrieb

Benutzer
Mitglied seit
03. Jan 2008
Beiträge
216
Punkte für Reaktionen
3
Punkte
18
Oh ja, sorry das wäre noch Wissenwert.
Also die beiden Platten WD Ultrastar 8TB sind im Raid 1 und das Dateisystem des Volumes ist BTRFS. Volumes gibts nur eines.

Details der SMART Wert Platte 1:
1 Raw_Read_Error_Rate 100 100 16 0
2 Throughput_Performance 133 133 54 92
3 Spin_Up_Time 159 159 24 510
4 Start_Stop_Count 100 100 0 495
5 Reallocated_Sector_Ct 100 100 5 0
7 Seek_Error_Rate 100 100 67 0
8 Seek_Time_Performance 128 128 20 18
9 Power_On_Hours 99 99 0 8556
10 Spin_Retry_Count 100 100 60 0
12 Power_Cycle_Count 100 100 0 489
184 End-to-End_Error 100 100 97 0
188 Command_Timeout 100 100 0 0
192 Power-Off_Retract_Count 100 100 0 961
193 Load_Cycle_Count 100 100 0 961
194 Temperature_Celsius 142 142 0 42
196 Reallocated_Event_Count 100 100 0 0
197 Current_Pending_Sector 100 100 0 0
198 Offline_Uncorrectable 100 100 0 0
199 UDMA_CRC_Error_Count 200 200 0 0
241 Total_LBAs_Written 100 100 0 32109785957
242 Total_LBAs_Read 100 100 0 55611864850

Platte 2:

1 Raw_Read_Error_Rate 100 100 16 0
2 Throughput_Performance 132 132 54 96
3 Spin_Up_Time 161 161 24 504
4 Start_Stop_Count 100 100 0 495
5 Reallocated_Sector_Ct 100 100 5 0
7 Seek_Error_Rate 100 100 67 0
8 Seek_Time_Performance 128 128 20 18
9 Power_On_Hours 99 99 0 8554
10 Spin_Retry_Count 100 100 60 0
12 Power_Cycle_Count 100 100 0 489
184 End-to-End_Error 100 100 97 0
188 Command_Timeout 100 100 0 0
192 Power-Off_Retract_Count 100 100 0 964
193 Load_Cycle_Count 100 100 0 964
194 Temperature_Celsius 139 139 0 43
196 Reallocated_Event_Count 100 100 0 0
197 Current_Pending_Sector 100 100 0 0
198 Offline_Uncorrectable 100 100 0 0
199 UDMA_CRC_Error_Count 200 200 0 0
241 Total_LBAs_Written 100 100 0 32109785206
242 Total_LBAs_Read 100 100 0 10218823388
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.672
Punkte für Reaktionen
5.841
Punkte
524
Die HDDs sind in Ordnung, Anleitung im Knowledge Center folgen, siehe meinen Link oben.
 

Dani Düsentrieb

Benutzer
Mitglied seit
03. Jan 2008
Beiträge
216
Punkte für Reaktionen
3
Punkte
18
Den habe ich mi vorhin schon mal durchgelesen, aber keine der dort beschriebenen Fälle trifft zu. Es wird kein Warnhinweis eingeblendet um eine Dateisystemprüfung durchzuführen. Den Artikel hab ich mir auch noch angeschaut. Hier wird nur auf die Selbstreparaturtechnologie verwiesen. Alle anderen Dinge zur Verhinderung werden so umgesetzt, außer den Speichertest. Den werde ich bei Gelegenheit mal durchführen. Kannst du mir sagen wie häufig die Datenbereinigung des Speicherpools durchgeführt werden sollte? Im Moment mache ich das einmal im Monat.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.672
Punkte für Reaktionen
5.841
Punkte
524
Bei mir steht es auf 3 Monate.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat