Hilfe benötigt! Plötzlich mehrere Festplatten "Kritisch", SMART OK

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Hallo zusammen,

ich brauche dringend eure Hilfe!
Ich habe jetzt innerhalb weniger Tage zwei Festplatten, die plötzlich den Status "kritisch" angenommen haben. Laut den Smarttests (nach Verschlechterung ausgeführt!) sollte alles in Ordnung sein.

Folgende Fehlermeldung wird angezeigt:
"Beim Zugriff auf dieses Laufwerk sind Fehler aufgetreten. Ersetzen Sie dieses Laufwerk unverzüglich."

Bei beiden handelt es sich um relativ neue WD RED Pro 22TB

25.05. WD RED Pro 22TB ~4000 Betriebsstunden - An WD als Garantiefall eingeschickt (aktuell auf dem Postweg) deswegen fehlt unten in der Grafik Laufwerk 4.
01.06. WD RED Pro 22TB ~1500 Betriebsstunden

Mein NAS:
DS1821+, DSM 7.2.1-69057 Update 3, 16GB, SHR2

Ich kan mir nicht vorstellen, dass in in so kurzer Zeit zufälligerweise 2 Platten einen Defekt haben (von unterschiedlichen Händlern mit Monaten Abstand gekauft!).
Was kann da die Ursache sein? Und was kann ich tun?

Ich bin gerade etwas panisch, ich habe extra viel Geld für die SHR2 Konfiguration ausgegeben damit das NAS immer verfügbar ist und ich mir im Fehlerfall keine Gedanken um einen Totalausfall machen muss. Backups wären natürlich vorhanden aber den enormen Aufwand ~100TB an Daten zurückspielen zu müssen und all die Konfigurationen will ich mir ersparen. Deswegen ja die SHR2 Konfiguration.

Synology scheint Festplatten, die einmal als kritisch erkannt wurden, ja irgendwie (anhand der Seriennummer?) zu markieren, so dass man sie, auch wenn man sie extern formatieren würde, nicht einfach wieder zum Array hinzufügen kann. Lässt sich diese Liste "unerwünschter Festplatten" irgendwie zurücksetzen?

Ansosnten wäre ich für alle Arten von Tipps und Ratschlägen, wie ich jetzt vorzugehen habe, sehr dankbar.


Sorry falls ich auf die Schnelle wichtige Infos vergessen habe, ich bin gerade etwas panisch.



Kritisch x2.jpg
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Keine SMART Tests machen, dass stresst nur die HDDs!!!
Backup aktuell?
Poste mal die SMART Werte aller HDDs als Code, siehe Link in meiner Signatur.
Was steht im Protokoll?
 
Zuletzt bearbeitet:
  • Like
Reaktionen: plang.pl

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
15.029
Punkte für Reaktionen
5.389
Punkte
564
nach Verschlechterung ausgeführt
Das ist tatsächlich das Schlechteste was du machen kannst für die HDD.
Bevor irgendwas gemacht wird, sicherstellen, dass das Backup aktuell ist. Wenn das der Fall ist, kann man prüfen, ob die HDD tatsächlich im Eimer ist und ob vielleicht noch weitere HDDs betroffen sind (SMART-Rohwerte, keine Tests!!!).
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Danke für die super schnellen Antworten.
Backups sind aktuell. Habe 2 weitere Diskstations die zusammen eine Kopie meines Hauptsystems speichern. Backup aktualisiert sich 1x die Woche automatisch (zuletzt von heute morgen).


Die Smart Daten sind ja in der aktuellen DSM ganz schön versteckt...
Ich scheitere aktuell daran mich per ssh einzuloggen.

Was muss ich eingeben wenn der Admin ein Leerzeichen im Namen hat?
Benutzername des Admins: Max Mustermann
IP: 192.168.1.2
port: 22

nach der Anleitung die ctrlaltdelete verlinkt hat
ergibt das dann für mich:

ssh Max Mustermann@192.168.1.2 -p 22

Das geht aber nicht. Er stört sich am Leerzeichen. Das muss man dann wohl irgendwie anders eingeben damit er den Nutzernamen richtig auflösen kann.
 
  • Like
Reaktionen: Thorfinn

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Versuch mal "Max Mustermann"
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
oder leg halt dafür einen adminuser an ohne Leerzeichen?
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Ok, danke. Hab eben standard admin user wieder aktiviert und bin jetzt ich einen Schritt weiter.

Wenn ich "smartctl -iA -d sat /dev/sata3" eingebe (Platte 3 hat den Status kritisch)
bekomme ich aber ein "Permission denied".

Ich dachte eiegentlich wenn der Nutzer ein Admin ist sollte er automatisch alle Rechte haben?
Scheinbar fehlt hier noch irgendwas.



smart abfrage.jpg
 

Ronny1978

Benutzer
Sehr erfahren
Mitglied seit
09. Mai 2019
Beiträge
1.282
Punkte für Reaktionen
503
Punkte
128
nein, die musst du dir noch geben: sudo -i dann Passwort noch einmal.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Genau, mit dem Befehl sudo -i wirst du zum root user.
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Danke, das sudo war es.
Die smart Werte sehen jetzt aber für mich ziemlich unverdächtig aus (IDs 1, 5, 7, 197, 198, 199).


smart HDD3.jpg
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Poste bitte mal sata2 und fehlt da die ID200?
Edit: bzw. einfach mal alle HDDs posten
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Hier mal HDDs. ID200 gibt es bei mir nicht.
An den werten sehe ich jetzt nichts ungewöhnliches.

sata1
smart HDD1.jpg

sata2
smart HDD2.jpg

sata3
smart HDD3.jpg

sata4
smart HDD4.jpg

sata5
smart HDD5.jpg

sata6
smart HDD6.jpg

sata7
smart HDD7.jpg
 
  • Like
Reaktionen: JudgeDredd

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Ich hoffe mal, dass hier ist das richtige Protokoll. Da zwischen dem 25.05. und heute einige unwichtige Einträge verhanden sind habe ich das ganze mal zusammengekürzt. Oben sind alle Einträge vor dem Ausfall der 2. Festplatte und unten alle Einträge vor dem Ausfall der ersten.

Nachdem die erste Festplatte ausgefallen ist hatte ich zuerst versucht sie zu reparieren. Das hat jedoch nicht funktioniert, siehe unten:

protokoll ausschnitt.jpg
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Ich würde da nix riskieren und die HDD tauschen gegen eine Neue.
 
  • Like
Reaktionen: maxblank

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Die erste Festplatte hatte ich bereits an WD geschickt und hoffe, dass ich da Ersatz bekomme. Da die abgesehen von der Fehlermeldung im DSM aber "in Ordnung" zu sein scheint bin ich wirklich unsicher ob das klappt. Habe bisher auch keine Erfahrung mit dem WD Support.

Jetzt mit dem Ausfall der zweiten Festplatte innerhalb einer Woche habe ich große Zweifel ob die wirklich kaputt sind. Wäre schon ein komischer Zufall. Ich habe hier seit Jahren in diversen NAS über 24 WD Red im Einsatz ohne Problme und jetzt ganz plötzlich sind gleich zwei 22TB Modelle innerhalb einer Woche "kritisch" und das mit einwandfreien SMART Werten?

Kann es sein, das die Synology irgendeinen exotischen Fehler hat weswegen Sie die Platten reihenweise als "kritisch" markiert? Falls dem so wäre würde sich vermutlich bald die nächste Platte melden und ein Austausch würde nichts bringen. Für alle Fälle und um die Wartezeit bis zum Austausch zu verkürzen, habe ich eben schonmal eine neue WD RED Pro 22TB gekauft. Die 600€ tun da schon ziemlich weh (das NAS wird rein privat verwendet).

Was mir aufgefallen ist im Protokoll habe ich vor beiden Verschlechterungen (8/8 auf 7/8 und 7/8 auf 6/8) jeweils den verschlüsselten Ordner Backup gemounted. Kann das irgendwie die Fehler produziert haben oder war das eher ein Zufall?

Gibt es ansosnten irgendeien Möglichkeit die Liste der als Fehlerhaft vermerkten Seriennummern im DSM zu resetten?
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
12.363
Punkte für Reaktionen
5.022
Punkte
504
Der WD Support ist normalerweise gut.
Ja, es gibt defekte HDDs mit fehlerfreien SMART Werten.
Nein und ja gute Entscheidung eine Neue vorab zu ordern.
Zufall. bzw. beschädigten Bereich erwischt.
Ja, die dazugehörigen Fehlermeldungen löschen.
Bzw. schau dir das mal an:
https://github.com/007revad/Synology_clear_drive_error
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Super danke!
Genau sowas hatte ich gesucht!

Das werde ich definitiv mal testen. Bevor ich da jetzt aber weiter am NAS arbeite, warte ich lieber erstmal auf die Ersatzfestplatte. Für die zweite als „kritisch“ markierte Festplatte werde ich dann auch lieber mal Ersatz bei WD anfordern. Vielleicht hatte ich ja wirklich nur großes Pech.

Ich werde den Thread hier updaten und schreiben wie die Sache ausgeht.

Danke so weit erstmal an alle!
 

M4rc31

Benutzer
Mitglied seit
05. Jun 2022
Beiträge
22
Punkte für Reaktionen
8
Punkte
3
Meine ursprüngliche Befürchtung hat sich scheinbar bestätigt es lag wohl wirklich nicht an den Festplatten.
Folgendes ist seit meinem letzten Post passiert.

Ich habe mir durch RMA und Neukauf 2 neue WD Red 22TB besorgt.
Zur Erinnerung die beiden fehlerhaften Platten waren in Slot 3+4!

  1. Ich habe die Platte in Slot 4 getauscht und die Reparatur auf (7/8) gestartet. Lief durch.
  2. Ich habe die Platte in Slot 3 getauscht und die Reparatur auf (8/8) gestartet.
  3. Während diese noch lief ist plötzlich die nagelneue Festplatte aus Slot 4 die ich ja zuvor repariert hatte verschwunden. Sie wurde im DSM nicht mehr angezeigt als wäre der Slot komplett leer! (LED am Slot ebenfalls aus als wenn keine Festplatte verbaut wäre!)
  4. Nach einem Neustart wurde die nagelneuen WD RED 22TTB in Slot 4 wieder erkannt - Zustand kritisch….
  5. Da ich eine weitere DS1821+ besitze (Mein Backup NAS) habe ich die Festplatten einfach mal zwischen den Geräten getauscht.
  6. Mit dem Synology Clear Drive Error Skript habe ich den Zustand dann zurückgesetzt und konnte das Array erfolgreich auf 8/8 reparieren.

Ich vermute das beim ersten DS1821+ etwas mit den Slots 4+3 nicht stimmt. WD hatte mit die Platte auch kommentarlos getauscht. Es gab also keinerlei Rückmeldung zu evtl. gefundenen Fehlern auf der Festplatte.
Wenn dem so ist dann sollte es ja jetzt mit den Festplatten vom Backup NAS demnächst auch Probleme geben.

Leider habe ich keine Garantie mehr auf das NAS (Im Januar abgelaufen...).
Ich werde also erstmal abwarten. Wie ist eure Meinung zu dem Ganzen. Und falls der Fehler wirklich so auftritt wie gehe ich dann vor?
 

Rotbart

Benutzer
Contributor
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.637
Punkte für Reaktionen
565
Punkte
134
Das einzige was du wohl machen kannst, ist das Gerät mal komplett auseinandernehmen und reinigen, vielleicht hat die Platine nur irgendwo Kontaktprobleme, ansonsten halt Reparatur bzw. Neukauf.
 
  • Like
Reaktionen: M4rc31


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat 

 
 
  AdBlocker gefunden!

Du bist nicht hier, um Support für Adblocker zu erhalten. Dein Adblocker funktioniert bereits ;-)

Klar machen Adblocker einen guten Job, aber sie blockieren auch nützliche Funktionen.

Das Forum wird mit hohem technischen, zeitlichen und finanziellen Aufwand kostenfrei zur Verfügung gestellt. Wir zeigen keine offensive Werbung und bemühen uns um eine dezente Integration.

Bitte unterstütze dieses Forum, in dem du deinen Adblocker für diese Seite deaktivierst.

Du kannst uns auch über unseren Kaffeautomat einen Kaffe ausgeben oder ein PUR Abo abschließen und das Forum so werbefrei nutzen.

Vielen Dank für Deine Unterstützung!