Zirka 7 Jahre alte Platte macht nun Probleme - OK oder kritisch?

Status
Für weitere Antworten geschlossen.

Christoph_K

Benutzer
Mitglied seit
13. Nov 2011
Beiträge
48
Punkte für Reaktionen
0
Punkte
6
Hi zusammen. Nach einer ganzen Weile mal wieder was von mir. Das liegt daran dass diese Geräte ziemlich gut laufen. ;)

Jetzt macht eine Festplatte bei mir anscheinend Probleme, die um die 7 Jahre alt ist und so gut wie immer im Dauerbetrieb lief, was Ihr an der Stundenanzahl von SMART gleich sehen könnt.
Ich kann mit den ganzen Werten etc. was anfangen, kein Problem. Aber mir fehlt das Know-How wohl abzuschätzen, ob die Platte jetzt schon ausgetauscht werden muss oder nicht, zu mal es nun eine 2. Spiegelplatte ist zur neu gekauften Hauptplatte.

Erstmal ein paar allgemeine Daten. Aktuell so:
  • DS416play
  • DSM 6.1.5-15254 Update 1
  • 5 Platten (intern WD Red 3TB / WD Green 3TB / WD Red 3TB / WD Green 3TB, extern WD Elements 3TB)
  • Alle auf ext4
  • SHR RAID-1 auf Platte 1+2 für wichtige Daten, die anderen beiden sind SHR RAID-0 (keine wichtigen Daten). Die externe dient als Backupplatte.

Die Festplatte 2 (müsste wenn ich alles richtig aufgeschrieben hab eine WD Green 3TB sein) ist die älteste aktuell. Sie meldet nun SMART-Fehler, Details folgen am Ende.
Ich würde Euch gerne erstmal erzählen, wie es zu dieser Konstellation an Festplatten etc. gekommen ist.

Die Geschichte bis jetzt:
  • Vor ca. 7 Jahren habe ich die älteste WD Green gekauft und hatte ein 2Bay-NAS DS211j mit der einen Platte drin, Volume 1
  • Ein Paar Jahre später habe ich Speicherplatz gebraucht auf separatem RAID-0 (keine sensiblen Daten), eine weitere WD Green kam dazu, Volume 2
  • Vor 1-2 Jahren habe ich ein stärkeres NAS benötigt. Habe mir die DS416play zugelegt und die Platten reingehängt und alles OK, lief so wie vorher weiter nur mit mehr Power
  • Der Speicherplatz wurde erneut knapp. Eine WD Red kam hinzu, wieder nicht für sensible Daten gedacht, Volume 3 RAID-0
  • Vor 2 Wochen meldete dann SMART auf der ältesten Platte 35 Fehlerhafte Sektoren. Sie standen dann unter "Current Pending Sector".
  • Panic. Kein Backup vorhanden. Ich habe sofort die 4. Platte bestellt (WD Red) und gleich noch die externe Elements.
  • Dann bisschen überlegt und erstmal versucht die neue Red an 2. Stelle im NAS unterzubringen und dann das Volume1 von RAID-0 auf RAID-1 zu ändern. Hier glaube ich habe ich nicht richtig gehandelt.
  • Alles lief nach Plan. DSM rödelte lange vor sich hin und hat gespiegelt auf die neue Red.
  • Nach ein paar Stunden dann der rote Text im Speichermanager. Das Volume 1 sei abgestürzt, Dateien könnten beschädigt sein und man soll Daten sichern und das Volume reparieren (ging aber nie da ausgegraut) und das Volume neu einrichten. Es könne evtl. nicht mehr hochgefahren werden
  • Habe keinen Reboot probiert, nur SMART-Schnelltests laufen lassen. Aber ab hier war: PANIC. Nicht runterfahren.
  • Nun im Panicmodus --> zuerst gewissenhaft Backup gemacht!!! Das war echt schockierend, denn SSH-Zugriff hatte ich noch zum Glück, aber die meisten Pakete waren "angehalten" und konnten nicht mehr gestartet werden, so auch Hyper Backup, Notestation und MariaDB, ich konnte also nichts sichern und musste es über die Kommandozeile machen was aber kein Problem war und mir sogar gefallen hat.
  • Alle wichtigen Daten, sonstige Daten, DSM-Einstellungen, MariaDB-Export, Linux-Settings usw. auf die externe gesichert gesichert per rsync/mysqldump usw.
  • 2 Dateien habe ich im rsync-Prozess gesehen die ein "Fehler: Checksumme nicht gleich" bzw. ich glaube "Read Error" dabei hatten
  • Eine Datei wurde im DSM-Protokoll mit: "Wurde beschädigt wegen fehlerhaften Sektoren" vermerkt.
  • Dann runtergefahren und umgesteckt nach meinen Wünschen: Ich habe die ganz neue Red nun als "Hauptplatte" im Schacht 1, die älteste Red mit Fehlern in Schacht 2 als Spiegelplatte. Habe die unwichtigen Platten 3 und 4 dann aber erstmal rausgenommen (die sind nicht wichtig, die Daten auch nicht).
  • Komplett zurückgesetzt / 2 mal den RESET-Knopf hinten an der NAS länger als 4 Sekunden gedrückt.
  • DSM heruntergeladen, und per Finder draufgespielt.
  • "Nackt": Es war kein Volume zu sehen ( wie zu erwarten :) )
  • Volume 1 erstellt, Synology SHR, RAID-1 über Platte 1 & 2. Hier lief dann eine sehr sehr lange Konsistenzprüfung (nach 30 Min. bei Status 0.45%).
  • Schande über mein Haupt, ich habe die DS runtergefahren um Platte 3 und 4 einzuschieben und wieder hochzufahren.
  • Volume 3 & 4 tauchten auf, Datenzugriff OK, cool.
  • Volume 1 zeigte nun keinen Fortschritt mehr der Konsistenzprüfung an. Was ist diese Prüfung denn? Ist das der erweiterte SMART-Test? Denn ich möchte diesen Prozess den ich unterbrochen habe gerne weiter/neulaufen lassen...:confused:
  • Volume 1 zeigte aber an: "Alles in Ordnung", auch wenn da keine Prüfung weiterlief. Kann ich mir nun sicher sein, dass korrekt "gespiegelt" wurde?
  • Alles OK. DSM Einstellungen importiert aus dem Backup, die Daten von der Backupplatte erstmal nicht eingespielt.
  • Auf allen 4 Platten einen erweiterten SMART-Test laufen lassen (gleichzeitig über Nacht)
  • Unten findet Ihr die Eregnisse für die älteste Platte (denn diese hat Probleme festgestellt). Alle anderen Platten sind 1A von den Rohwerten her.

Meine Fragen wäre ganz einfach:

  1. Schon wieder eine neue Platte kaufen? :-D :-D :-D Also die Platte 2 mit den Fehlern dringend ersetzen oder eher nicht unbedingt?
  2. Bitte sagt mir gerne auch, was ich hier im Verlauf falsch gemacht habe, ich nehme gerne Kritik an?
  3. Da ich diese Konsistenzprüfung abgebrochen habe, die bestimmt mehrere Tage gelaufen wäre, was habe ich damit abgebrochen und wie kann ich das erneut starten? (Prozess hatte nach dem erstellen des RAID-1-Volumes begonnen und ist nicht mehr aufgetaucht)
  4. Was würdet Ihr an meiner Stelle sonst noch so machen / prüfen / optimieren?


Freue mich sehr über Eure Antworten. Bin schon gespannt.
Schönen Dienstag.
Chris

P.S.: Auf einem Screenshot sieht man dass ein erweiterter SMART-Test läuft. Der am Vorabend ist wohl abgebrochen hab ich das Gefühl (quittiert mit "Schwerer Fehler") und habe ihn heute Morgen erneut angeworfen.
 

Anhänge

  • Bildschirmfoto vom 2018-02-27 10-11-47.png
    Bildschirmfoto vom 2018-02-27 10-11-47.png
    49,5 KB · Aufrufe: 70
  • Bildschirmfoto vom 2018-02-27 10-11-16.png
    Bildschirmfoto vom 2018-02-27 10-11-16.png
    50 KB · Aufrufe: 69
  • Bildschirmfoto vom 2018-02-27 10-10-56.jpg
    Bildschirmfoto vom 2018-02-27 10-10-56.jpg
    57,4 KB · Aufrufe: 69
  • Bildschirmfoto vom 2018-02-27 10-10-35.jpg
    Bildschirmfoto vom 2018-02-27 10-10-35.jpg
    24,4 KB · Aufrufe: 68
  • Bildschirmfoto vom 2018-02-27 10-10-12.jpg
    Bildschirmfoto vom 2018-02-27 10-10-12.jpg
    25,7 KB · Aufrufe: 69

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.705
Punkte für Reaktionen
2.114
Punkte
829
Sieht vermutlich jeder anders. Ich würde eine solche Platte in meinem produktiven System tauschen. Du kannst die SMART-Werte aber auch weiter beobachten bzw. die Platte an einen Rechner hängen und durch den Kompletttest z.B. eines Herstellertools jagen. Achte vor allem auch darauf, ob die Platte komische Geräusche macht.
 

Archi_74

Benutzer
Mitglied seit
07. Feb 2012
Beiträge
257
Punkte für Reaktionen
2
Punkte
24
Meine Vorgehensweise: Daten sichern und Platte tauschen. Bei allem anderen hätte ich persönlich ein sehr sehr ungutes Gefühl.
Habe bei mir unter anderem alte Hitachi Platten mit über 70.000 Betriebsstunden am laufen. Diese weisen aber nicht den kleinsten Fehler auf.
 

Christoph_K

Benutzer
Mitglied seit
13. Nov 2011
Beiträge
48
Punkte für Reaktionen
0
Punkte
6
Danke. Unnormale Geräusche sind mir jetzt nicht aufgefallen, gottseidank. Habe natürlich immer mal ein Ohr drauf.
Ich werde das mal machen und das Herstellertool verwenden. Das heißt das Tool arbeitet "besser", da vom Hersteller und kann eventuell besser mappen oder mehr erkennen?
Ein simpler Adapter von Amazon (SATA zu USB3) tut es da vollkommen nehme ich an?

Gut, Archi_74, dann hat meine anscheinend 20.000 Stunden weniger geschafft. :rolleyes:
 

ottosykora

Benutzer
Mitglied seit
17. Apr 2013
Beiträge
8.879
Punkte für Reaktionen
1.155
Punkte
288
ich habe da gerade eine DS und eine Platte drin hat letzte Woche noch 4 bad sectors gehabt, heute sind es 7.
Hat so was wie 16000h. Wird wohl in den nächsten Wochen durch eine bessere aber auch alte Platte ersetzt.
Diejenige welche die Fehler zeigt, ist nämlich schon mindestens 10x von ca 1m auf einen Betonboden gefallen, wurde jahrelang in irgendeiner Holzhütte
in Afrika betrieben. Funktioniert aber immer sonst gut.

Ich denke eine Platte mit fast 50kh darf ruhig in Rente gehen.
 

Christoph_K

Benutzer
Mitglied seit
13. Nov 2011
Beiträge
48
Punkte für Reaktionen
0
Punkte
6
Wo Du Recht hast hast Du Recht.

Gut ich bin auch eher ein Mensch der vorsichtigeren Sorte. Also ich habe mit der Platte einfach kein gutes Gefühl mehr. Den Herstelltertest will ich aber als letzten Versuch noch drüberlaufen lassen. Wenn irgendwas weitermuckt, kommt die Platte in den .... nicht Müll sondern in den Desktop-PC für unwichtige Daten.

Hattet Ihr schonmal Probleme beim Austausch einer Platte aus einem Verbund größer als RAID-0?
Also runterfahren, ausbauen, einbauen, hochfahren --> "Reparieren"?
 

Archi_74

Benutzer
Mitglied seit
07. Feb 2012
Beiträge
257
Punkte für Reaktionen
2
Punkte
24
Ich hatte den Fall bisher 4 mal. Methode wie du beschrieben hast: runterfahren, ausbauen, einbauen, hochfahren --> "Reparieren"
Bisher keine Probleme.
 

Christoph_K

Benutzer
Mitglied seit
13. Nov 2011
Beiträge
48
Punkte für Reaktionen
0
Punkte
6
Danke für die Tipps und Erfahrungsberichte. Dann sind ja alle Klarheiten beseitigt. :D
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat