- Mitglied seit
- 18. Jun 2012
- Beiträge
- 152
- Punkte für Reaktionen
- 1
- Punkte
- 24
Hi Leute,
kann man bei einem wiederhergestellten SHR-RAID Volume davon ausgehen daß die Daten fehlerfrei sind bei folgendem Szenario?
DS1512+
DSM 5.2 (bisher kein weiteres Update wegen Zarafa)
Volume ist abgestürzt. (Die Platten haben 45.000 Betriebsstunden, sowieso Zeit für einen Tausch)
Gerät läuft über USV
(Backup ist vorhanden, wegen Zarafa und weil ich es den einfacheren Weg fand habe ich einfach mal versucht, das Raid wiederherzustellen.)
1 Volume auf SHR-RAID
Aus einem mir unbekannten Grund ist eine Platte komplett tot.
Wegen defekten Sektoren auf der 2. Platte ist das Volume abgestürzt.
Zugriff ist seltsamerweise trotzdem noch möglich.
System neu gestartet, Volume ist wieder da aber "degraded".
Zugriff ist möglich, erst mal alles auf eine externe Platte kopiert (Robocopy unter Windows). Dabei gab es keine Fehlermeldung.
Kann man dann davon ausgehen daß die Daten korrekt sind? Testweise geöffnete Dateien sind ok, ich kann aber nicht alles durchgehen.
Neue Platte eingesetzt.
Volume wiederherstellen.
10% - Volume abgestürzt, neue defekte Sektoren auf 2. Platte erkannt.
Neu gestartet und defekte Sektoren neu zuordnen lassen.
Volume wiederherstellen
12% - Volume abgestürzt, neue defekte Sektoren auf 3. Platte erkannt - die ist also auch hinüber.
Neu gestartet und defekte Sektoren neu zuordnen lassen.
Volume wiederherstellen. Lief über Nacht durch.
Erfolg - Volume wieder online
2. Platte rausgezogen, neue Platte eingebaut
Volume wiederherstellen. 100% durch mit Warnungen - neue defekte Sektoren auf 1. Platte.
3. Platte rausgezogen, neue Platte eingebaut
Volume wiederherstellen.
100% fertig mit 3 neuen Platten.
Durch den Ausfall einer Platte sind ja keine Parity-Informationen mehr vorhanden.
Kann man davon ausgehen daß die defekten Sektoren "gerade noch so" gelesen und umgeschrieben worden sind?
Bei Fehlern müsste es ja sonst eine Meldung geben "Datei fehlerhaft" oder ähnliches.
Oder werden solche Fehler beim Rebuild einfach ignoriert? Im Log habe ich nichts gefunden wie "unrecoverable error" oder ähnliches.
Ist zum Glück nicht meine Kiste.
Habe jetzt das Backup von "vor dem Crash" ausgelagert und lasse die Kiste so laufen, sollten doch noch Probleme auftauchen kann ich dann darauf zurückgreifen.
Interessant bei welchen extremen Defekten trotzdem noch eine Wiederherstellung möglich ist.
Bei einem Windows-Server hat sowas noch nie funktioniert. Da ging es immer nur über das Backup.
kann man bei einem wiederhergestellten SHR-RAID Volume davon ausgehen daß die Daten fehlerfrei sind bei folgendem Szenario?
DS1512+
DSM 5.2 (bisher kein weiteres Update wegen Zarafa)
Volume ist abgestürzt. (Die Platten haben 45.000 Betriebsstunden, sowieso Zeit für einen Tausch)
Gerät läuft über USV
(Backup ist vorhanden, wegen Zarafa und weil ich es den einfacheren Weg fand habe ich einfach mal versucht, das Raid wiederherzustellen.)
1 Volume auf SHR-RAID
Aus einem mir unbekannten Grund ist eine Platte komplett tot.
Wegen defekten Sektoren auf der 2. Platte ist das Volume abgestürzt.
Zugriff ist seltsamerweise trotzdem noch möglich.
System neu gestartet, Volume ist wieder da aber "degraded".
Zugriff ist möglich, erst mal alles auf eine externe Platte kopiert (Robocopy unter Windows). Dabei gab es keine Fehlermeldung.
Kann man dann davon ausgehen daß die Daten korrekt sind? Testweise geöffnete Dateien sind ok, ich kann aber nicht alles durchgehen.
Neue Platte eingesetzt.
Volume wiederherstellen.
10% - Volume abgestürzt, neue defekte Sektoren auf 2. Platte erkannt.
Neu gestartet und defekte Sektoren neu zuordnen lassen.
Volume wiederherstellen
12% - Volume abgestürzt, neue defekte Sektoren auf 3. Platte erkannt - die ist also auch hinüber.
Neu gestartet und defekte Sektoren neu zuordnen lassen.
Volume wiederherstellen. Lief über Nacht durch.
Erfolg - Volume wieder online
2. Platte rausgezogen, neue Platte eingebaut
Volume wiederherstellen. 100% durch mit Warnungen - neue defekte Sektoren auf 1. Platte.
3. Platte rausgezogen, neue Platte eingebaut
Volume wiederherstellen.
100% fertig mit 3 neuen Platten.
Durch den Ausfall einer Platte sind ja keine Parity-Informationen mehr vorhanden.
Kann man davon ausgehen daß die defekten Sektoren "gerade noch so" gelesen und umgeschrieben worden sind?
Bei Fehlern müsste es ja sonst eine Meldung geben "Datei fehlerhaft" oder ähnliches.
Oder werden solche Fehler beim Rebuild einfach ignoriert? Im Log habe ich nichts gefunden wie "unrecoverable error" oder ähnliches.
Ist zum Glück nicht meine Kiste.
Habe jetzt das Backup von "vor dem Crash" ausgelagert und lasse die Kiste so laufen, sollten doch noch Probleme auftauchen kann ich dann darauf zurückgreifen.
Interessant bei welchen extremen Defekten trotzdem noch eine Wiederherstellung möglich ist.
Bei einem Windows-Server hat sowas noch nie funktioniert. Da ging es immer nur über das Backup.