DS2413+ Volume abgestürzt

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
habe mal eine smart schnelltest gemacht siehe Bilder -- beide Platten haben rund 55t Betriebsstunden runter
Platte 3 hat einen Fehlehaften Sektor die andere hat zwei - einen Langzeittest kann ich erst machen wenn die DS per Paketdienst bei mir landet
 

Anhänge

  • smart.disk3JPG.JPG
    smart.disk3JPG.JPG
    94,5 KB · Aufrufe: 4
  • smart-disk5JPG.JPG
    smart-disk5JPG.JPG
    123 KB · Aufrufe: 4

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Man sieht hier nur von ID1 bis ID193 ... die weiteren Werte (ID194 bis ID200) wären wichtiger zu erfahren. Aber der Wert von ID1 ist nicht optimal, aber noch zumutbar. Einfach mal beobachten, ob er sich ändert in den nächsten Betriebsstunden.
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
Nachtrag Teil zwei der beiden SMART
 

Anhänge

  • smart.disk3_2.JPG
    smart.disk3_2.JPG
    116,1 KB · Aufrufe: 7
  • smart-disk5_2JPG.JPG
    smart-disk5_2JPG.JPG
    100 KB · Aufrufe: 7

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.025
Punkte für Reaktionen
1.614
Punkte
308
Ok, da versteht einer nicht, was mit dem SMART Test ausgelöst werden soll.
Das verstehe ich schon, ich bin nur anderer Ansicht bzgl. wann die Selbsttests notwendig/sinnvoll sind und wann nicht.

Für das Auslesen der Werte sind sie nicht notwendig und das funktioniert selbst dann, wenn die Platte noch gar keinen Test durchgeführt hat.

Beim Problem hier im Thread ist das Empfehlen bzw. Verlangen des erweiterten Test verantwortungslos. Denn hier ist weder klar, ob es ein Backup gibt, noch ob ein Versuch der Datenrettung unternommen werden soll. Letzteres wird durch den Test gefährdet.

Vor dem Rebuild die alten Platten im RAID durch den erweiterten Selbsttest zu stressen, ist überflüssig und Zeitverschwendung. Ein erfolgreicher Test ist keine Garantie, dass der anschließende Rebuild erfolgreich durchläuft und das RAID nicht durch den Ausfall alter Platten geschreddert wird. Im günstigsten Fall ist das also nur unnötiger Stress für die Platten und Zeitverschwendung. Bei WD-Platten dauert so ein Test gerne auch mal mehrere Tage statt wie sonst weniger als 24 h. Manchmal ist der auch noch nach einer Woche nicht fertig und es ist unklar, ob der Test hängt oder doch noch zu Ende kommt. Ein Check der Werte auf Auffälligkeiten vor dem Rebuild reicht.

Bei einem RAID ungleich Null, sollte man regelmäßig ein Scrubbing durchführen, da üblicherweise beim Lesen kein Check der Parität durchgeführt wird. Dabei werden alle Sektoren der Platten gelesen und man muss die Platten nicht auch noch zusätzlich durch regelmäßige Selbsttest stressen.
 

Syno-OS

Benutzer
Mitglied seit
23. Jun 2020
Beiträge
361
Punkte für Reaktionen
64
Punkte
28
Für das Auslesen der Werte sind sie nicht notwendig und das funktioniert selbst dann, wenn die Platte noch gar keinen Test durchgeführt hat.
Ich sehe, wieder einer mit wagen beweg gründe, warum habt ihr immer so viel schiss vor den einzigen Test der Festplatte (der Test führt die Festplatten firmware aus), die auch niedrige Priorität, damit sehr wenig Last erzeugt und die komplette Festplatte mal durch testet.

Beim Problem hier im Thread ist das Empfehlen bzw. Verlangen des erweiterten Test verantwortungslos. Denn hier ist weder klar, ob es ein Backup gibt, noch ob ein Versuch der Datenrettung unternommen werden soll. Letzteres wird durch den Test gefährdet.
Wenn du mal alte System wiederhergestellt hast, wird dich das nicht mehr scheren, da entweder überleben die Festplatten den Stress oder es war eh schon zu spät, da meistens dann nach der Wiederherstellung das RAID instabil ist, wenn der SMART Test nicht mehr durchläuft, ich habe etwas mehr Erfahrung in den Müll wieder zusammen kleistern. Normalerweise sind die 2 gerade ausgefallen Festplatten nur die vorboten für weitere Festplatten, die bald auch stress machen, häufig muss man viele Festplatten klonen bei so alten Systemen. Und dann wird es auch gerade wärmer, die Haupt-Data-Rescue Saison beginnt... ;)

Bei einem RAID ungleich Null, sollte man regelmäßig ein Scrubbing durchführen, da üblicherweise beim Lesen kein Check der Parität durchgeführt wird. Dabei werden alle Sektoren der Platten gelesen und man muss die Platten nicht auch noch zusätzlich durch regelmäßige Selbsttest stressen.
Was hat das hier wieder zu tun, hilft gerade nicht weiter, da gerade nicht anwendbar und für sein System nicht geeignet. Ein RAID scrubbing macht nur in bestimmten Fällen sinn, zb. bei einem vorigen Sektorfehler. Aber obdacht, RAID scrubbing korrigiert nur die Parität, besser gesagt es wird einfach eine neue Parität geschrieben, wenn die Daten verändert wurde, wird einfach eine 'falsche' für die unveränderte Datei, aber jetzt gerade richtige Parität geschrieben, daher sind dann die Änderungen der Daten zementiert, aber das RAID ist fehlerfrei, das sind 2 unterschiedliche Punkte, wer das nicht versteht, sollte sich noch mal mit Festplatte, Partitionen, RAID, LVM, Dateisystem auseinander setzen. RAID Scrubbing errechnet eine neue RAID Parität, das bedeutet nicht das deine Dateien im Dateisystem korrekt sind, dies ist dann die Checksumme im Dateisystem, alternative ist eine md5 checksumme mit einem Programm, nur muss dann per Script oder es händisch jedesmal vergleichen.
Nur BTRFS mit Checksummen kann da automatisch helfen, dann wird solange probiert, bis ein verbleibende Kombination der Festplatten im RAID die Checksumme ergibt, wenn die Datei nicht mehr herstellbar ist, bekommst du zumindest eine Warnung, dass die betreffende Datei beschädigt und aus dem Backup restauriert werden muss. Nur in Verbindung mit BTRFS ist die Funktion RAID Scrubbing sinnvoll nutzbar, und natürlich den weiterhin obligatorischen Backup. Checksummen ist der entscheidende Vorteil von BTRFS zu EXT4 und wird bei immer größeren RAIDs/Dateisystemen immer bedeutender, ab 50TB+ sollte man nicht mehr die alten Dateisystem ohne Checksummen nutzen, na klar sind die dann 'schneller', da Funktionen fehlen, aber meine Daten sind mir da schon wichtiger.
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
Sorry das ich da nicht mit sprechen kann, das ist etwas über meinem Level ;)
was soll ich machen wenn das System bei mir landet ?
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
so das System ist nun bei mir angekommen -- was soll ich jetzt machen ´????
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
100
Punkte
134
Was für ein System ist das jetzt? Welche DS? Welche Festplatte(n)? Was von der alten DS mitnehmen? Bitte um mehr Infos. Evtl. einen neuen Thread eröffnen oder weitere Infos via Suchfunktion hier finden?
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
will das alte wieder herstellen und hatte vorher nur über die ferne zugriff drauf. Nun habe ich es hier bei mir
 

Syno-OS

Benutzer
Mitglied seit
23. Jun 2020
Beiträge
361
Punkte für Reaktionen
64
Punkte
28
Wenn du dir nicht sicher bist, lieber dem Synology Support machen lassen....


Ich habe mal hier erklärt wie man eine RAID startet:
https://www.synology-forum.de/threads/shr-aufloesen.25030/#post-879617

nicht '--create' oder '-C' option sondern '-AfR' für nur versuchen das RAID zu starten nutzen
-A: Activate
-f: force
-R: Run the raid
Für das Ausführen kann man den Befehl verkürzen und mit etwas Bash Zauber: sd[abd] => sda sdb sdd
  • mdadm -AfR /dev/md2 /dev/sd[abcdefghijk]3 .....

mit mdadm -E schaue mal nach, ob Partition 3 oder 5 gebraucht wird, bei 5 wende dich an den Support, da nun die LVM Befehle ins Spiel kommen, diese Befehle kann man noch gefahrlos ausprobieren, nachdem das RAID mit mindestens 11 von 12 Festplatten läuft (kontrolle mit cat /proc/mdstat), das RAID läuft auch mit 10 von 12 Festplatten, aber dann sind keine Daten da -> RAID Status abgestützt, sollte man kennen...:
  • pvs
  • vgchange -ay
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
Mal eine kleine Info zwischen durch :
Habe vom Support eine Mail nach drei Tagen erhalten und die haben mich gebeten einen lanzeit SMART durch zu führen und das LOG davon an den Support zu wenden. Habe denen zurück geschrieben das so ein Test bei 12 Platten mehreereeee Tage dauern kann und ich nicht möchte das bei dem "stress" ggf noch weitere Platten ausfallen. Ich möchte nur einmal auf den Pool zugreifen können und die Daten runter ziehen und dann wras das. Die Platten sind alle von 2013 und laufen seit dem auch im Dauerbetrieb.
 

Senti

Benutzer
Mitglied seit
08. Dez 2007
Beiträge
63
Punkte für Reaktionen
1
Punkte
8
So das Thema ist durch :)
Ein Mitarbeiter von Synology hat mit Fernzugriff den Speicherpool wieder herstellen können. Sind mehr als vier Platten mit Sektor fehlern. Das kopieren der Daten läuft schon die ganze Nacht - Puh geschaft
 
Zuletzt bearbeitet:


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat