Storage Pool crashed - läßt sich die VM noch irgendwie retten?

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Ich habe auf einer der cache SSDs in der DS720+ unter DSM 6.2.4 ein Volume (basic, btrfs) eingerichtet (statt cache) und dort ein paar Daten gespeichert und eine Ubuntu VM installiert. Bei Starten heute morgen ist das Volume als "crashed" angezeigt worden. Die sonstigen Daten auf der SSD lassen sich noch kopieren (läuft gerade).
Gibt es eine Möglichkeit, die Ubuntu VM noch irgendwie zu retten? Migration funktioniert von einem gecrashten Laufwerk nicht mehr. Ein Backup der VM habe ich nicht (bevor jemand fragt), weil alles, was auf der SSD ist/war nicht weiter von Belang ist - im Sinne: ich kann es mit wenig Aufwand wieder neu aufbauen. Aber es wäre natürlich weniger Arbeit, wenn ich die VM noch irgendwie retten könnte.
Sieht jemand eine Chance, wie ich mir die Arbeit ersparen kann und die VM von der gecrashten SSD bekomme?
Und was mache ich am Besten mit der gecrashten SSD, überprüfen, auswerfen und neu einbinden?
Die SSD selbst wird als "healthy" angezeigt, available spare 99%, number of error log entries 1.
 
Zuletzt bearbeitet:

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Gute Frage. Was sagt denn der DSM zur gecrashten SSD? Was die Smart-Werte?
Könntest du bitte mal ein paar Screenshots posten?
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Smart-Werte scheinen o.k.:

Screenshot 2022-06-24 at 19.22.49.png

Screenshot 2022-06-24 at 19.23.06.png
Screenshot 2022-06-24 at 19.23.39.png
Power Cycles kommen daher, daß die DS jeden Abend schlafen geht und jeden Morgen wieder hochfährt.
Screenshot 2022-06-24 at 19.32.32.png
Screenshot 2022-06-24 at 19.32.49.png

Und der VMM:

Screenshot 2022-06-24 at 19.34.19.png
 
Zuletzt bearbeitet:

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Ist das eventuell die Ubuntu VM:
volume3.jpg

Das würde von der Größe her hinkommen:
Screenshot 2022-06-24 at 20.08.01.png

Wenn ja, wie bekomme ich sie da herunter? Kann man den LUN-Ordner einfach kopieren? (Edit: Ja, man kann...)
Code:
cp -R /volume3/@iSCSI/LUN /volume1/VM-Backup

Und kann man das Ganze dann einfach in einen Ordner /volume1/@iSCSI/LUN kopieren und die VM funktioniert von dort weiter? (Edit: Nein, offenbar nicht so ohne Weiteres, der VMM erkennt sie dort nicht)
 
Zuletzt bearbeitet:

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Du, ich hab keine Ahnung, weil ich VMM schon vor Jahren als unbrauchbar eingestuft habe. Benutzt der iSCSI zur Einbindung der Platten?
Vielleicht ist 2. SSD ja wirklich hin, dafür spricht

1656097274137.png

Was zeigt die andere SSD da? Ist im Protokoll-Center unter Protokolle, "Laufwerke" dazu was zu finden?
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Die andere zeigt 0. Ich habe die SSD jetzt aus dem Pool entfernt, jetzt sind die Daten wie folgt:
Screenshot 2022-06-24 at 21.04.25.png
Screenshot 2022-06-24 at 21.03.49.png
Screenshot 2022-06-24 at 21.04.46.png
Die Fehler sind auf 181 angestiegen!
Außerdem habe ich keine Möglichkeit, die SSD wieder neu einzubinden. Vermutlich muß ich die erst wieder über das Terminal bereitstellen?

Aber schon defekt? Die ist noch kein halbes Jahr alt, nur einmal beschrieben worden und sonst immer nur gelesen.
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Hast Du eine Idee, wie ich die wieder initalisiert bekomme?

Edit: Habe sie jetzt neu partitioniert und im Terminal wieder entsprechend eingehängt. Mal schauen, wie es weitergeht. Aber vermutlich muß ich die VM abschreiben und neu aufsetzen. Als storage pool habe ich sie wieder:
Screenshot 2022-06-24 at 21.26.03.png
Screenshot 2022-06-24 at 21.26.13.png
Screenshot 2022-06-24 at 21.26.21.png
 
Zuletzt bearbeitet:

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Nö, keine Ahnung. Ausbauen/Booten/Einbauen/Booten vielleicht?
Nochmal die Frage: Ist im Protokoll-Center unter Protokolle, "Laufwerke" dazu was zu finden?
Wenn ja, lösch dieses Protokoll mal. Manche der Smart-Werte stammen m.E. nicht von den Platten/SSDs, sondern aus den Protokollen.
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Habe sie im Terminal neu partitioniert und wieder eingehängt, s.o. Hat natürlich immer noch 181 Fehler. Die hat sie aber ja erst bekommen, nachdem ich alle Daten herunterkopiert habe, keine Ahnung wieso.

Mal sehen, ob ich die VM da jetzt wieder drauf bekomme.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Aber du hast schon gelesen, was ich geschrieben habe?
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Ja, aber wo lösche ich das Protokoll? Anders gefragt, was für ein Protokoll Center? Meinst Du das Log Center? Und dann "Clear"?
Screenshot 2022-06-24 at 21.48.44.png
 
Zuletzt bearbeitet:

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Über die 4 Dödels oben links, Hauptmenü, dann Protokoll-Center aufrufen

1656100360035.png


1656100286011.png
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Die einzigen Einträge dort sind
Screenshot 2022-06-24 at 22.00.56.png
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.718
Punkte für Reaktionen
3.711
Punkte
468
Ach du hast Englisch eingestellt, mag sein, dass es da "Log Center" heißt. Leider auch keine Hinweise :unsure:

Was mir grad auffällt, dass bei beiden SSDs um 19:21 der Cache disabled wurde. War da ein Reboot?
Schau mal auf das Alter der Dateien unter /var/lib/disk-compatibility. Ich bekam kürzlich eine Meldung, dass ich neu booten solle, weil es "Optimierungen" für meine Platten gäbe :rolleyes:. Nicht, dass dir Synology in dieser Beziehung grad ein Ei ins Nest legt. Meine ds415+_host_v7.db ist vom 16.06.2022.

Aber im Moment geh ich einfach davon aus, dass deine eine SSD fehlerhaft ist.
 
  • Like
Reaktionen: Stationary

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Nein, das war ich mit dem Cache ausschalten. Die VM bekomme ich zwar auf der Konsole wieder da hinkopiert, wo sie war, aber das System erkennt sie nicht. Bin gerade dabei, sie wieder neu aufzusetzen.

Ich denke auch, daß die SSD einen Fehler hat oder gehabt hat. Ist eben eine Konfiguration, die nicht offiziell gemacht werden sollte, weder die 10 GB RAM sind offiziell, noch das SSD Volume.
Ich frage mich bloß, ob ich mit den Werten versuchen sollte, die SSD auf Garantie zu tauschen, die ist grade mal ein halbes Jahr alt. Wobei sie mir da wahrscheinlich die unsafe shutdowns anlasten werden.
Ich schau gleich mal nach der disk compatibility.
 

Brillenschlange

Benutzer
Mitglied seit
19. Jun 2022
Beiträge
95
Punkte für Reaktionen
20
Punkte
8
Ich frage mich bloß, ob ich mit den Werten versuchen sollte, die SSD auf Garantie zu tauschen, die ist grade mal ein halbes Jahr alt. Wobei sie mir da wahrscheinlich die unsafe shutdowns anlasten werden.
Ich hatte vor kurzem auch eine Samsung SSD einschicken müssen. Es war keine M.2, sondern eine "SAMSUNG SSD 870 EVO 4TB", aber die hat schon nach drei Betriebsmonaten 19 fehlerhafte Sektoren gehabt. Eine zweite hatte laut SMART schon einen defekten Sektor, aber die wollten Sie nicht tauschen, weil Magician keine defekten Sektoren bei der Diagnose angezeigt hatte.

Einfach mal versuchen und ein RMA Ticket auf machen.
 
  • Like
Reaktionen: Stationary

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Hast Du die bei Samsung reklamiert oder beim Händler?
 

Brillenschlange

Benutzer
Mitglied seit
19. Jun 2022
Beiträge
95
Punkte für Reaktionen
20
Punkte
8
Bei Samsung. Zuständig für die SSD RMA ist die Firma Hanaro Europe B.V. Diese Wickeln das für Samsung ab. Die Supporthotline von Samsung hat folgende Nummer: 0800 7267864. Die folgende Telefonnummer hatte ich von dann vom Samsung Support erhalten: 0800 80108011.

Hanaro schickt Dir dann eine Mail mit den notwendigen Informationen und Bildern die sie brauchen. Ist ein wenig nervig und fummelig, aber es sollte sich lohnen.
 
  • Like
Reaktionen: Stationary

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Geschafft...mit ein wenig tricksen in den Konfigurationsdateien des VMM habe ich es geschafft, die alte VM wieder einzubinden: die zuvor gesicherte Ubuntu VM von volume1 wieder auf volume3 kopieren, dann eine neue Ubuntu VM installieren, danach die Verweise auf die vdisk in der Konfigurationsdatei austauschen und am Ende die vdisk der neuen VM löschen. Etwas Bastelei auf der Konsole. Morgen teste ich dann, ob alles noch funktioniert, wie es soll und kümmere mich um den RMA. Vielen Dank für Eure Geduld!
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Brillenschlange

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.911
Punkte für Reaktionen
1.252
Punkte
194
Damit ich mir die Frickelei in Zukunft spare, exportiere ich jetzt erst einmal die VM als OVA… Man kann zwar die vdisk, wie festgestellt, wieder einbinden, aber mit dem Aufwand, daß man erst eine neue VM erstellen muß, der man dann die alte vdisk unterschiebt.
Anfrage an Hanaro ist auch raus.
 
  • Like
Reaktionen: gerdfranzm


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat