DS920+ High Availity Cluster, Volume abgestürzt auf beiden Systemen

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Hallo Alle,

wir setzen 2x das obige NAS System ein, auf beiden sind 4 Platten in einem Raid 10.

Bis gestern lief alles problemlos (seit Jahren), dann kammen die ersten Anrufe das die Daten schreibgeschützt sind.

Die Aktive NAS sagt das Volume ist abgestürzt, HDs zeigen alle in Ordnung an.

Ich habe dann Manuel die Übergabe auf die zweite NAS eingeleitet und es wurden keine Fehler mehr angezeigt, den Tag über hat dann auch alles funktioniert.

Heute morgen dann die selbe Meldung auf der Reserve NAS...

In beiden Fällen hat das Gerät keine Warnung versendet per E-mail, wenn ansonsten irgentwelche Probleme.

Ich wollte jetzt eigentlich erstmal ein Backup machen.

Leider wird das Active Backup für Business auch als Fehlerhaft angezeigt und lässt sich nicht mehr starten.

Da der Fehler auf beiden NAS Systemen aufgetreten ist gehe ich davon aus das es ein Software Problem ist.

Wie würdet Ihr jetzt weiter vorgehen?

Gruß

Marco
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.626
Punkte für Reaktionen
2.026
Punkte
829
Willkommen im Forum, Marco!

Mach als erstes bitte ein Ticket bei Synology auf. HA wird hier im Forum meiner Einschätzung nach nicht so oft genutzt, da solltest Du keine Zeit verlieren, Synology einzubinden. Viel Erfolg!
 

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.043
Punkte für Reaktionen
1.073
Punkte
194
Hallo Marco ,

Hast denn GRundlegend ein aktuelles Backup von deinen Daten?

HA ist immer so nen Thema für sich , ich vermute aber das bei dir das Dateisystem abgestürtzt ist . Setzt du BTRFS ein?

Paralell würde ich auch mal nen Supportfall bei Synology aufmachen,
 

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Den Support habe ich schon angeschrieben, mal schauen wann die Antworten.

Aktuell bin ich dabei die Daten von der NAS Manuell runter zu kopieren.

Leider mit leichten Hindernissen, das das einzige Volume abgestürzt ist kann ich keinerlei Änderungen mehr vornehmen, ich kann keine Software installieren und keine Benutzerrechte anpassen. Das USB Medium bekomme ich direkt an der NAS auch nicht mehr eingebunden.

Die externe USB HD ist jetzt an meinen Rechner und der Download läuft, bisher ohne Fehlermeldungen.

Da meine normallen Benutzerrechte aber nicht auf Alle Ordner Zugriff haben lade ich jetzt erstmal die runter, danach muss ich die Kollegen abklappern und an derren Rechner Ihre einzelnen Ordner NAS ordner sichern.

Ein Backup, eigentlich sind wir davon ausgegangen das wir mit 2 NAS an verschiedenen Standorten die jeweils ein RAID 10 haben sicher sind... Es gibt Teilbackups.

Die NAS Syteme sind bei uns Netzwerkspeicher aber auch gleichzeitig, der Backupspeicherort für unserer virtuellen Maschinen.
 

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.043
Punkte für Reaktionen
1.073
Punkte
194
Aber HA hat ja nun so gar nix mit Backup zu tun .

Welche IT Firma hat euch das denn so verkauft ?
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.626
Punkte für Reaktionen
2.026
Punkte
829
Um das nochmal zu unterstreichen: HA dient wie RAID primär der Verfügbarkeit. Für Datensicherheit braucht man zwingend Backups - idealerweise nach der 3-2-1(-0)-Regel.
 

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Das wird auf jeden Fall noch ein Thema sein bei uns im Hause sein... Aktuell muss ich aber erstmal schauen wie ich die Kuh vom Eis bekomme. Das gute ist bisher lassen sich alle Daten brav runterkopieren.
 
  • Like
Reaktionen: dil88

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.043
Punkte für Reaktionen
1.073
Punkte
194
Also meine Empfehlung dazu .

1. wie du ja schon machst erstmal alles sichern. Am besten auch mal sowas wie Freigaben und co aufschreiben.
2. ITler oder Fachfirma ranholen , und dann das komplette Konstruk begutachten
Vorallem Prüfen ob HA für euch wirklich notwendig ist ( das setzt selbst ich bei mir in der FIrma nicht ein )
3. dann Sauber neu aufsetzten , mit Backups und co


Und wirklich da nen Fachmann ranholen . Im Business bereich keine spiele Versuchen,.
 
  • Like
Reaktionen: ctrlaltdelete

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.420
Punkte für Reaktionen
5.650
Punkte
524
Die Aktive NAS sagt das Volume ist abgestürzt, HDs zeigen alle in Ordnung an.
Poste wenn möglich mal Screenshots vom Speichermanger, sowohl Pool als auch Volume und die SMART Werte der HDDs (siehe Signatur), manchmal werden die HDDs als ok angezeigt, sind es de facto aber nicht.
 
  • Like
Reaktionen: dil88

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Bitte sehr
 

Anhänge

  • NAS06.PNG
    NAS06.PNG
    44,9 KB · Aufrufe: 20
  • NAS01.PNG
    NAS01.PNG
    356,7 KB · Aufrufe: 20
  • NAS02.PNG
    NAS02.PNG
    17,5 KB · Aufrufe: 16
  • NAS03.PNG
    NAS03.PNG
    79,7 KB · Aufrufe: 16
  • NAS04.PNG
    NAS04.PNG
    32,6 KB · Aufrufe: 17
  • NAS05.PNG
    NAS05.PNG
    50,1 KB · Aufrufe: 19

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.420
Punkte für Reaktionen
5.650
Punkte
524
Bitte die SMART Werte aller HDDs (siehe meine Signatur) und als Code posten, damit man die Werte kopieren kann zum umrechnen, siehe Screenshot.
Wieso sind die HDDs so warm?
Welche DSM Version läuft da, weil die SMART Werte noch angezeigt werden?
Edit: Und keinen SMART Test machen, nur die Werte!!!
 

Anhänge

  • 1727271790905.png
    1727271790905.png
    93,6 KB · Aufrufe: 6

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Das ist eigentlich das Reserve System und steht im Serverraum, in dem ist es leider relativ warm, da der Server eine gute Heizung ist. Zudem ziehe ich gerade knapp 4TB an Daten von der NAS um diese zu sichern.

DSM ist 6.2.4

Was mir gerade noch aufgefallen ist, der Smart test findet immer am 26. statt. Kann ich das irgendwie unterbinden?

Falls doch die Hds beschädigt sind wäre es sicher schlecht die zu belasten.

Die Smart Werte kann ich mir zwar anzeigen lassen aber nicht kopieren, ich ahbe Screenshots für alle 4 Hds erstellt.

Ich vermute aber das es nicht die HDs sind, das bei beiden NAs Systemen innerhalb von 24 Stunden die Platten ausfallen wären schon seltsam.
 

Anhänge

  • NAS07.PNG
    NAS07.PNG
    47 KB · Aufrufe: 12
  • HD1.PNG
    HD1.PNG
    37,7 KB · Aufrufe: 13
  • HD1S2.PNG
    HD1S2.PNG
    41,3 KB · Aufrufe: 11
  • HD2.PNG
    HD2.PNG
    38,3 KB · Aufrufe: 9
  • HD2S2.PNG
    HD2S2.PNG
    40,5 KB · Aufrufe: 8
  • HD3.PNG
    HD3.PNG
    38,3 KB · Aufrufe: 8
  • HD3S2.PNG
    HD3S2.PNG
    40 KB · Aufrufe: 8
  • HD4.PNG
    HD4.PNG
    46,9 KB · Aufrufe: 8
  • HD4-2.PNG
    HD4-2.PNG
    51,1 KB · Aufrufe: 12

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.420
Punkte für Reaktionen
5.650
Punkte
524
Den SMART Test kannst du abstellen: Speichermanager, HDDs, eine HDD anklicken und Einstellungen, siehe Screenshot.
Die Mühe die SMART Wert abzutippen zum prüfen mache ich mir nicht, hier kannst du ID: 1 und 7 prüfen/umrechnen:
https://s.i.wtf/
 

Anhänge

  • 1727273578609.png
    1727273578609.png
    119,9 KB · Aufrufe: 6

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Danke,

ich habe es jetzt für alle 4 HDs geprüft die Error Rate ist 0 also auf allen Hds sind bisher keine Fehler aufgetraten in der aktiven NAS.
 
  • Like
Reaktionen: ctrlaltdelete

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.043
Punkte für Reaktionen
1.073
Punkte
194
welches Dateisystem hast nun eigentlich im Einsatz?

Und hat der Support sich schon mal gemeldet?
 

patrickn

Benutzer
Sehr erfahren
Mitglied seit
07. Apr 2016
Beiträge
738
Punkte für Reaktionen
288
Punkte
83
"In Ordnung"
"Das Laufwerk ist fehlerhaft"

Wenn's nicht so traurig wär, könnte das fast lustig sein 🤦
 

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Das Dateisystem ist Btrfs

Der Support hat einen Fernzugriff zur Diagnose gefordert, der Zugang ist eingerichtet und die Zugangsdaten übermittelt.

Jetzt warte ich auf Rückmeldung.
 

metalworker

Benutzer
Sehr erfahren
Mitglied seit
25. Apr 2023
Beiträge
3.043
Punkte für Reaktionen
1.073
Punkte
194
Da könnte man zur Not auch über die Konsole was retten.

Braucht ihr das HA denn wirklich?
sonst könntest ja ein NAS nehmen , sauber neuinstallieren ,und dann die Daten zurück sichern
 

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Brauchen ist das falsche Wort, wir möchten das HA, von dem Ausfall sollen die normallen Nutzer eigentlich nichts mitbekommen, automatisch umschalten und es läuft weiter.

Dazu doppelte Sicherheit gegen Hardwareausfälle.

Das trotzdem externe BAckups nötig sind, da muss ich unsere Geschäftsführung noch von überzeugen.

Die letzten Jahre lief es einfach ohne irgentwelche Mucken zu machen.

Jetzt haben wir hier vemrmutlich ein Softwareproblem, ich hoffe das Synology das Problem beheben kann.

Wenn die Backups durch sind wollte ich mal die Reaparatur starten bzw wieder auf die eigentliche Hauptnas zurück wechseln.

Läuft es dann ohne Fehler würde ich die Updates einleiten damit alles aktuell ist.
 

private2024

Benutzer
Mitglied seit
25. Sep 2024
Beiträge
10
Punkte für Reaktionen
2
Punkte
3
Leider hat Synology immer noch keine Zeit gefunden auf unsere NAS zu schauen... von dem Support von Synology selbst sind wir ziemlich enttäuscht.

Da die Backups inzwischen durch sind, setzen wir es jetzt komplett neu auf.

Also eine NAS haben wir jetzt erstmal resetet inkl. Volumes und Raid gelöscht, aktualisiert und sind gerade dabei die Dateien zurückzuspielen. Danach heißt es dann alle Freigaben wieder herstellen auf die einzelnen Ordner.

Ob wir das High Avaiblity Cluster wieder nutzen möchten, da sind wir uns auch nicht sicher. Wenn ein Volume abstürzt darf der Fehler doch nicht einfach repliziert werden und somit auch die reserve ausgeschaltet.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat