RS3617RPxs HA-Cluster - Anmeldungen dauern bis zu 8 Minuten, Schwenk dauert ewig, alles langsam

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Hallo zusammen, vielleicht hat jemand einen TIpp, eine Idee, einen Rat.

Ich habe hier zwei RS3617RPxs als HA Cluster laufen. Beide Systeme verfügen über INTEL Xeon D-1521 und 16 GB RAM.
Anwendung ist Synology Drive als Cloud-Dienst für AD User.
Bedeutet, per LDAPs abgefragte AD-Benzutzerkonten dürfen sich an Drive anmelden, jedoch nicht am DSM.
Zusätzlich ist 2FA aktiv.
Für die Administration des Systems gibt es ausschließlich lokale Konten.
Bisher bin ich in der Testphase, bevor das produktiv gehen soll. Heißt, aktuell nutzen das vielleicht 10 Leute und diese auch nicht Gleichzeitig.

Nun kommt es immer wieder vor, dass der Anmeldeprozess am System komplett stecken bleibt.
Über Minuten dreht sich dann der Kreis, der 2. Faktor wird dann teils nicht mehr angenommen.
Zu Recht hagelt es deswegen Beschwerden. Ein Kollege beschreibt es so:

Name eingeben
nach 30 Sekunden Passwort eingeben
nach 40 Sekunden OTP eingeben

nach 2 Minuten ... OTP falsch nochmal
nach 4 Minuten ... Name/Passwort falsch - bitte nochmals eingeben


Mir ist das ebenfalls nun einige male passiert. Eben noch lief alles rund, dann plötzlich steckt alles fest.

Was für mich heute neu war: Auch die lokale Anmeldung auf dem DSM verhielt sich so! Habe eine Ewigkeit und viele Anläufe benötigt, um auf das NAS zu gelangen.
Auch dort, alles laggy, das Startmenü will sich nicht aufbauen, es fehlen die Icons, welche nach und nach eintrudeln.
Systemsteuerung öffnen dauert ewig. HA Manager braucht 2 Minuten zu öffnen ...
Ich habe die Systemressourcen des Knotens überprüft, aber es werden CPU Last max 10% und RAM 11% angegeben.
HDDs sind alle tutti und es gibt keine Warnungen bezüglich des Speichers. Handelt sich um je 6 WD Gold 4TB HDDs
Auch die Warteschlangen sind unauffällig. Und DataScrubbing ist auch nicht aktiv.

Ich habe dann einen Schwenk auf den anderen Knoten ausgeführt und nun geht es erstmal wieder. Den anderen Knoten dann mal neu gestartet.
Für mich schaut es so aus, als würde sich der Webserver irgendwie festfahren.

Gibt es da Erfahrungen? Insbesondere mit der Abfrage mit LDAPs? Oder liegt es ggf. am aktuellen DSM Patchlevel? Stand ist DSM 7.2.1-69057 Update 5.
 
Zuletzt bearbeitet:

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468
Mit HA kenne ich mich nicht aus, aber für mich klingt das eher nach Problemen mit einer der Platten.
Hast du mal die Smart-Werte aller Platten ausgelesen und im Laufwerks-Protokoll des Protokoll-Centers geschaut?
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Danke für Deine Antwort.
Ja, alles ist unauffällig.
Es läuft aktuell auch kein DataScrubbing.
 
Zuletzt bearbeitet:

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
4.097
Punkte für Reaktionen
2.151
Punkte
289
Protokollierung im Speichermanager mal testweise abschalten (Nutzungdetails / Analyse von Nutzungsdetails aktivieren) und dort dann den Haken raus.
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Danke für die Antwort und den Tipp.
Ich werde zusätzlich mal einen ausführlichen SMART laufen lassen, nur, um ganz sicher zu sein.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468
Nein, kein Test. Einfach mal nur die Einzelwerte auslesen (s. hier)
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Ja, das kenne ich ja. :) Aber bisher gab es nur Schnelltests, dafür habe ich einen Task geplant und da ist alles grün.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.766
Punkte für Reaktionen
3.740
Punkte
468
Die Tests sind oft noch grün, auch wenn ne Platte schon halb tot ist. An den Einzelwerten sieht man Zustand besser.
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Ja, das stimmt natürlich. Früher wurden einem diese Daten auch mal in einer Liste präsentiert ?

Aber: schon jetzt melden sich beim ausführlichen Test 2 HDDs ... Nachtigall, ick hör Dir trapsen ...

Ich beschäftige mich mit denen mal schleunigst, dann sehe ich weiter. Danke für die Hilfestellung. Falls sich da Neues ergibt, schreibe ich dazu.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.633
Punkte für Reaktionen
5.809
Punkte
524
Poste doch einfach mal die Werte.
 
  • Like
Reaktionen: Benares

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Da ich die Sorte HDD auf Halde liegen habe und der ausführliche SMART berteits nach 10% angefangen hat zu meckern, habe ich bereits kurzen Prozess mit den beiden Platten gemacht und getauscht. Rebuild #2 läuft schon.
Stehe auch aktuell im Zeitdruck wegen vieler paralleler Aufgaben. :-/
Wünsche ein schönes Wocheende.
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
In Ergänzung:

Die WD Gold 4TB HDDs stammen alle aus einem alten System und sollten aus Kostengründen als Testsystem wiederverwendet werden. Daher auch "nur" RAID 5 + Hot Spare.
Nun soll das aber alles produktiv gehen.

Da mir jetzt nun schon zwei Platten Probleme machten will ich lieber alle für den Produktivbetrieb tauschen.
Ich habe dafür inzwischen ausreichend Iron Wolf 10TB zur verfügung.
Aktuell sind 6 v. 12 Solts benutzt.

Ich sehe nun 2+1 Möglichkeiten:

1) Nach und nach jede WD Gold aus beiden Nodes entfernen und eine Iron Wolf als Ersatz einstecken, bis alle durch sind.
Das scheint mir der plausibleste Weg. Das HA Cluster macht ja auf beiden Nodes dann das Gleiche. Bedingt aber 5 Rebuilds.

2) Einen zweiten Speicherpool, gleich mit RAID 6 statt 5 erstellen und umziehen ... fände ich charmanter.
Wobei ich nicht weiß, ob ich das DSM umziehen kann?
Das ist das Entscheidende an der Idee, denn ich muss ja den Speicherpool 1 los werden.
Kann das DSM auf einen anderen Speicherpool umziehen?

3) Ich löse den HA Cluster auf, setze den 2. Node neu auf und ziehe alles um.
Dafür gibt es doch inzschen auch einen Migrations-Assitenten, wenn ich nicht irre?
Nach dem Umzug den ersten Node neu aufsetzen und HA wieder einrichten.

Herzlichen Gruß
 

Synchrotron

Benutzer
Sehr erfahren
Mitglied seit
13. Jul 2019
Beiträge
5.096
Punkte für Reaktionen
2.065
Punkte
259
Keine Ahnung mit HA.

DSM installiert sich selbst auf jedem Laufwerk selbst, in einer versteckten Partition. Es ist so lange da, wie noch ein initialisiertes Laufwerk da ist.

Die Pakete mit ihren Konfigurationen sind auf einem Volume installiert. Wird dieses Volume gekillt, sind die Pakete weg.

Man kann die Pakete umziehen. Dazu muss das neue Volume bereits verfügbar sein.

Bei mir laufen die Pakete auf dem NVME-Volume. SSDs bringen da einen netten Schub an Schwuppdizität. Bei einer xs keine Ahnung, ob das auch geht. Sonst ein RAID1 aus 2 SATA-SSDs, das tut auch.

Neu aufsetzen und umziehen ist sicher die saubere Lösung.
 

pcpanik

Benutzer
Mitglied seit
22. Jun 2015
Beiträge
96
Punkte für Reaktionen
12
Punkte
8
Danke für Deine Antwort.
Ich habe auch 2x SA3400 mit FullFlash + HDD Shelves als HA Cluster im Einsatz.
Da mache ich das ähnlich wie Du.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat