Performanceproblem nach HDD-Upgrade (DS218play)

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich habe eine Diskstation 218play, verbunden via GB-Ethernet mit Clients.
Bay 1: Ironwolf 3TB, Bay 2 (neu): Ironwolf 8TB.
Das NAS ist nur ein Datengrab, braucht weder besondere Performance noch zusätzliche Datensicherheit. Lief bisher mit der HDD aus Bay 1, jetzt eben weil mehr Platz benötigt eine weitere Platte dazu.

Von einem Windows Client aus bekomme ich bei manuellen Aktionen mit großen Dateien 110MBps hin, trotz verschlüsseltem Share. Und zwar auf /beiden/ HDDs, völlig gleich.

Mit dem Windows Command Line Kommando "robocopy" halte ich zwei Verzeichnisbäume synchron. Quelle auf einem PC, Ziel auf dem NAS. Beim größten synchronisierten Ast reden wir über 190.000 Dateien, 4000 Ordner und 650GB. Dateiengröße von wenige kB bis zu mehreren hundert MB.

Problem: als das Ziel auf der 3TB HDD lag, dauerte die Operation 90 Sekunden. Dieses Ziel habe ich auf dem Synology auf die neue HDD2 verschoben. Jetzt liege ich im Bereich von >20 Minuten für die exakt gleiche Operation. Woran kann das liegen? Irgendeine Idee?

Beide HDDs sind als ext4 formatiert. Jeweils ein eigenes Volume/Pool. Einziger Konfigurationsunterschied: HDD1 hatte ich damals versehentlich als "SHR" konfiguriert. Und das Synology OS liegt ebenfalls auf HDD1.

Beim Festplattenupgrade wurde das System rebootet. Installierte Pakete werden bei mir automatisch aktualisiert. File Station 1.2.7.-0285 ist aktuell drauf. Kann beim Reboot eine neue Version installiert worden sein, die mit vielen (kleinen) Dateien Performanceprobleme hat? Sonst fällt mir nichts mehr ein ... :(
 

McFlyHH

Benutzer
Mitglied seit
02. Jan 2014
Beiträge
427
Punkte für Reaktionen
82
Punkte
28

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Läuft vielleicht eine Indizierzung oder dergleichen? Wie sehen die Systemressourcen aus, wenn du kopierst/synchronisierst?
 
  • Like
Reaktionen: bfly

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Das ist schon mal falsch, das DSM (OS) liegt immer auf allen Platten als Raid 1!

Ich weiss zwar nicht, wie DSM als RAID 1 auf nur einer Platte im bisherigen System liegen konnte; und kann mir schwer vorstellen, wie es ein RAID 1 im neuen Setup neben der für mich sichtbaren Konfiguration (2 HDDs = zwei einzelne Volumes) geben soll, aber ... gut. Inwiefern sollte das Auswirkungen auf mein Problem haben?

Läuft vielleicht eine Indizierzung oder dergleichen? Wie sehen die Systemressourcen aus, wenn du kopierst/synchronisierst?


Nein, es läuft keine Indizierung. Systemressourcen aus dem Ressourcenmonitor:
idle: CPU 1-12%, RAM 26%
Während Robocopy (Win 10 Command Line): CPU 1-19%, also gleich. Speicher wie festgenagelt auf 26%. LAN: ca. 400kB/s
Während ich eine einzelne 9GB Datei per CIFS (Win 10 Explorer) auf HDD2 oder HDD1 kopiere: CPU bis 35%, LAN: ca. 90-120MB/s
Beide Kopiervorgänge vom gleichen Quellrechner, gleiches LAN.

Nochmal getestet: Robocopy auf dem großen Datenberg (siehe oben): 19min54sec (Quelle und Ziel waren synchron, also nur Vergleich). Das hat früher zwischen 2 und 3 Minuten gedauert. Entspricht rund Faktor 8. Faktor 8 ist ungefähr Gigabit Ethernet zu Fast Ethernet.

Bin ein wenig verwirrt; vor allem wegen der LAN-Performance. Wie gesagt, bisher überhaupt kein Thema, das exakt gleiche Robocopy Script hat performed. Bin schon am Überlegen, den betroffenen Robocopy-Bereich auf HDD1 zurückzuverschieben und nochmal zu testen, ob's jetzt dort immer noch performant ist. Verschieben dauert rund 5 Stunden und kann overnight passieren. Bevor ich das tue: gibt's noch Ideen?



Dankeschön für die Rückmeldungen!


(*) Die Dauerlast auf HDD1 ist schon seit 3 Jahren unverändert. Sie hat bisher die Robocopy Vorgänge nicht beeinflusst, solange die Daten auf HDD1 waren.
 

Benares

Benutzer
Sehr erfahren
Mitglied seit
27. Sep 2008
Beiträge
13.803
Punkte für Reaktionen
3.761
Punkte
468
Mmh, nutzt die neue HDD evtl. SMR? War schon oft genug ein Thema hier.
 
  • Like
Reaktionen: bfly

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Ironwolf 8TB sollte kein SMR haben (laut webpage Seagate), das war auch mein erster Gedanke. Aber vielleicht ist sie defekt? Hat schon ein paar defekte Sektoren...
Man könnte sich noch die Auslastung resp. I/O Werte im Ressourcenmonitor ansehen, während eines Kopierjobs.
 
  • Like
Reaktionen: bfly

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Unlustig! Habe den Datenberg über Nacht zurück auf HDD1 verschoben, vorhin neu getestet - HDD1 leider auch inperformant, und zwar auf dem gleichen Niveau wie HDD2 bis gestern. Jetzt bin ich noch ratloser. Immerhin weiss ich nun, daß die neue HDD nicht das Performance-Bottleneck ist. Netzwerkeinstellungen Synology (an dem ich /nichts/ geändert habe)? Netzwerkeinstellungen Windows Client (an dem ich /nichts/ geändert habe)? Beide Systeme haben nur die normalen Herstellerupdates gemacht, das Windows 10 Professional System genauso wie die Synology.

IOPS-Test gemacht: IOPS lesend schwankt zwischen 200 und 500/s, Mittelwert um 300.

Irgendwie habe ich das Netzwerk im Verdacht. Nochmal: große Dateien per Windows Explorer über CIFS geht mit >100MBps, dauerhaft und reproduzierbar. Die Netzwerkeinstellungen geben grundsätzlich also GB Ethernet voll her. MTU auf beiden Systemen 1500, dazwischen liegt nur ein Switch, kein Router. Und das Netzwerkkabel geht durch eine APC USV (spezifiziert auf 1GBps), jedoch in exakt unverändertem Setup und das nun seit fast 2 Jahren. Kabel wurden ebenfalls keine getauscht, alles seit Monaten gleich.

Hat noch jemand eine Idee?
 

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Gemacht. Ca. 10% schneller. IOPS zwischen 100 und 500, Netzwerk um 200kBps, CPU und RAM deutlich unter 50%. Also faktisch keine Änderung zu bisher.
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.033
Punkte für Reaktionen
1.615
Punkte
308
Dann schaue doch mal im Resourcenmonitor auf die Auslastung von Volumen und Disks. Eines von beiden ist da sicherlich am Anschlag. Und wenn dir die IOPS zu niedrig sind, für mehr brauchst du SSDs.
 

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Ressourcenmonitor: Datenträger 28% ud Disks 45% während Robocopy.
Benutzter Platz auf den HDDs: aktuell 70% von HDD1 (weil zurückkopiert) und 8% von HDD2. Vor dem Zurückkopieren beide ca. bei 22%.

Und nein, SSDs haben nichts mit der Lösung meines Problems zu tun. Ich nutze besagtes Robocopy-Script mit der existierenden HDD1 schon seit gut 3 Jahren, von 3 unterschiedlichen Quellrechnern und lag immer in einem Performancebereich von ca. Faktor 8. Ohne SSDs. SSDs würde ich überlegen, wenn ich mehr als GBEthernet verwenden würde; bisher genügt(e) die Performance jedoch völlig. Dein Tip ist generell gut und richtig, nur hier eben nicht zielführend. Auf das NAS wird so gut wie nie von mehr als einem Client zugegriffen; bei Volllast ist derzeit auch das GBEthernet der Flaschenhals (110MBps netto ist trotzdem ein sehr guter Wert).
 

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.033
Punkte für Reaktionen
1.615
Punkte
308
Ich wollte keineswegs dein Problem mit einer SSD erschlagen. Wobei unklar ist, ob das geklappt hätte. Vermutlich nicht, denn weder Disks, Volumen, RAM und CPU des NAS sind am Anschlag. Das Netzwerk schafft mit großen Dateien auch das was es soll. Da muss das Problem wo anders liegen. Schon mal probiert, ob du das Problem auch mit anderen Geräten hast? Vielleicht ist das NAS und Netzwerk gar nicht das Problem.
 

bfly

Benutzer
Mitglied seit
11. Nov 2012
Beiträge
23
Punkte für Reaktionen
0
Punkte
1
Schon mal probiert, ob du das Problem auch mit anderen Geräten hast? Vielleicht ist das NAS und Netzwerk gar nicht das Problem.

Eine durchaus praktikable Idee, die allerdings ein wenig Zeit braucht. Ich könnte so ein robocopy-Archiv woanders installieren und nochmal testen. Muss mal gucken, was ich noch an Clients rumliegen habe, die sicher performant genug sind. Mache ich, danke. Rückmeldung folgt.

Ganz sicher ist es kein Netzwerkkabel, nicht der Switch und nicht die zwischengeschaltete APC.

Meine Idee ist aktuell: Irgendeine bescheuerte Netzwerkeinstellung an einem der beiden Geräte ist schuld, und die ist fritte seit letztem Systemupdate. Vieleicht stelle ich MTU mal auf Jumbopakete um und schaue nochmal. Ob Windows 10 oder DSM... keine Ahnung. Meine Zeiten als Sysop sind 20 Jahre her, ich bin heute eher User und manchmal eben auch hilflos :)
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat