Hallo!
wir haben seit kurzem zwei RS4017xs+ boxen (HA) als Backup Lösung im einsatz. Die Boxen sind mit 12 x 10 TB platten (Western Digital Gold Datacenter @ 7200 rpm) im RAID 6 bestückt und haben ein RAM upgrade auf 24 GB bekommen. Es gibt nur ein Volume, das mit btrfs formatiert wurde, compression ist eingeschaltet. Die Boxen dienen ausschließlich als Backup target für diverse Linux Server, die das Volume per NFS angebunden haben (d.h. relativ wenige, dafür große Dateien im Bereich von 100 MB bis 50 GB).
während meiner Tests, die ich tagsüber gemacht habe, war alles super - ich habe die 10 GBit interfaces ausreizen können und habe innerhalb kürzester Zeit große Datenmengen sichern können. Auch die Kompression ist besser als erwartet, bisher habe ich keinen Performance impact feststellen können und konnte den benötigten Plattenplatz auf 1/4 reduzieren (sonst hätten wir schon weitere Festplatten kaufen müssen)
ABER:
ich habe heute Nacht einen Anruf bekommen, weil unsere Backups so wahnsinnig langsam sind... ca. 15 Server haben gleichzeitig versucht ihr backup auf dem Server abzulegen, zusammen haben die Server aber nur durchschnittlich 10 MB/sekunde schreiben könnnen, was viel zu langsam ist. Als ich mich per SSH auf dem Server angemeldet habe, hat das system sehr träge reagiert, htop hat eine load von 100-120 gemeldet und im Web-UI wurde die "Utilisation" des volumes mit 100% angegeben.
kann mir jemand einen Tipp geben, woher das ganze I/O kommt? Außer dem HA Manager sind keine apps / pakete installiert, Außer NFS sind alle Protokolle zum Datentransfer abgeschaltet... und an der Last von den Servern liegt es nicht, Tagsüber kann ich das Backup (auch auf allen 15 Servern gleichzeitig) ohne Probleme starten und alles läuft mit der erwarteten Geschwindigkeit, die Load ist auch irgendwo bei 5-15 ...
so far
Benjamin
wir haben seit kurzem zwei RS4017xs+ boxen (HA) als Backup Lösung im einsatz. Die Boxen sind mit 12 x 10 TB platten (Western Digital Gold Datacenter @ 7200 rpm) im RAID 6 bestückt und haben ein RAM upgrade auf 24 GB bekommen. Es gibt nur ein Volume, das mit btrfs formatiert wurde, compression ist eingeschaltet. Die Boxen dienen ausschließlich als Backup target für diverse Linux Server, die das Volume per NFS angebunden haben (d.h. relativ wenige, dafür große Dateien im Bereich von 100 MB bis 50 GB).
während meiner Tests, die ich tagsüber gemacht habe, war alles super - ich habe die 10 GBit interfaces ausreizen können und habe innerhalb kürzester Zeit große Datenmengen sichern können. Auch die Kompression ist besser als erwartet, bisher habe ich keinen Performance impact feststellen können und konnte den benötigten Plattenplatz auf 1/4 reduzieren (sonst hätten wir schon weitere Festplatten kaufen müssen)
ABER:
ich habe heute Nacht einen Anruf bekommen, weil unsere Backups so wahnsinnig langsam sind... ca. 15 Server haben gleichzeitig versucht ihr backup auf dem Server abzulegen, zusammen haben die Server aber nur durchschnittlich 10 MB/sekunde schreiben könnnen, was viel zu langsam ist. Als ich mich per SSH auf dem Server angemeldet habe, hat das system sehr träge reagiert, htop hat eine load von 100-120 gemeldet und im Web-UI wurde die "Utilisation" des volumes mit 100% angegeben.
kann mir jemand einen Tipp geben, woher das ganze I/O kommt? Außer dem HA Manager sind keine apps / pakete installiert, Außer NFS sind alle Protokolle zum Datentransfer abgeschaltet... und an der Last von den Servern liegt es nicht, Tagsüber kann ich das Backup (auch auf allen 15 Servern gleichzeitig) ohne Probleme starten und alles läuft mit der erwarteten Geschwindigkeit, die Load ist auch irgendwo bei 5-15 ...
so far
Benjamin