Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Hallo liebe Synology Community,
ich habe seit 2-3 Wochen mit dem mittlerweile dritten Festplattenauswurf meines Verbunds zu kämpfen und eventuell gibt es jemanden mit ähnlichen Erfahrungen oder mehr Know How für ein weiteres Vorgehen.

Vorneweg:
Modell: DS1821+
DSM: DSM 7.2.1-69057 Update 3
Festplatten: 3x Seagate ST18000NM00J 5x Seagate ST18000NM003D
Raid 6 über alle Platten
Permanente Dienste und Nutzung des Verbunds - Plex, Storj, Nextcloud, Synology Photo, Backupserver alle Clients im Haus, Surveillance Station

Mittlerweile sind Laufwerk 5 - 3 - 1 als kritisch und zu wechseln markiert worden binnen 3 Wochen.

Ob es ein Zufall ist das es nur die 000J Modelle betrifft, kann ich nicht sagen.
Die Festplatten kommen nicht aus gleicher Charge, ich kaufe eigentlich nie mehr als 2 Platten Pro Bestellung bzw Hersteller.

Die Laufzeiten sind 14K H was m.M keine große Leistung für 24/7 Festplatten sind. Die Nas steht auch trocken und Kühl.
die 2 anderen Festplatten wurden von Seagate Anstandslos getauscht, ich habe daraufhin refurbished Ersatz erhalten, welche ich verkauft habe um mir Originale zu kaufen.

Es ist noch ein Backup Offline auf 20TB Platten im Schrank.

Ich frage mich jetzt wirklich wie ich dam dümmsten vorgehe. Diesen FLickenteppich von Festplatten und dieser Gewohnheit wöchentlich zu degraden vertraue ich nun wahrlich nicht mehr so.
Ich überlege jetzt den Verbund auszutauschen was natürlich im großen und ganzen ein Invest von 2500€ wären. Ich würde dann wieder zu Toshiba wechseln mit denen habe ich jahrelang nur gute Erfahrungen gemacht. WD ist mir einfach zu teuer und Seagate naja..Seagat eist tatsächlich der einzige Hersteller, bei dem mir Platten wirklich gestorben sind. Alle anderen Hersteller liefen bs zum Tausch des Verbunds, was bei mir in der Regel alle 3 Jahre stattfindet.
Mein Arbeitskollege (Arbeite als Sysadmin) vermutet Das Raid 6 bzw das auf der NAS laufende STORJ Projekt belastet den Verbund wohl zu stark weil hier ja keine Leerlaufzeiten existieren sondern eben ein kontinuierlicher Datenstrom geschrieben und gelesen werden muss. Ich denke mir..das ist eine 1000€ NAS mit 2800€ "Enterprise" platten..was sollen die denn bitte können außer arbeiten..dafür wurden Sie gebaut.

Es sind 85TB belegt, 35TB brauche ich zwingend mit 10-15TB Puffer. Also ca 45-50TB Netto Kapazität.
Mein Plan wäre folgender - Mein favorit wären die Toshiba Cloud Scale 20TB - davon 4 Stück für einen Raid 5 für alle Dienste außer Storj, da hier immer mal Lastpausen existieren und Raid 6 auzuschließen? Dann würde ich alle verbleibenen Festplatten veräußern und einen weiteren Raid 5 mit 4 Platten aufziehen für Storj und Backups..also nicht ganz so essentielle Daten, die aber permanent den Verbund belasten.

Was haltet ihr davon?
Habt irh ähnliche Erfahrungen gemacht mit bestimmten Herstellern?
Gibt es vllt Anregungen oder Vorschläge wie Ihr das machen würdet?

Mfg
 

Anhänge

  • 2024-06-25_06h25_40.png
    2024-06-25_06h25_40.png
    25,5 KB · Aufrufe: 28

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.694
Punkte für Reaktionen
2.104
Punkte
829
Was Du beschreibst, ist sehr frustrierend. Dennoch würde ich persönlich abwarten, bis eine ST18000NM003D Probleme macht, bevor ich mir Gedanken über eine Tabula-Rasa-Aktion machen würde. Vielleicht war es das jetzt ja und der Rest der Platten läuft so, wie ich es eigentlich erwarten würde. Denn Du hast aus meiner Sicht völlig recht, dass Deine Exos X Enterprise-Platten für Deine Last ausgelegt sein sollten. Sind die ST18000NM003D jüngeren Datums mit geringerer Laufzeit? Diesen Plattentyp gibts ja auch schon seit gut zwei Jahren.
 
  • Like
Reaktionen: Benie

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
4.160
Punkte für Reaktionen
2.178
Punkte
289
Bitte SMART-Werte auslesen und hier posten, keinen Test machen.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
Das ist ein ganz normales Szenario, was du beschreibst, die Last für die HDDs ist mormal. Entweder Pech oder Transportschäden, die jetzt erst auftreten.
 
  • Like
Reaktionen: maxblank

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
4.160
Punkte für Reaktionen
2.178
Punkte
289

geheim5000

Benutzer
Mitglied seit
27. Dez 2018
Beiträge
435
Punkte für Reaktionen
65
Punkte
28
Ich habe die Erfahrungen aktuell genau andersrum, meine Seagate laufen und laufen.

Dafür ist eine N300 gestorben, und zwar einfach tot. Wird nirgends mehr erkannt.
 

Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Smart muss ich nachreichen...hab kurz überflogen und gesehen da kommt irgendwas mti CLI und SSH, das muss ich erst alles freischalten usw. Heute Abend wenn ich dazu komme. Danke im Vorraus.
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
Geht auch über den Aufgabenplaner.
 

Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Stimmt, super soweit habe ich nicht überflogen :)
hier mal HDD 1 und 2.
 

Anhänge

  • smartctl 6.5 (build date Sep 26 202.txt
    8,1 KB · Aufrufe: 18

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
Die sind beide unauffällig.
 

Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Ich habe schon überlegt ob ich besagte Platte raushole, formatiere, extern prüfe und wieder einsetze.
Die Platte davor war auch noch "In Ordnung" laut Tools wie Crystaldiskmark usw.
Ich kenne mich jetzt nicht im Detail aus bei welchen Triggern DSM eine Platte als Kritisch ansieht oder gar aus dem raid entfernt, jedoch sehe ich keine ins Auge fallende Möglichkeiten hier etwas zu reparieren wie in anderen threads mit gleicher Fehlermeldung
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
  • Like
Reaktionen: DaveR

Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Also..das erste was mich stutzig macht, die Serienummer ist nicht korrekt vom gefundenen Critical.

Ausgeführt - es wird kein Critical mehr erkannt, sicherheitshlaber NAS neu gestartet. Fehler ist nach wie vor Kritisch HDD 1.
Kann ich eigentlich irgendwo schnell erkennen ob die Platte jetzt wirklich aus dem Verbund geworfen wurde oder es das nur ein Hinweis...ich solle die Platte tauschen bevor etwas passieren könnte.
 

Anhänge

  • 2024-06-25_18h54_37.png
    2024-06-25_18h54_37.png
    36,1 KB · Aufrufe: 17

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
Poste doch mal die restlichen SMart Werte
 

Agoraphobie

Benutzer
Mitglied seit
18. Nov 2022
Beiträge
26
Punkte für Reaktionen
7
Punkte
53
Hier sind alle 8 Platten, ich muss mir gleich nochmal den SMART Thread genauer durchlesen wie genau man die Werte liest und versteht.
 

Anhänge

  • smartctl 6.5 (build date Sep 26 202.txt
    32,1 KB · Aufrufe: 7

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
4.160
Punkte für Reaktionen
2.178
Punkte
289
Also..das erste was mich stutzig macht, die Serienummer ist nicht korrekt vom gefundenen Critical.

Im Zweifelsfall die Seriennummer der fehlerhaft angegebenen HDD in DSM notieren, NAS ausschalten (vom Strom trennen), HDDs nacheinander ziehen und nach der notierten SNR. suchen.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.694
Punkte für Reaktionen
2.104
Punkte
829
Solange die SMART-Werte 1a sind, ist das eine sehr gute Frage. Mir ist bei einigen dieser Berichte hier im Forum nicht klar, warum Synology dort Platten aus einem Speicherpool geworfen hat.
 
  • Like
Reaktionen: ctrlaltdelete

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.648
Punkte für Reaktionen
5.820
Punkte
524
Ja, diese Frage kommt mittlerweile auf.
 

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
4.160
Punkte für Reaktionen
2.178
Punkte
289
Gab es nicht mal die Info, dass Synology manche Festplatten, die älter als 3 Jahre sind, als fehlerhaft markiert?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat