Hyper Backup Hyper Backup hängt ewig DS dann irgendwann kaum nutzbar

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Mist. Jetzt wird es ernst.

Nach Reboot kann ich mich an der Oberfläche anmelden, im Tray läuft die Datenbereinigung auf beiden Volumes. Ich kann nichts starten, es erscheint kein Fenster. CPU ist auf 92%. Nach ein paar Minuten werde ich wieder ausgeloggt und das Spiel beginnt vorn vorne.

Verbindung über SMB geht nicht.

Verbindung über SSH scheitert auch nach kurzer Zeit (broken pipe).

Nach einiger Zeit macht die DS einen Reboot. Hoffentlich kein Bootloop.

Das kann ja noch lustig werden.

EDIT: Nach ein paar Zyklen scheint es jetzt wieder besser zu gehen. Ich habe zwar Backups, aber ich kopiere erst einmal die wichtigsten Daten woanders hin.
 
Zuletzt bearbeitet:

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Nochmals ich.

Hat jemand eine Idee, wie ich herausfinden kann, an welcher Stelle (Datei) die Datenbereinigung hängt? Das passiert nun erneut und zwar wieder ungefähr an der selben Prozentzahl.
 

Rotbart

Benutzer
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.692
Punkte für Reaktionen
618
Punkte
134
Wenn du deine Ordner einzeln wegkopierst sollte bei einem ein Lesefehler auftauchen.Ich würde die Daten sichern und das Volume neu formatieren.
 
  • Like
Reaktionen: ottomane

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Ich glaube, ich habe einen Ordner gefunden, der fehlerhaft ist. Ich kann ihn nicht kopieren. Sobald ich ihn einmal angeklickt habe, bekomme ich diverse Probleme und muss hart neu booten.
 

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Mannmannmann. Nach einem weiteren Hänger steckt die DS nun in einem Bootloop fest. WTF.

Fast 10 Jahre hatte ich kein echtes Problem mit der DS213+. Die DS920+ nun mit dem ja eigentlich guten Btrfs und SRH-RAID1 macht schon nach ein paar Monaten diesen massiven Ärger. Habe ich mir den mit DSM 7 eingefangen? Nutzungsszenario ist praktisch identisch.

Ich baue jetzt den RAM aus. Verzweiflung macht sich breit.
 

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Sorry, dass ich hier immer wieder poste.

Gerade bin ich nach ca. 15 Boots plötzlich ins System gekommen und kopiere gerade wieder Daten in Sicherheit.

Jetzt sehe ich zwei Optionen:

1) Wenn die DS nicht beim Datenretten erneut abstürzt, kann ich aus dem laufenden System heraus das problematische Volume neu formatieren. Das wäre gut.

2) Wenn die DS wieder abschmiert und erneut in ein Bootloop verfällt -- bleibt dann nur der Weg über die DSM-Neuinstallation per Reset-Knopf?
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
Was hindert dich daran die Details der SMART-Werte zu posten?
 

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Der ewige Kampf zwischen Bootloops und Datensichern. Aber hier sind sie: (sata1/2 sind WD-HDDs, sata3/4 SSDs).

Code:
sata1
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   178   175   021    Pre-fail  Always       -       6058
  4 Start_Stop_Count                                                 0x0032   098   098   000    Old_age   Always       -       2930
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   040   040   000    Old_age   Always       -       44290
 10 Spin_Retry_Count                                                 0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   098   098   000    Old_age   Always       -       2152
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       177
193 Load_Cycle_Count                                                 0x0032   200   200   000    Old_age   Always       -       2870
194 Temperature_Celsius                                              0x0022   119   116   000    Old_age   Always       -       31
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   199   000    Old_age   Always       -       92
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged


sata2
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate                                              0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time                                                     0x0027   179   176   021    Pre-fail  Always       -       6008
  4 Start_Stop_Count                                                 0x0032   099   099   000    Old_age   Always       -       1621
  5 Reallocated_Sector_Ct                                            0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate                                                  0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   068   068   000    Old_age   Always       -       23902
 10 Spin_Retry_Count                                                 0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count                                          0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count                                                0x0032   100   100   000    Old_age   Always       -       154
192 Power-Off_Retract_Count                                          0x0032   200   200   000    Old_age   Always       -       74
193 Load_Cycle_Count                                                 0x0032   193   193   000    Old_age   Always       -       22762
194 Temperature_Celsius                                              0x0022   118   109   000    Old_age   Always       -       32
196 Reallocated_Event_Count                                          0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector                                           0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable                                            0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count                                             0x0032   200   199   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate                                            0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged


sata3
SMART Attributes Data Structure revision number: 4
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct                                            0x0032   100   100   ---    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   100   100   ---    Old_age   Always       -       3475
 12 Power_Cycle_Count                                                0x0032   100   100   ---    Old_age   Always       -       161
165 Total_Write/Erase_Count                                          0x0032   100   100   ---    Old_age   Always       -       12386444
166 Min_W/E_Cycle                                                    0x0032   100   100   ---    Old_age   Always       -       1
167 Min_Bad_Block/Die                                                0x0032   100   100   ---    Old_age   Always       -       57
168 Maximum_Erase_Cycle                                              0x0032   100   100   ---    Old_age   Always       -       3
169 Total_Bad_Block                                                  0x0032   100   100   ---    Old_age   Always       -       337
170 Unknown_Marvell_Attr                                             0x0032   100   100   ---    Old_age   Always       -       0
171 Program_Fail_Count                                               0x0032   100   100   ---    Old_age   Always       -       0
172 Erase_Fail_Count                                                 0x0032   100   100   ---    Old_age   Always       -       0
173 Avg_Write/Erase_Count                                            0x0032   100   100   ---    Old_age   Always       -       1
174 Unexpect_Power_Loss_Ct                                           0x0032   100   100   ---    Old_age   Always       -       62
184 End-to-End_Error                                                 0x0032   100   100   ---    Old_age   Always       -       0
187 Reported_Uncorrect                                               0x0032   100   100   ---    Old_age   Always       -       0
188 Command_Timeout                                                  0x0032   100   100   ---    Old_age   Always       -       0
194 Temperature_Celsius                                              0x0022   071   038   ---    Old_age   Always       -       29 (Min/Max 16/38)
199 SATA_CRC_Error                                                   0x0032   100   100   ---    Old_age   Always       -       0
230 Perc_Write/Erase_Count                                           0x0032   001   001   ---    Old_age   Always       -       28 10 28
232 Perc_Avail_Resrvd_Space                                          0x0033   100   100   004    Pre-fail  Always       -       100
233 Total_NAND_Writes_GiB                                            0x0032   100   100   ---    Old_age   Always       -       1597
234 Perc_Write/Erase_Ct_BC                                           0x0032   100   100   ---    Old_age   Always       -       2088
241 Total_Writes_GiB                                                 0x0030   253   253   ---    Old_age   Offline      -       1832
242 Total_Reads_GiB                                                  0x0030   253   253   ---    Old_age   Offline      -       9019
244 Thermal_Throttle                                                 0x0032   000   100   ---    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged


sata4
SMART Attributes Data Structure revision number: 4
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME                                                   FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct                                            0x0032   100   100   ---    Old_age   Always       -       0
  9 Power_On_Hours                                                   0x0032   100   100   ---    Old_age   Always       -       3475
 12 Power_Cycle_Count                                                0x0032   100   100   ---    Old_age   Always       -       161
165 Total_Write/Erase_Count                                          0x0032   100   100   ---    Old_age   Always       -       12451980
166 Min_W/E_Cycle                                                    0x0032   100   100   ---    Old_age   Always       -       1
167 Min_Bad_Block/Die                                                0x0032   100   100   ---    Old_age   Always       -       170
168 Maximum_Erase_Cycle                                              0x0032   100   100   ---    Old_age   Always       -       3
169 Total_Bad_Block                                                  0x0032   100   100   ---    Old_age   Always       -       438
170 Unknown_Marvell_Attr                                             0x0032   100   100   ---    Old_age   Always       -       0
171 Program_Fail_Count                                               0x0032   100   100   ---    Old_age   Always       -       0
172 Erase_Fail_Count                                                 0x0032   100   100   ---    Old_age   Always       -       0
173 Avg_Write/Erase_Count                                            0x0032   100   100   ---    Old_age   Always       -       1
174 Unexpect_Power_Loss_Ct                                           0x0032   100   100   ---    Old_age   Always       -       62
184 End-to-End_Error                                                 0x0032   100   100   ---    Old_age   Always       -       0
187 Reported_Uncorrect                                               0x0032   100   100   ---    Old_age   Always       -       0
188 Command_Timeout                                                  0x0032   100   100   ---    Old_age   Always       -       0
194 Temperature_Celsius                                              0x0022   071   037   ---    Old_age   Always       -       29 (Min/Max 15/37)
199 SATA_CRC_Error                                                   0x0032   100   100   ---    Old_age   Always       -       0
230 Perc_Write/Erase_Count                                           0x0032   001   001   ---    Old_age   Always       -       28 10 28
232 Perc_Avail_Resrvd_Space                                          0x0033   100   100   004    Pre-fail  Always       -       100
233 Total_NAND_Writes_GiB                                            0x0032   100   100   ---    Old_age   Always       -       1596
234 Perc_Write/Erase_Ct_BC                                           0x0032   100   100   ---    Old_age   Always       -       2088
241 Total_Writes_GiB                                                 0x0030   253   253   ---    Old_age   Offline      -       1832
242 Total_Reads_GiB                                                  0x0030   253   253   ---    Old_age   Offline      -       1409
244 Thermal_Throttle                                                 0x0032   000   100   ---    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

Ich hatte ja schon oben was zu den eigentlich in der Momentaufnahme auffälligen Werten der HDDs gesagt. Die sind allesamt seit Einbau stabil und lagen m.E. an der Schnittstelle des alten NAS.


Aktuelles Problem ist, dass ich weder Volume 2 noch Speicherpool 2 entfernen kann. Dort befinden sich m.M.n. die Fehler. Das Kopieren bestimmter Ordner von diesem Volume führt zu einer Blockierung des Systems. Aber das Entfernen im Speicher-Manager wird nie beendet.

Was kann ich da tun? DSM neu zu installieren behebt die Fehler ja auch nicht.
 
Zuletzt bearbeitet:

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
SATA1 ID:199 wäre für mich Grund zur Sorge und Anlass zum Tausch
Was steht im Speichermanager ->HDD/SSD-> Protokoll?
 
  • Like
Reaktionen: ottomane

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
SATA1 ID:199 wäre für mich Grund zur Sorge und Anlass zum Tausch
Ja, das ist nicht schön. Seit Umbau im April ist der Wert konstant. Die Werte sind in einem anderen NAS entstanden. Ich habe das seinerzeit auf ein generelles Problem Synology/WD geschoben, nachdem ich dazu viel recherchiert hatte.

Was steht im Speichermanager ->HDD/SSD-> Protokoll?

Das Protokoll ist leer.

Danke für deine Hilfe!
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
Und bei den beiden SSDs SATA3/4: 169 Total_Bad_Block, ist das normal bei SSDs?
Edit: Was mich wundert das du keine Einträge im Speichermanager Protokoll hast.
 

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Und bei den beiden SSDs SATA3/4: 169 Total_Bad_Block, ist das normal bei SSDs?
Zum Teil haben die das wohl ab Werk. Manche Hersteller verbergen den Wert, manche geben ihn an. Das sind Zellen, die schon im Neuzustand defekt sind. Der Wert ist seit Tag 1 so.

Das Log ist leer, weil ich in diesem NAS nie Fehler mit den HDDs hatte. Im alten NAS, wo die Platten zuvor liefen, finden sich entsprechende Einträge z.B. wegen der Schnittstelle der WDs. Vielleicht war es tatsächlich der Stecker.
 

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Im Moment weiß ich echt nicht konstruktiv weiter.

Ich könnte DSM neu installieren und hoffen, dass dabei auch die Volumes gelöscht werden können. Oder ich lösche die HDDs vorher am PC. Oder ich ziehe einfach mal eine aus dem SHR-Verbund heraus und schaue, was passiert. Oder ich entferne beide und schaue dann erst einmal, wie das System dann nur mit den SSDs läuft. Oder ich kaufe einfach 2 neue HDDs und haue die da rein und gut ist. Vielleicht.

Blöd ist nur, die Ursache für das Schlamassel nicht zu kennen. Ich würde dann alles neu aufbauen und nächste Woche geht der Mist von vorne los?
 
Zuletzt bearbeitet:

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
Ist denn die Datenbereinigung auf Volume 2 durchgelaufen?
Kannst du die Platten ausserhalb der DS mit Herstellertools überprüfen, ggf. erweiterten SMART Test machen?
Hast du denn die Backup Jobs mal neu angelegt?
Ticket bei Synology eröffnet?
Auf welchem Volume ist das Paket Hyperbackup installiert?
Ich tippe auf einen Fehler der HDD/SSD
 
  • Like
Reaktionen: ottomane

ottomane

Benutzer
Mitglied seit
04. Sep 2012
Beiträge
315
Punkte für Reaktionen
4
Punkte
18
Ist denn die Datenbereinigung auf Volume 2 durchgelaufen?
Nein. Die bleibt immer stehen und wenn das passiert, blockieren diverse Verzeichnisse und Dienste. Dann hilft nur noch harter Reboot.

Kannst du die Platten ausserhalb der DS mit Herstellertools überprüfen, ggf. erweiterten SMART Test machen?
Hm, das wird schwierig, ist aber möglich. Vielleicht heute Abend oder morgen (habe selbst nur Macs, müsste ext. Gehäuse freischaufeln).

Hast du denn die Backup Jobs mal neu angelegt?
Nein, die sind derzeit alle abgeschaltet, aber noch da. Der letzte Versuch, einen zu löschen führte zu einer weiteren Systemblockade. Auch ohne Durchführung von Backups tauchen diese Blockaden leider auf. Meist im Zusammenhang mit bestimmten Verzeichnissen oder Festplattenoperationen. Scheint also kein Problem speziell von HyperBackup zu sein.

Ticket bei Synology eröffnet?
Noch nicht. Ich verspreche mir davon nicht viel, aber was kann es schon schaden. Danke für die Erinnerung.

Auf welchem Volume ist das Paket Hyperbackup installiert?
Vermutlich Volume 1, also das, was scheinbar problemlos ist. Wenn man es wählen kann, ist es auf 1 wegen der schnelleren SSDs. Ich kann gerade nicht nachsehen, da ich einen Speichertest laufen habe.

Ich tippe auf einen Fehler der HDD/SSD
Ja, allmählich scheint es darauf hinauszulaufen, aber eher nach Indizien und weniger nach Beweislage ;) Irritierend ist, dass nirgendwo, selbst in den Syslogs usw. ein wirklicher Hinweis auf Plattenprobleme zu finden ist. Vielleicht ist auch die Syno selbst hinüber.

Insofern wäre der externe Test sehr sinnvoll.

Danke für Deine Geduld!


Was passiert, wenn ich die schlechtere der beiden HDDs einfach entferne? Dann sollte sich das System doch *eigentlich* normal verhalten, wenn die die Ursache ist, oder?
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
Nichts, du hast dann ein degraded SHR/Raid und die DS piepst, kann man aber abstellen. Allerdings VORSICHT, nach dem wiedereinsetzen der HDD/SSD musst du erst das SHR/RAID syncen/reparieren, nicht gleich danach die 2. HDD/SSD ausbauen, weil dann ist es vorbei.
Aber da die Datenbereinigung auf Speicherpool 2 nicht durchläuft, denke ich liegt hier das Problem.
Wenn der Speichertest durch ist, schau doch mal im Protokollcenter was bei Such: data scrubbing angezeigt wird?
 
  • Like
Reaktionen: ottomane

RSfuchs

Gesperrt
Mitglied seit
25. Mai 2017
Beiträge
391
Punkte für Reaktionen
29
Punkte
28
Es ist vermutlich ein Fehler im BTRF-Dateisystem. Wenn auf eine bestimmte Datei zugegriffen wird, geht das Volume in den Schreibschutz. Solange man nicht an diese Datei(en) ran geht, ist alles ok. Bereinigung geht da natürlich nicht. Gehe nicht von einem Hardwareproblem aus.
Ich hatte sowas nicht repariert bekommen, und musste um es wegzubekommen letztendlich neu Formatieren. Leider war es ein 12TB Laufwerk :cry:
Von SHR/Synology ist ganz abzuraten, besser ZFS auf einer eigenen UNIX-NAS, dort ist sowas technologisch ausgeschlossen. Harter Reboot ist immer zu vermeiden, deswegen sollte man auch eine USV haben. Rate zum Backup zur Bare-metal Wiederherstellung, was dann aber mit der DS213+ nicht funktioniert, eine DS116 ist hier prima.
 
Zuletzt bearbeitet:

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
  • Wow
Reaktionen: RSfuchs

Rotbart

Benutzer
Sehr erfahren
Mitglied seit
04. Jul 2021
Beiträge
1.692
Punkte für Reaktionen
618
Punkte
134
Volume löschen, betreffende Platten raus,wieder rein, neuen Speicherpool erstellen, da bietet dir DSM an die Platten zu prüfen, wenn das OK ist neues Volume erstellen
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
13.658
Punkte für Reaktionen
5.832
Punkte
524
Kurze Frage, wozu die Platten raus und wieder rein?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat