Hyper Backup Sicherungsjob hängt sich auf

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
Hallo zusammen,

Ich beobachte immer wieder einmal das sich ein Job während der Ausführung "aufhängt" Dabei geht es um einen Job der alle 4 Std ausgeführt wird und auf eine an USB angeschlossene Festplatte gesichert wird.
Wenn das passiert, geht nix mehr...selbst über HTOP nicht.

Ich kann dann nur über ssh einen shutdown -s Befehl abgeben, alle Anwendungen werden sauber geschlossen und ich kann / muss an der DS920+ den Powerbutten gedrückt halten bis diese aus geht...wenn ich dann wieder einschalte...als wenn nichts wäre...alles läuft sauber weiter...wieder für eine unbestimmte Zeit...das letzte mal am 08.01.2024 passiert und gerade eben...kann das einer nachvollziehen...eventuell bekannt diese Phänomen?

Gruß Lextor
 

Benie

Benutzer
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
6.110
Punkte für Reaktionen
2.085
Punkte
279
Poste doch mal die genaue Bezeichnung der ext. HDD und ob 3,5" oder 2,5"
 

maxblank

Benutzer
Contributor
Sehr erfahren
Mitglied seit
25. Nov 2022
Beiträge
2.611
Punkte für Reaktionen
1.307
Punkte
224
Zuletzt bearbeitet:

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 079 064 044 Pre-fail Always - 78567759
3 Spin_Up_Time 0x0003 093 093 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 131
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 092 060 045 Pre-fail Always - 1421367437
9 Power_On_Hours 0x0032 065 065 000 Old_age Always - 31509 (142 47 0)
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 129
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 070 066 040 Old_age Always - 30 (Min/Max 30/31)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 83
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 196
194 Temperature_Celsius 0x0022 030 040 000 Old_age Always - 30 (0 21 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 31500h+06m+15.332s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 310145386865
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 38413847925

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 079 064 006 Pre-fail Always - 75874729
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 73
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 080 060 045 Pre-fail Always - 110523006
9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 13019
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 59
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 066 060 040 Old_age Always - 34 (Min/Max 34/34)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 6
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 73
194 Temperature_Celsius 0x0022 034 040 000 Old_age Always - 34 (0 25 0 0 0)
195 Hardware_ECC_Recovered 0x001a 079 064 000 Old_age Always - 75874729
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 7542 (8 15 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 14520601287
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 39799305477

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 074 064 044 Pre-fail Always - 26516055
3 Spin_Up_Time 0x0003 093 093 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 160
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 093 060 045 Pre-fail Always - 2036141939
9 Power_On_Hours 0x0032 064 064 000 Old_age Always - 31771 (72 240 0)
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 158
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 072 060 040 Old_age Always - 28 (Min/Max 28/29)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 85
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 223
194 Temperature_Celsius 0x0022 028 040 000 Old_age Always - 28 (0 19 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 31761h+25m+29.125s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 312034235679
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 191292649258

smartctl 6.5 (build date Sep 26 2022) [x86_64-linux-4.4.302+] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 084 064 044 Pre-fail Always - 232213529
3 Spin_Up_Time 0x0003 093 093 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 174
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 093 060 045 Pre-fail Always - 1839818005
9 Power_On_Hours 0x0032 064 064 000 Old_age Always - 31769 (6 142 0)
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 165
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 070 058 040 Old_age Always - 30 (Min/Max 30/30)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 96
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 243
194 Temperature_Celsius 0x0022 030 042 000 Old_age Always - 30 (0 20 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 31760h+41m+27.161s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 326699650007
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 60567373957



Es handelt sich um Festplatten 4TB von Seagate Ironwolf 3,5"


Komisch ist nur, das die HDD2 mit 13019 Stunden Laufzeit angegeben wird. Das müste die Platte 4 sein.
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.968
Punkte für Reaktionen
1.238
Punkte
754
Die SMART-Werte sehen aus meiner Sicht gut aus. Wenn Du in dem smartctl Aufruf statt der Option -A die Option -iA verwendest, bekommst Du neben den SMART-Werten auch noch die Informationen zum Laufwerk ausgegeben, so dass Du über die Seriennummer die Laufwerke im Speicherpool identifizieren kannst.
 
  • Like
Reaktionen: Lextor

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
Ach...total vergessen...die externe Platte ist nicht dabei...wie kann man an externen Platten die Smartwerte auslesen?
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.968
Punkte für Reaktionen
1.238
Punkte
754
Probiere es bitte mit

Code:
smartctl -iA -d sat /dev/usb1

Falls das nicht funktioniert, dann mit usb2 (oder gar usb3) statt usb1 probieren.
 
  • Like
Reaktionen: Lextor

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
Die Werte der externen Platte für das Ziel des Backupjob


=== START OF INFORMATION SECTION ===
Model Family: Seagate IronWolf
Device Model: ST8000VN002-2ZM188
Serial Number: ZPV00LNP
LU WWN Device Id: 5 000c50 0e69ff377
Firmware Version: SC60
User Capacity: 8,001,563,222,016 bytes [8.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Tue Apr 9 00:25:23 2024 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 081 064 006 Pre-fail Always - 131391488
3 Spin_Up_Time 0x0003 092 092 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 15
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 088 060 045 Pre-fail Always - 635509529
9 Power_On_Hours 0x0032 096 096 000 Old_age Always - 4262
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 15
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 065 056 040 Old_age Always - 35 (Min/Max 35/40)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 18
193 Load_Cycle_Count 0x0032 099 099 000 Old_age Always - 3087
194 Temperature_Celsius 0x0022 035 044 000 Old_age Always - 35 (0 23 0 0 0)
195 Hardware_ECC_Recovered 0x001a 081 064 000 Old_age Always - 131391488
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 1935h+58m+24.040s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 105705632342
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1002082677015
 

dil88

Benutzer
Contributor
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
29.968
Punkte für Reaktionen
1.238
Punkte
754
Auch hier sind die Werte aus meiner Sicht ok.
 

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
Ich könnte mir auch eher vorstellen das es sich um einen Fehler in DSM oder Hyperbackup handelt...bei bestimmten Konstellationen etc...nur schwer zu ermitteln.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.173
Punkte für Reaktionen
1.125
Punkte
314
Hi!
Ich habe zwar keine Idee, geschweige denn eine Lösung, da dieses Verhalten eher sporadisch auftritt, somit keiner Logik folgt und daher kaum zu reproduzieren ist. Ich vermute aber auch, das Hyper Backup nicht ganz unbeteiligt an der Sache ist. Aber wie gesagt, reine Vermutung.

Ich vermute mal, das du ein .hbk Datenbankbackup und kein Einzeldateibackup ausführst, richtig? Wann bzw. wie oft führst du dabei die Integritätsprüfung aus? Vielleicht hängt es irgendwie damit zusammen. Ich hatte schon mal das Problem, jedoch bei einem rsync Backup auf einen Remote Server, das das System nicht mehr ansprechbar war, weil RSync die komplette Bandbreite dazu verwendet hat, die Daten wegzuschaufeln. Du sicherst ja auf USB, weshalb die Bandbreite eher weniger das Problem sein sollte. Jedoch erscheint mir das Verhälten ähnlich zu sein.

Tommes
 

Lextor

Benutzer
Mitglied seit
12. Aug 2020
Beiträge
431
Punkte für Reaktionen
19
Punkte
24
Hi,

Die Sicherung findet alle 4 Std statt. Die Ingegrietätsprüfung einmal monatlich, aber zu einer anderen Uhrzeit um nicht in den Zeitplan des Backups zu fallen. Jedoch kann die Prüfung lange genug dauern, das es doch in den Zeitplan gerät...nichts desto trotz... es war eh keine Prüfung vorgesehen gestern Abend...
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat 

 
 
  AdBlocker gefunden!

Du bist nicht hier, um Support für Adblocker zu erhalten. Dein Adblocker funktioniert bereits ;-)

Klar machen Adblocker einen guten Job, aber sie blockieren auch nützliche Funktionen.

Das Forum wird mit hohem technischen, zeitlichen und finanziellen Aufwand kostenfrei zur Verfügung gestellt. Wir zeigen keine offensive Werbung und bemühen uns um eine dezente Integration.

Bitte unterstütze dieses Forum, in dem du deinen Adblocker für diese Seite deaktivierst.

Du kannst uns auch über unseren Kaffeautomat einen Kaffe ausgeben oder ein PUR Abo abschließen und das Forum so werbefrei nutzen.

Vielen Dank für Deine Unterstützung!