Aufgabenplanung für einfachen und erweiterten SMART Test

Fritz-EDV

Benutzer
Mitglied seit
21. Aug 2023
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Hallo Zusammen,

ich wollte gerne via CMS eine Richtlinie für den Test-Planer des Speicher-Managers ausrollen. Musste feststellen: Geht nicht. Gibts keine Option für

Ziel ist es, auf jedem Gerät die gleichen geplanten SMART Tests zu haben:

SMART Schnelltest unterwöchig: jeden Mo-Fr ab 0 Uhr alle 6h
SMART Erweiterter Test wochenends: jeden Samstag 0 Uhr

Habe gesehen man kann in den Richtlinien Shell Scripte ausführen lassen - denke damit könnte das evtl gehen. Gibts da nen Trick um das so umzusetzen? Idealerweise Transparent für das DSM - dh. dass mir die geplanten Tasks (und deren Ergebnisse) dann auch im Speichermanager angezeigt werden.
 
  • Wow
Reaktionen: plang.pl

synfor

Benutzer
Sehr erfahren
Mitglied seit
22. Dez 2017
Beiträge
9.160
Punkte für Reaktionen
1.651
Punkte
308
Angesichts der Tatsache, dass du offensichtlich die Platten kaputt testen willst, ist das gut so, dass das nicht geht. Keine Ahnung, was für Platten du in den Geräten hast, aber ein wöchentlicher erweiterter Test bei einer 20 TB Enterprise-Platte verursacht alleine schon einen jährlichen Workload von 1040 TB. Das ist fast das doppelte von dem, wofür die Platten ausgelegt sind (üblicherweise 550 TB/a).


PS: Threads zu CMS gehören wohl kaum in das Unterforum Terminal-Dienste (Telnet, SSH) - Linux-Konsole
 
Zuletzt bearbeitet:
  • Haha
Reaktionen: ctrlaltdelete

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.401
Punkte
564
Wenn du die Platten derart oft testest, sind die eher früher als später defekt. Diese Tests brauchts i.d.R. gar nicht
 

ctrlaltdelete

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
30. Dez 2012
Beiträge
14.040
Punkte für Reaktionen
6.049
Punkte
569
Einen erweiterten würde ich nicht empfehlen, aber der Befehl wäre dann "long"
smartctl -d sat -t short /dev/sata1

Usage: smartctl [options] device ============================================ SHOW INFORMATION OPTIONS ===== -h, --help, --usage Display this help and exit -V, --version, --copyright, --license Print license, copyright, and version information and exit -i, --info Show identity information for device --identify[=[w][nvb]] Show words and bits from IDENTIFY DEVICE data (ATA) -g NAME, --get=NAME Get device setting: all, aam, apm, lookahead, security, wcache, rcache, wcreorder -a, --all Show all SMART information for device -x, --xall Show all information for device --scan Scan for devices --scan-open Scan for devices and try to open each device ================================== SMARTCTL RUN-TIME BEHAVIOR OPTIONS ===== -q TYPE, --quietmode=TYPE (ATA) Set smartctl quiet mode to one of: errorsonly, silent, noserial -d TYPE, --device=TYPE Specify device type to one of: ata, scsi, nvme[,NSID], sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, marvell, areca,N/E, 3ware,N, hpt,L/M/N, megaraid,N, aacraid,H,L,ID, cciss,N, auto, test -T TYPE, --tolerance=TYPE (ATA) Tolerance: normal, conservative, permissive, verypermissive -b TYPE, --badsum=TYPE (ATA) Set action on bad checksum to one of: warn, exit, ignore -r TYPE, --report=TYPE Report transactions (see man page) -n MODE, --nocheck=MODE (ATA) No check if: never, sleep, standby, idle (see man page) ============================== DEVICE FEATURE ENABLE/DISABLE COMMANDS ===== -s VALUE, --smart=VALUE Enable/disable SMART on device (on/off) -o VALUE, --offlineauto=VALUE (ATA) Enable/disable automatic offline testing on device (on/off) -S VALUE, --saveauto=VALUE (ATA) Enable/disable Attribute autosave on device (on/off) -s NAME[,VALUE], --set=NAME[,VALUE] Enable/disable/change device setting: aam,[N|off], apm,[N|off], lookahead,[on|off], security-freeze, standby,[N|off|now], wcache,[on|off], rcache,[on|off], wcreorder,[on|off] ======================================= READ AND DISPLAY DATA OPTIONS ===== -H, --health Show device SMART health status -c, --capabilities (ATA) Show device SMART capabilities -A, --attributes Show device SMART vendor-specific Attributes and values -f FORMAT, --format=FORMAT (ATA) Set output format for attributes: old, brief, hex[,id|val] -l TYPE, --log=TYPE Show device log. TYPE: error, selftest, selective, directory[,g|s], xerror[,N][,error], xselftest[,N][,selftest], background, sasphy[,reset], sataphy[,reset], scttemp[sts,hist], scttempint,N[,p], scterc[,N,M], devstat[,N], ssd, gplog,N[,RANGE], smartlog,N[,RANGE], nvmelog,N,SIZE -v N,OPTION , --vendorattribute=N,OPTION (ATA) Set display OPTION for vendor Attribute N (see man page) -F TYPE, --firmwarebug=TYPE (ATA) Use firmware bug workaround: none, nologdir, samsung, samsung2, samsung3, xerrorlba, swapid -P TYPE, --presets=TYPE (ATA) Drive-specific presets: use, ignore, show, showall -B [+]FILE, --drivedb=[+]FILE (ATA) Read and replace [add] drive database from FILE [default is +/usr/etc/smart_drivedb.h and then /usr/share/smartmontools/drivedb.h] ============================================ DEVICE SELF-TEST OPTIONS ===== -t TEST, --test=TEST Run test. TEST: offline, short, long, conveyance, force, vendor,N, select,M-N, pending,N, afterselect,[on|off] -C, --captive Do test in captive mode (along with -t) -X, --abort Abort any non-captive test on device =================================================== SMARTCTL EXAMPLES ===== smartctl --all /dev/sda (Prints all SMART information) smartctl --smart=on --offlineauto=on --saveauto=on /dev/sda (Enables SMART on first disk) smartctl --test=long /dev/sda (Executes extended disk self-test) smartctl --attributes --log=selftest --quietmode=errorsonly /dev/sda (Prints Self-Test & Attribute errors) smartctl --all --device=3ware,2 /dev/sda smartctl --all --device=3ware,2 /dev/twe0 smartctl --all --device=3ware,2 /dev/twa0 smartctl --all --device=3ware,2 /dev/twl0 (Prints all SMART info for 3rd ATA disk on 3ware RAID controller) smartctl --all --device=hpt,1/1/3 /dev/sda (Prints all SMART info for the SATA disk attached to the 3rd PMPort of the 1st channel on the 1st HighPoint RAID controller) smartctl --all --device=areca,3/1 /dev/sg2 (Prints all SMART info for 3rd ATA disk of the 1st enclosure on Areca RAID controller)
 

Fritz-EDV

Benutzer
Mitglied seit
21. Aug 2023
Beiträge
8
Punkte für Reaktionen
0
Punkte
1
Diese Tests brauchts i.d.R. gar nicht
Ich hab die Erfahrung gemacht, dass die Platten länger schon defekt sein können (Sektorfehler), bevor SMART das überhaupt schnallt. Das würde ja meist erst bei nem kompletten Oberflächentest auffallen.

Zur Häufigkeit der Tests hab ich mir noch keinen Kopp gemacht - wollte erstmal was in den Raum werfen, womit man Arbeiten kann.

Workload wird wahrscheinlich alleine schon durch die Backups erreicht, die auf die Platten geschrieben werden. Stündliche Deltas der kritischen VMs und Abends dann einmal ein Vollbackup - jeden Werktag. Pro Hypervisor sind das im Schnitt 5TB internes Storage.

Deswegen möchte ich es auch recht zeitnah mitbekommen, wenn eine der Platten ausfällt - Murphys Gesetz zufolge folgt dann auch bald die 2. und 3. Platte. Und bei 3 is Feierabend mit nem Raid 6 ;)
 

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.896
Punkte für Reaktionen
1.517
Punkte
274
Lass es - ist unnötig.
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Mitglied seit
28. Okt 2020
Beiträge
15.028
Punkte für Reaktionen
5.401
Punkte
564
Aber die SMART-Werte werden doch auch im laufenden Betrieb geloggt.
Mach halt hin und wieder nen Schnelltest, wenn du Bedenken hast und den erweiterten höchstens einmal im Monat
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat