gestern wurde eine St2000DL003 in meiner DS1511 vom System stillgelegt, nachdem im Log einige Fehlermeldungen aufgetaucht waren
Ich habe dann abends die problematische Platte (dank Hotplug) gezogen und wieder neu eingesteckt, sie wurde zum Glück sofort wieder erkannt und ich konnte die DG problemlos reparieren. Zum Glück gab es keinen Datenverlust. Aber ich frage mich schon, warum sich eine (scheinbar) intakte Platte plötzlich abgemeldet wird, warum das Volume auf der DG sich komplett auf RO gestellt hat, und warum sich die Platte als USB-Device gemeldet hat. Ich dachte immer, der SATA-Controler bei x86-Systeme wäre direkt angebunden
Thomas
Anschliessend war das Volume auf der Diskgruppe nur noch readonly, obwohl ja noch 4 intakte Platten da waren und es gab ein ständiges Piepsen an der DSApr 19 09:35:36 kernel: [3444543.567131] ata3.00: failed command: READ FPDMA QUE
UED
Apr 19 09:35:36 kernel: [3444543.572698] ata3.00: cmd 60/08:d0:88:c6:92/00:00:78
:00:00/40 tag 26 ncq 4096 in
Apr 19 09:35:36 kernel: [3444543.572702] res 40/00:b8:30:cd:92/00:00:78
:00:00/40 Emask 0x10 (ATA bus error)
Apr 19 09:35:36 kernel: [3444543.588949] ata3.00: status: { DRDY }
Apr 19 09:35:36 kernel: [3444543.592963] ata3.00: failed command: READ FPDMA QUE
UED
...
Apr 19 09:42:39 kernel: [3444959.694384] ata3: COMRESET failed (errno=-16)
Apr 19 09:42:39 kernel: [3444959.699031] ata3: COMRESET fail, set COMRESET fail flag
Apr 19 09:42:39 kernel: [3444964.705287] ata3: COMRESET failed (errno=-16)
Apr 19 09:42:39 kernel: [3444964.709956] ata3: COMRESET fail, set COMRESET fail flag
Apr 19 09:42:39 kernel: [3444964.715479] ata3: reset failed, giving up
Apr 19 09:42:39 kernel: [3444964.719799] ata3.00: detect reset link fail, set detach flag
Apr 19 09:42:39 kernel: [3444964.725803] ata3: get error flags 0x2
Apr 19 09:42:39 kernel: [3444964.729731] ata3.00: still have recovery flags, don't disabled it
Apr 19 09:42:39 kernel: [3444964.736172] ata3: detect abnormal stat 0x1
Apr 19 09:42:39 kernel: [3444964.740554] ata3.00: force dev detach
Apr 19 09:42:39 kernel: [3444964.744497] ata3.00: disabled
Apr 19 09:42:39 kernel: [3444964.747750] ata3: thaw port to prevent it can't detect new disks
Apr 19 09:42:39 kernel: [3444964.757330] sd 2:0:0:0: rejecting I/O to offline device
Apr 19 09:42:39 kernel: [3444964.786821] end_request: I/O error, dev sdc, sector 2022851280
...
Apr 19 09:42:39 kernel: [3444965.583638] raid5: Disk failure on sdc5, disabling device. Operation continuing on 4 devices
...
Apr 19 09:42:39 kernel: [3444965.662343] raid1: Disk failure on sdc1, disabling device.
Apr 19 09:42:39 kernel: [3444965.662347] Operation continuing on 4 devices
Apr 19 09:42:39 kernel: [3444965.663295] end_request: I/O error, dev sdc, sector 4980608
Apr 19 09:42:39 kernel: [3444965.663295] md: super_written gets error=-5, uptodate=0
Apr 19 09:42:39 kernel: [3444965.710304] sd 2:0:0:0: [sdc] START_STOP FAILED
...
Apr 19 09:42:39 kernel: [3444966.510532] SynoCheckRdevIsWorking (7868): remove active disk sdc5 from md2 raid_disks 5 mddev->degraded 1 mddev->level 5
Apr 19 09:42:39 kernel: [3444966.522472] syno_hot_remove_disk (7768): cannot remove active disk sdc5 from md2 ... rdev->raid_disk 2 pending 0
...
Apr 19 09:42:47 scemd: modules/raid_data_volume_check.c:1261 /dev/vg1 state changes from 0 to 1.
Apr 19 09:42:47 scemd: modules/raid_sys_volume_check.c:246 Md0 degraded [4/5]
Apr 19 09:42:47 hotplugd: usb_get_device_id.c:56 failed get usb id Vendor=0000, ProdID=0000, SN=0000:00:1a.7
Apr 19 09:42:47 hotplugd: hotplugd.c:980 failed get usb device id from usb config, DEVICE=/proc/bus/usb/000/000
Apr 19 09:42:47 hotplugd: ##### ACTION:remove
Apr 19 09:42:47 hotplugd: DEVNAME:sdc
Apr 19 09:42:47 hotplugd: DEVICE:/proc/bus/usb/000/000
Apr 19 09:42:47 hotplugd: DEVPATH:sdc
Apr 19 09:42:47 hotplugd: SUBSYSTEM:block
Apr 19 09:42:47 hotplugd: PHYSDEVPATH:/devices/pci0000:00/0000:00:1f.2/host2/target2:0:0/2:0:0:0
Apr 19 09:42:47 hotplugd: hotplugd.c (1352) ==== SATA disk [sdc] hotswap [remove] ====
Apr 19 09:42:51 scemd: modules/raid_sys_volume_check.c:246 Md1 degraded [4/5]
Ich habe dann abends die problematische Platte (dank Hotplug) gezogen und wieder neu eingesteckt, sie wurde zum Glück sofort wieder erkannt und ich konnte die DG problemlos reparieren. Zum Glück gab es keinen Datenverlust. Aber ich frage mich schon, warum sich eine (scheinbar) intakte Platte plötzlich abgemeldet wird, warum das Volume auf der DG sich komplett auf RO gestellt hat, und warum sich die Platte als USB-Device gemeldet hat. Ich dachte immer, der SATA-Controler bei x86-Systeme wäre direkt angebunden
Thomas