Raid 5 Resize schlägt fehl

Status
Für weitere Antworten geschlossen.

C0R4X

Benutzer
Mitglied seit
04. Mrz 2011
Beiträge
10
Punkte für Reaktionen
0
Punkte
0
Grüße,

Ich habe ein Problem mit meiner Diskstation oder viel mehr mit dem Vergrößern des Raids durch ungenutzten Plattenspeicher.

Erst mal zur Ausgangslage: DS 1511+, 5 x 2TB Samsung, DSM 4.3 letzte Version, 1 Volume über die gesamten 7,5 TB Nettospeicher
Ziel: 5 x 2TB nach und nach tauschen mit 5 x 4TB WD RED und Raid 5 erweitern, so dass ich 1 Volume über die gesamten 14,X TB Nettospeicher habe

September 2013 hat eine meiner Samsung Platten I/O Fehler gehabt, eine Reparatur hat nichts gebracht, so dass ich die Festplatte gegen eine 4TB WD RED ausgetauscht habe. Nach und nach habe ich dann alle Festplatten ausgetauscht. Eine nach der anderen. Platte 1 raus genommen, Platte 1 gegen neue Platte getauscht, reingepackt, Raid war degraded, Konsistenzprüfung, Rebuild, fertig, nächste Platte und so weiter.

Nachdem ich dann 3/5 Platten getauscht hatte, habe ich die DS neugestartet, doch aus mir unerklärlichen Gründen hat sich die Konfig zerschossen und ich musste DSM neu installieren. Zu diesem Zeitpunkt war bereits eine stabile 5.0 Beta verfügbar und ich habe direkt auf DSM 5.0 migiert, die Daten wurden wieder eingebunden, alles super alles schön, DS läuft und rennt, ohne Probleme.
Ich habe dann die letzten beiden Platten getauscht und der Status der Diskstation war "Normal", performant, alles so wie immer. Nachdem der letzte Rebuild durch war, bei 5.5 TB Daten dauert das leider jedes mal 30 Stunden, habe ich die DS neu gestartet und konnte im Speicher Manager die Option "Das Volume mit nicht zugewiesenem Speicherplatz erweitern" nutzen und habe das angestoßen. Es erscheint die Meldung, dass die Konsistens etc geprüft wird, doch statt aus dem 0,00% ein 0,01% wird bekomme ich eine rote Meldung die besagt "Sie können die Größe auf ca. 14886 GB vergrößern".

Im Log steht, dass die Vergrößerung fehlgeschlagen ist. Natürlich reicht mir das nicht, also schaue ich in der Shell nach

unter /var/log/messages kann ich folgendes sehen

Rich (BBCode):
Megatron kernel: [125501.365053] raid1: Disk failure on sdc2, disabling device.
Megatron kernel: [125501.365056]        Operation continuing on 4 devices
Megatron kernel: [125518.063284] raid1: Disk failure on sdd2, disabling device.
Megatron kernel: [125518.063288]        Operation continuing on 3 devices
Megatron kernel: [125534.306875] raid1: Disk failure on sde2, disabling device.
Megatron kernel: [125534.306878]        Operation continuing on 2 devices
Megatron kernel: [125556.460002] EXT4-fs warning (device md2): ext4_resize_begin:32: There are errors in the filesystem, so online resizing is not allowed
Megatron kernel: [125556.460007]
Megatron volumehandler.cgi: (fs_vol_expand.c)ExtFSExpand(88):Failed to '/sbin/resize2fs -fpF /dev/md2 > /dev/null 2>&1', WEXITSTATUS(r) = 1
Megatron volumehandler.cgi: volume_manage_with_temp_dev.c:279 Failed to expand file system on /dev/md2
Megatron volumehandler.cgi: volume_lib.cpp:952 Failed to expand file system on /dev/md2
Megatron volumehandler.cgi: volumehandler.cpp:1444 failed to expand unallocated file system: /volume1

Angeblich gibt es Plattenfehler. Ich habe darauf hin das Raid über die DSM Funktion überprüfen und bereinigen lassen. Die Aktion ist durchgelaufen, es gab keinerlei Beanstandungen und es konnten keine Fehler gefunden werden und keine Fehler oder Probleme behoben werden.
Ich habe die DS danach erneut neu gestartet und habe erneut den Resize angestoßen, mit gleichem Ergebnis.

Ich habe mir auch unter dmsg angeschaut, ob beim Start alles richtig erkannt wird, keine Fehler

md2 ist der Raid

Rich (BBCode):
Megatron> cat /proc/mdstat
Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md2 : active raid5 sda3[8] sde3[5] sdd3[9] sdc3[6] sdb3[7]
      15609185024 blocks super 1.2 level 5, 64k chunk, algorithm 2 [5/5] [UUUUU]

md1 : active raid1 sde2[3] sdd2[4] sdc2[2] sda2[0] sdb2[1]
      2097088 blocks [5/5] [UUUUU]

md0 : active raid1 sda1[0] sdb1[1] sdc1[2] sdd1[3] sde1[4]
      2490176 blocks [5/5] [UUUUU]

unused devices: <none>

Ich muss zugeben, ich bin nicht der Linux Crack und kenne mich nur wenig aus...

Ich weiß nur im Moment einfach nicht mehr weiter oder was ich tun kann. Ich habe schon gedacht, dass das damals unter DSM 4.3 installierte IPKG damit zusammenhängt und habe das rausgeschmissen und auch den dafür notwendigen Mountpoint rausgenommen, weil ich dachte, dass der mount das Problem noch wäre, zumindest haben andere das Problem gehabt und es funktionierte danach...

Rich (BBCode):
Megatron> mount
/dev/root on / type ext4 (defaults)
none on /dev/pts type devpts (gid=4,mode=620)
/sys on /sys type sysfs (0)
/tmp on /tmp type tmpfs (0)
/proc/bus/usb on /proc/bus/usb type usbfs (0)
/dev/md2 on /volume1 type ext4 (usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,nomblk_io_submit,synoacl)
none on /proc/fs/nfsd type nfsd (0)

Hat jemand einen Rat oder eine Idee, wo ich noch nachschauen könnte, wo das Problem liegt? Ich habe bereits ein Ticket bei Synology eröffnet, bisher aber keine Rückmeldung erhalten.

Danke und Gruß
 

Anhänge

  • 1890426_629020677168456_1265137737_o.jpg
    1890426_629020677168456_1265137737_o.jpg
    44,7 KB · Aufrufe: 79

Kerlanen

Benutzer
Mitglied seit
17. Mai 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
0
Vergrösserung Raid 5 DSM 5 schlägt auch fehl

Hallo,

ich habe das gleiche Problem. Nach einem Umzug von der DS 411 +ii auf eine DS 413 habe ich die Letzte der 3 TB Platten durch eine 4 TB Platte ersetzt. Jetzt heißt es: Sie können das Volume auf XXXXX vergrößern. Wenn ich das starte heißt es ein paar Minuten der Speicher wird zugeordnet. Da bleibt aber bei 0,00 Prozent stehen und nach ein paar Minuten bricht das ganze ohne Fehlermeldung ab und ich habe wieder den Ausgangszustand...
Neuinstallation DSM hat nichts genutzt. Irgendwie scheint das Volume in Benutzung zu sein...
 

C0R4X

Benutzer
Mitglied seit
04. Mrz 2011
Beiträge
10
Punkte für Reaktionen
0
Punkte
0
Hi

fast vergessen den Thread...

Ich habe eine Lösung gefunden.

Ich bin dazu wie folgt vorgegangen:

1. Alle laufenden Apps und 3rd Party Apps deaktivieren, das ist notwendig für Schritt 2... Hierbei muss man eventuell einige Dinge über die Kommandozeile (die übrigens der beste Freund bei dieser Aktion wird) abschießen. Am besten man benutzt den Befehl "top" und schaut sich an, was alles auf derzeit auf dem Volumen schreibt und wenn man es nicht beenden kann, nimmt man halt

Code:
kill -9 PID

wobei PID natürlich für die Prozess ID steht, die man in TOP sieht.

2. Auf der Kommandozeile das zu vergrößernde Volumen unmounten

Code:
umount /volume1

Die Diskstation wird jetzt natürlich piepen und meckern und motzen, dass das Volumen gecrasht ist. Einfach den Ton ausschalten und erstmal ignorieren.

3. Sicherheitshalber sollte man jetzt das Filesystem checken. Das kann man mit dem Befehl

Code:
e2fsck -f /dev/md2

machen. Wobei /dev/md2 bei jedem entsprechend anders sein kann. Rausfinden, wo etwas gemountet ist, kann man mit dem simplen befehl "mount"... danach wird etwas wie folgt ausgegeben

Code:
Megatron> mount
/dev/root on / type ext4 (defaults)
none on /dev/pts type devpts (gid=4,mode=620)
/sys on /sys type sysfs (0)
/tmp on /tmp type tmpfs (0)
/proc/bus/usb on /proc/bus/usb type usbfs (0)
/dev/md2 on /volume1 type ext4 (usrjquota=aquota.user,grpjquota=aquota.group,jqfmt=vfsv0,nomblk_io_submit,synoacl)

/dev/md2 ist in diesem Fall dann mein besagtes Volumen gewesen.

Wenn man die Fehlerprüfung ausführt, kommen eventuell ne ganze Latte von Fehlern. Bei mir waren es mehrfach zugeordnete inodes. Ich habe das vom System korrigieren lassen. Der Vorgang hat etwas gedauert, ca. 8 Stunden ;)

Wenn das alles durch ist, habe ich das Volumen offline mit dem Befehl

Code:
/sbin/resize2fs -fpF /dev/md2

erweitert und nach ca. 30 Minuten kam die Meldung "The filesystem on /dev/md2 is now 3902296256 blocks long".
Meine Daten waren alle noch da.

Bevor man das macht empfehle ich aber dringend ein Backup.

Hoffe es wird auch anderen helfen ;)
Wie es zu dem Fehler gekommen ist kann ich nicht sagen. Ich habe bis heute keine Antwort von Synology erhalten.
 

Kerlanen

Benutzer
Mitglied seit
17. Mai 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
0
Danke

für die Info. Mein Problem ist: Welche Prozesse blockieren das Volume? Ich bin mit Unix nicht wirklich fit (leider)....
viele Grüße

Kerlanen
DS413.PNG

Wenn ich das irgendwie hinkriege kriege ich
Corruption found in superblock
als Info. Allerdings zeigt mir Mount mein Volume auch nicht mehr an. von daher vermute ich, dass ich eine Prozess abgeschossen ahbe, der nicht gut war....
 
Zuletzt bearbeitet:

C0R4X

Benutzer
Mitglied seit
04. Mrz 2011
Beiträge
10
Punkte für Reaktionen
0
Punkte
0
ah, vermutlich hast Du Plex laufen oder?

postgres

ist in diesem Fall der Feind ;)

kill -9 7089

wenn du danach noch mal top machst, dürfte postgres nicht mehr auftauchen...
danach kannst umount /volume1 versuchen. Wenn keine Fehlermeldung kommt und die NAS anfängt zu piepen war es richtig :D

MFG
 

Kerlanen

Benutzer
Mitglied seit
17. Mai 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
0
Hallo,

danke für die Info
- unmount geht dann (keine Ahnung, warum das vorher nicht geklappt hat).
- e2fsck -f /dev/md2 wirft Corruption found in superblock aus
- /sbin/resize2fs -fpF /dev/md2 läuft, wenn fertig nix passiert....
Ich hab leider keinen Plan mehr.

Viele Grüße

Kerlanen
-
 

C0R4X

Benutzer
Mitglied seit
04. Mrz 2011
Beiträge
10
Punkte für Reaktionen
0
Punkte
0
Und wollte er die Superblocks nicht reparieren?
versuch es mit e2fsck -fp

f = auch wenn das Dateisystem angeblich sauber ist, macht er die Prüfung
p = automatische Reparatur, ohne Nachfragen

Und was meinst du mit "wenn fertig nix passiert...." ?

Der spuckt doch irgendwas aus.
 

Kerlanen

Benutzer
Mitglied seit
17. Mai 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
0
Superblock will nicht

DS413.PNG
Und nach dem expanden passiert einfach nichts weiter. Keine Fehlermeldung, keine erweiterte Partition.... (von der Kommandozeile aus gestartet).

Viele Grüße

Kerlanen
 

C0R4X

Benutzer
Mitglied seit
04. Mrz 2011
Beiträge
10
Punkte für Reaktionen
0
Punkte
0
Die Antwort sagt doch schon das System:

e2fdck -b 32768 /dev/md2

Natürlich kein Gewähr oder Gaantie, ist ja klar ;)
 

Kerlanen

Benutzer
Mitglied seit
17. Mai 2011
Beiträge
15
Punkte für Reaktionen
0
Punkte
0
danke für die Info. Im Moment muss ich gerade mal das Volumen checken (Zeigt nur noch knapp 1 Gigabyte in Gebrauch an, obwohl 6 TB Daten drauf sind, die im Filemanager auch noch angezeigt werden…).
Ich versuche es dann in zwei Tagen nochmal.:mad:
 

Geniemann

Benutzer
Mitglied seit
18. Okt 2012
Beiträge
194
Punkte für Reaktionen
14
Punkte
18
Hallo,

ich habe das gleiche Problem und komme nicht weiter. Ich habe mir die Liste der Dienste anzeigen lassen und weil da auch postgres drin stand diesen beendet, aber wird in genau dem Moment wieder gestartet, wo ich ihn beende. Und jeder Versuch von umount volume1 führt dann zu der Fehlermeldung "is busy". Im übrigen hatte ich Plex nur mal testweise installiert und das vor Jahren, das würde ja eigentlich nicht erklären, warum dieser Prozess JETZT läuft, oder?


Besten Dank
Andreas
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.915
Punkte für Reaktionen
2.363
Punkte
829

Geniemann

Benutzer
Mitglied seit
18. Okt 2012
Beiträge
194
Punkte für Reaktionen
14
Punkte
18
Hallo dil88,

vielen Dank für den Link. Ist genau mein Leidensweg, aber leider funktioniert das auch nicht. Habe das aber mal dort gefragt, damit es "zusammen" bleibt. Danke!


Grüße
Andreas
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat