BTRFS-Volume abgestürzt - Reparatur?

Status
Für weitere Antworten geschlossen.

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Hallo Zusammen,

jetzt hat es auch mich erwischt …
Beim kopieren einer VM ist der Vorgang plötzlich fehlgeschlagen, und das BTRFS-Volume abgestürzt. Reparatur wird mir nicht angeboten - ist da nichts möglich? Support ist zwar angeschrieben, aber das kann ja dauern …

Auszug aus der /var/log/messages:
Rich (BBCode):
Jan 29 12:09:44 DS kernel: [75629.672242] BTRFS critical (device dm-0): corrupt leaf, slot offset bad: block=2169634717696,root=1, slot=5
Jan 29 12:09:45 DS kernel: [75629.909960] BTRFS critical (device dm-0): corrupt leaf, slot offset bad: block=2169634717696,root=1, slot=5
Jan 29 12:09:45 DS kernel: [75629.921012] ------------[ cut here ]------------
Jan 29 12:09:45 DS kernel: [75629.926234] WARNING: at fs/btrfs/super.c:269 __btrfs_abort_transaction+0x105/0x170 [btrfs]()
Jan 29 12:09:45 DS kernel: [75630.080323] CPU: 3 PID: 8768 Comm: btrfs-transacti Tainted: P      D  C O 3.10.35 #5644
Jan 29 12:09:45 DS kernel: [75630.089287] Hardware name: Synology Inc. DS716+/Type2 - Board Product Name, BIOS M.107 08/27/2015
Jan 29 12:09:45 DS kernel: [75630.099281]  ffffffff81488394 0000000000000000 ffffffff8103374d ffff880045ffb270
Jan 29 12:09:45 DS kernel: [75630.107641]  ffff8802714c4000 00000000fffffffb ffffffffa0539b40 0000000000000b5f
Jan 29 12:09:45 DS kernel: [75630.115962]  ffffffff81033837 ffffffffa053b4f0 ffffffff00000020 ffff880274187c98
Jan 29 12:09:45 DS kernel: [75630.124281] Call Trace:
Jan 29 12:09:45 DS kernel: [75630.127029]  [<ffffffff81488394>] ? dump_stack+0xd/0x17
Jan 29 12:09:45 DS kernel: [75630.132880]  [<ffffffff8103374d>] ? warn_slowpath_common+0x6d/0xa0
Jan 29 12:09:45 DS kernel: [75630.139809]  [<ffffffff81033837>] ? warn_slowpath_fmt+0x47/0x50
Jan 29 12:09:45 DS kernel: [75630.146474]  [<ffffffffa04907e5>] ? __btrfs_abort_transaction+0x105/0x170 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.154899]  [<ffffffffa04ade48>] ? btrfs_run_delayed_refs+0x258/0x2c0 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.163016]  [<ffffffffa04ae008>] ? btrfs_write_dirty_block_groups+0x158/0x640 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.172163]  [<ffffffffa0538993>] ? commit_cowonly_roots+0x187/0x257 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.180132]  [<ffffffffa04bf787>] ? btrfs_commit_transaction+0x567/0xa90 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.188427]  [<ffffffff81041080>] ? usleep_range+0x40/0x40
Jan 29 12:09:45 DS kernel: [75630.194594]  [<ffffffffa04bd5bd>] ? transaction_kthread+0x1bd/0x240 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.202397]  [<ffffffffa04bd400>] ? open_ctree+0x2320/0x2320 [btrfs]
Jan 29 12:09:45 DS kernel: [75630.209509]  [<ffffffff81053f65>] ? kthread+0xb5/0xc0
Jan 29 12:09:45 DS kernel: [75630.215163]  [<ffffffff81053eb0>] ? kthread_create_on_node+0x120/0x120
Jan 29 12:09:45 DS kernel: [75630.222469]  [<ffffffff8148dcac>] ? ret_from_fork+0x7c/0xb0
Jan 29 12:09:45 DS kernel: [75630.228709]  [<ffffffff81053eb0>] ? kthread_create_on_node+0x120/0x120
Jan 29 12:09:45 DS kernel: [75630.236017] ---[ end trace d5692805c9c4b71b ]---
Jan 29 12:09:45 DS kernel: [75630.241198] BTRFS: error (device dm-0) in btrfs_run_delayed_refs:2911: errno=-5 IO failure
Jan 29 12:09:45 DS file_MVCP.cgi: copy_file_copy_fd.c:140 Unable to writefile, errno=30(Read-only file system)
Jan 29 12:09:45 DS file_MVCP.cgi: copy_file_copy.c:469 remove dst: [/volume1/VMs/phpVirtualBox_VMs/Win7/Snapshots/{4c68d127-43c7-4354-bc19-b73531831cbc}.vdi] error(30)Read-only file system
Jan 29 12:09:45 DS file_MVCP.cgi: file_MVCP.cpp:1440 Failed to copy /volume1/VMs/VirtualBox VMs/WINDOWS/Win7 to /volume1/VMs/phpVirtualBox_VMs/Win7, reason=[8000], Read-only file system
Jan 29 12:09:46 DS kernel: [75631.032092] BTRFS warning (device dm-0): Skipping commit of aborted transaction.
Jan 29 12:09:46 DS kernel: [75631.040400] BTRFS: error (device dm-0) in cleanup_transaction:1617: errno=-5 IO failure

Bildschirmfoto 2016-01-29 um 12.28.02.jpg
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Ein abgestürztes Volume, das nur aus einer Disk besteht (also ohne Redundanz) kannst du aber auch unter ext4 nicht reparieren. Wie soll das gehen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
acho so … verstehe.

Also keine Hoffnung … ?

Ich verstehe nur noch nicht, wie es dazu kommen konnte. BTRFS-Fehler?
 

Iarn

Benutzer
Sehr erfahren
Mitglied seit
16. Jun 2012
Beiträge
3.023
Punkte für Reaktionen
446
Punkte
149
BTRFS oder Plattenfehler.

Wahrscheinlich kannst Du die Platte/Partition read-only in einem Desktop Linux was BTRFS unterstützt mounten und schauen was noch zu retten ist. Habe aber selber null Erfahrung mit BTRFS. Aber defekte ext3/ext4 Partitionen, die Synos und QNAPs nicht mehr wollen, laufen meist noch eingeschränkt unter Desktop und Rettungs (Knoppix) Linux Distibutionen.
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Die Smart Werte der Platte kannst du dir ja mal ansehen.

Ansonsten: Ticket hast du ja schon offen. Vielleicht kommt ja noch was. :-/

EDIT: und da sind auch schon sie SMART- Werte :)
Sieht völlig ungefährlich aus. Also ist wohl noch etwas Vorsicht bei BTRFS angesagt ...
 

PsychoHH

Benutzer
Mitglied seit
03. Jul 2013
Beiträge
2.967
Punkte für Reaktionen
4
Punkte
78
Oh man. Du hast hoffentlich ein Backup der Daten?

Ob es an btrfs liegt weiß man wohl noch nicht, aber es zeigt mir selbst wieder einmal mehr, btrfs noch nicht einzusetzen.

Der Hotfix für den btrfs Bug den ich entdeckt hab ist ja wohl immer noch nicht da.

Ich bleibe lieber erstmal bei ext4.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Ja, Backup ist da. Aber auf die Macherei mit der Konfigruation ect. kann ich jetzt gerne verzichten.
Falls ich neu aufsetzen muss, war es das erst einmal mit BTRFS.
 

X5_492_Neo

Gesperrt
Mitglied seit
24. Sep 2008
Beiträge
2.714
Punkte für Reaktionen
2
Punkte
0
Falls ich neu aufsetzen muss, war es das erst einmal mit BTRFS.


:eek: :eek: armes Schäfchen! ;) :eek:

irgendwo gabs im Forum schon ne Diskussion wegen BTRFS, da kam mehr oda weniger bei raus, das dieses BTRFS noch nicht das ist, was es eigentlich sein sollte! Ich kann auch nur raten von sowas die Fingers zu lassen!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Ja, die Diskussion habe ich natürlich verfolgt. Aber zum einen betraf es ja die Performance, und da arbeitet Synology wohl dran (damit kann ich leben) und er Verschiebenfehler bei verschlüsselten Laufwerken betraf mich nicht. Aber so etwas macht natürlich keinen Spass …

Ob es damit zusammenhängt, weiß ich nicht (ich dachte, das ist eher hypothetischer Natur):

Kritik am Design
Red Hat beauftragte im zweiten Quartal 2010 Edward Shishkin, einen der ursprünglichen Reiser4-Entwickler, mit einem Codereview. Shishkins Schluss war, dass das Design fehlerhaft ist, da dem ursprünglichen Algorithmus in Kernpunkten nicht gefolgt wird. Die Designfehler führen dazu, dass in speziellen Fällen der Plattenplatz ausgehen kann, obwohl genügend Platz vorhanden ist.[24][25][26]
Die btrfs-Entwickler widersprechen der Behauptung, dass es sich um Designfehler handelt. Sie bezeichnen es viel mehr als Implementierungsfehler (Bug), der mittlerweile behoben wurde.[27]

Quelle: https://de.wikipedia.org/wiki/Btrfs


Etwas OT:
Was mich auch nervt, ist die unterirdische Performance beim Backup. Die Berechnung der Quellgröße dauert bei meinen reichlich 2TB teilweise 4-6 Stunden und lastet den Arbeitsspeicher bis zur Grenze aus (in der Zeit kann man mit der DS praktisch nicht mehr arbeiten) - und das bei 8GB RAM (einen hungrigen Prozess kann man nicht wirklich darüf ausmachen).

Bildschirmfoto 2016-01-29 um 15.31.28.png
Bildschirmfoto 2016-01-29 um 15.35.10.png
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Antwort vom Support (wie zu erwarten):
Hallo,

hier würde ich Ihnen empfehlen ein Backup der Daten durchzuführen und das Volumen zu löschen. Danach erstellen Sie das Volumen komplett neu. Vermutlich ist das Volume degraded, da Ihre Speichermodul nicht kompatible ist, aber eine genaue Analyse des Systems können wir leider aufgrund der Veränderung nicht durchführen, da eben der Speicherriegel ausgetauscht wurde und eine Menge 3rd Party installiert ist.

Bitte beachten Sie das der Eingriff in das Linux Subsystem durch den Kunden nicht supported wird.
Durch einen Zugriff per SSH können grundlegende Systemdateien oder Ordner gelöscht werden, die das DSM oder die Disk Station schädigen kann. Teilweise kann hierdurch die Garantie der Disk Station verfallen.

Bei eventuellen Fragen stehe ich gerne weiter zur Verfügung.

Ob der Zusammenhang mit dem RAM-Modul nur supporttechnisch relevant ist, oder hier ein technischer Zusammenhang gesehen wird, weiß ich nicht.


Die Antwort kam innerhalb von 3 1/2 Stunden. Das nenne ich mal vorbildlich!
 

PsychoHH

Benutzer
Mitglied seit
03. Jul 2013
Beiträge
2.967
Punkte für Reaktionen
4
Punkte
78
Ja die Antwort kenne ich.

Richtig lustig wird es erst, wenn viele Leute die Probleme haben ohne, dass sie 3rd Party und original RAM nutzen.

Bei solchen Fehlern kann das ziemlich ärgerlich werden.

Kann man die Platte aber noch so am PC auslesen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Derzeit sind die Gemeinsamen Ordner 'read only'. Backup Tasks schlagen aber fehl. Derzeit sichere ich per rsync. Mal sehen, was wird.
 

petehild

Benutzer
Mitglied seit
17. Mrz 2011
Beiträge
443
Punkte für Reaktionen
0
Punkte
22
Durch einen Zugriff per SSH können grundlegende Systemdateien oder Ordner gelöscht werden, die das DSM oder die Disk Station schädigen kann. Teilweise kann hierdurch die Garantie der Disk Station verfallen.

Sehr gewagte Aussage, da man ja sogar im DSM den Zugang per SSH aktivieren kann... :rolleyes:
 

Puppetmaster

Benutzer
Sehr erfahren
Mitglied seit
03. Feb 2012
Beiträge
18.991
Punkte für Reaktionen
629
Punkte
484
Mutwillige Zerstörung ist immer möglich, und per SSH nunmal extrem leicht. :)
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Also irgendetwas stimmt bei meiner guten nicht! :confused:

Es kann meiner Meinung nach nicht nur am Volume liegen. Im Webinterface sind immer mehr Dinge ausgefallen (Recourcenmonitor, ect.). Der Synology Assistant hat sie immer seltener gefunden - dann war aber der Status OK.

Da wollte ich mal einen Neustart versuchen ==> tat sie nicht
Also per Knopf zwangsbeendet und neugestartet ==> HDD lief sofort an aber nur die Power-LED blinkte schnell / keine Status-LED oder HDD-LEDs / in der FritzBox war die DS per 10Mbit/s angebunden :confused:
Nochmal komplett für einige Minuten vom Strom genommen ==> 1GBit/s war zwar wieder verbunden, aber sonst keine Besserung
Originalen RAM eingesetzt ==> keine Besserung.

Langsam glaube ich, die DS hat einen Schaden …


Wie seht ihr die Situation?
 

dil88

Benutzer
Sehr erfahren
Mitglied seit
03. Sep 2012
Beiträge
30.999
Punkte für Reaktionen
2.485
Punkte
829
Hört sich in der Tat nicht gut an.
 

goetz

Super-Moderator
Teammitglied
Sehr erfahren
Mitglied seit
18. Mrz 2009
Beiträge
14.188
Punkte für Reaktionen
427
Punkte
393

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.621
Punkte für Reaktionen
1.466
Punkte
234
Das war eine gute Idee goetz.
Der Test war zunächst positiv. Ruft man die DS auf, kommt der find.synology.com Screen mit dem Hinweis, dass keine HDD gefunden wurde. Also HDD rein ==> "nicht installiert". OK, also Systempartition formatieren und DSM installieren ==> automatischer Neustart ==> nur die PowerLED blinkt, sonst leuchte keine weitere LED / "find.synology.com" und Synology Assistant finden keine DS - in der FritzBox ist sie aber mit 1GBit/s angebunden - die IP wird aber nicht aufgelöst…


Noch Ideen?
 
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat