DSM 7.1 DS1515+ Netzwerk tot

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
Hallo liebe Experten

Ich habe hier eine DS1515+ bei der die LAN1-4 LED's nicht mehr leuchten. Auch hinten an den LAN-Anschlüssen ist keine Aktivität mehr sichtbar.
Ich wollte mir via Service Schnittstelle einmal den Bootvorgang genauer ansehen. Leider erhalte ich mit den üblichen Einstellungen (115200 BAUD, 8bit/no parity, 1stop, keine Flusskontrolle) nur ein Zeichenwirrwarr als Output.

Ich habe dann das kleine Boot Loader Board einer gesunden DS1515+ genommen und damit getestet. Die defekte DS hat auch mit dem neuen Board kein Netzwerk. Ich vermute also, dass etwas mit der Stromversorgung des Marvell Chips nicht stimmt. Kennt sich damit Jemand aus? Ansonsten bleibt mir wohl nur noch das Reverse-Engineering bei der gesunden DS. :(

Auf kalte Lötstellen habe ich übrigens schon überprüft und soweit nichts auffallendes gefunden. Ich habe allerdings auch kein digitales Mikroskop zur Hand und muss mich auf meine Augen und Lupe verlassen. 🤓🤪
 

Benie

Benutzer
Contributor
Sehr erfahren
Mitglied seit
19. Feb 2014
Beiträge
8.953
Punkte für Reaktionen
3.795
Punkte
344
  • Like
Reaktionen: 66er

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
Thomas hat Betriebsferien :)

Ich versuche es jetzt noch mit einem anderen TTL Konverter...
 

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
So, mit einem anderen Converter hat es funktioniert. Ich konnte den Bootvorgang aufzeichnen. :)
Der Netzwerktreiber wird nicht richtig geladen:

:: Loading module e1000e[ 12.618082] e1000e: Intel(R) PRO/1000 Network Driver - 3.3.4-NAPI
[ 12.624905] e1000e: Copyright(c) 1999 - 2016 Intel Corporation.
... [ OK ]
:: Loading module i2c-algo-bit ... [ OK ]
:: Loading module igb[ 13.152364] Intel(R) Gigabit Ethernet Network Driver - version 5.3.5.3
[ 13.159669] Copyright (c) 2007-2015 Intel Corporation.
[ 13.487960] igb 0000:00:14.0: The NVM Checksum Is Not Valid
[ 13.494283] igb: probe of 0000:00:14.0 failed with error -5
[ 13.853242] igb 0000:00:14.1: The NVM Checksum Is Not Valid
[ 13.859556] igb: probe of 0000:00:14.1 failed with error -5
[ 14.218527] igb 0000:00:14.2: The NVM Checksum Is Not Valid
[ 14.224838] igb: probe of 0000:00:14.2 failed with error -5
[ 14.583817] igb 0000:00:14.3: The NVM Checksum Is Not Valid
[ 14.590126] igb: probe of 0000:00:14.3 failed with error -5
... [ OK ]
Weis da einer weiter?
Reset habe ich bereits versucht, klappt aber auch nicht:
synobios: reset button pressed, ret = 0
Reset-Button drücken bis Beep, danach noch einmal innerhalb 10 Sekunden. Es sollte zweimal beepen. Beept aber nur einmal. Danach passiert gar nichts.
 

TN-Notebooks

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Mai 2019
Beiträge
278
Punkte für Reaktionen
264
Punkte
113
Hallo,

dann erst mal reverse .... funktioniert das USB Flash von der kranken Unit in der gesunden DS1515+ ?

Aber bevor man in die Unit sieht bitte auch mal das LAN Kabel und Router Port von der gesunden Unit zu testen verwenden.

Auch mal ohne CMOS Batterie und ohne HDDs probieren.


Ich vermute also, dass etwas mit der Stromversorgung des Marvell Chips nicht stimmt
Eher unwahrscheinlich das es eine Spannung ist - wahrscheinlicher ist das der Chip durchgebrannt ist . Gewitter Überspannung etc

Reset-Button drücken bis Beep, danach noch einmal innerhalb 10 Sekunden. Es sollte zweimal beepen. Beept aber nur einmal. Danach passiert gar nichts.
Das funktioniert nur wenn das DSM gebootet ist - Beim ersten reset wird das Passwort zurückgesetzt , beim 2. das DSM neu installiert.
 

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
funktioniert das USB Flash von der kranken Unit in der gesunden DS1515+ ?
So rum hab ich das nicht probiert aber umgekehrt. Sprich das der "guten" DS in der "schlechten" probiert. Fehler in den Logs blieb der gleiche.

Auch mal ohne CMOS Batterie und ohne HDDs probieren.
Hab ich.

Das funktioniert nur wenn das DSM gebootet ist
Danke für die Info. Wieder was gelernt.

Eher unwahrscheinlich das es eine Spannung ist - wahrscheinlicher ist das der Chip durchgebrannt ist . Gewitter Überspannung etc
Es gab hier mal einen ähnlichen Fall. Dort war es schlussendlich eine kalte Lötstelle. Der Fehler in den Logs war aber auch ein anderer. Der Checksum Error sollte ja eher Softwareseitig sein. Aber ich bin kein Experte.

Ich bin nun einen Schritt weiter. Ich habe mir einen USB-LAN Adapter mit Realtek Chip besorgt und die Treiber auf einer guten DS1515+ ins DSM installiert. Mit der Disk habe ich dann die defekte DS gebootet und konnte sehen, wie zuerst immer noch erfolglos versucht wurde die internen LAN Schnittstellen zu aktivieren. Nach rund 5 Minuten waren alle Versuche fehlgeschlagen und die DS hat als nächstes den USB Adapter geladen. Dies war erfolgreich und die DS hat gepiepst und ist via USB-LAN Adapter erreichbar.

Ich habe die DS dann kurz auf Version: 7.1.1-42962 Update 6 aktualisiert in der Hoffnung, dass auch die Firmware neu geschrieben und der Fehler damit behoben wird. Leider war dies nicht der Fall.

Nunja, mit der DS kann ich zumindest mal wieder arbeiten und habe SSH Zugang. Vielleicht ergeben sich nun neue Möglichkeiten?
 
  • Like
Reaktionen: dil88

TN-Notebooks

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
30. Mai 2019
Beiträge
278
Punkte für Reaktionen
264
Punkte
113
Die Checksum für die LAN Adressen ist im USB Flash hinterlegt.
Da der Fehler mit dem gesunden Flash der selbe war kann man einen Check Sum Fehler ausschließen
Ich hatte inzwischen von der Anzahl her weit im 4 Stelligen Bereich Geräte am Tisch und noch nie eine kalte Lötstelle in einem der Geräte.
Theoretisch könnte man noch den BIOS Chip neu aufspielen. Das ist ein SOP8 . Viel Hoffnung hege ich aber nicht dabei
Um auf deine Idee einzugehen ..... Spannung am Chip messen ist ja einfach.
Datenblatt runter laden und sehen wo welche Versorgungsspannung sein muss . sollte jeder Elektroniker können.
 

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
Ich habe das kalte Löststellen-Thema wieder gefunden: https://www.synology-forum.de/threa...neustart-nicht-mehr-hilfe.107264/#post-867353
Für die die es interessiert...

Wollte damit nur sagen dass ich denke, dass der Chip noch in Ordnung ist da er noch Lebenszeichen von sich gibt:
[ 13.159669] Copyright (c) 2007-2015 Intel Corporation.
[ 13.487960] igb 0000:00:14.0: The NVM Checksum Is Not Valid
[ 13.494283] igb: probe of 0000:00:14.0 failed with error -5
Vs. Chip ohne die nötige Versorgungsspannung aus dem verlinkten Thema:
[ 14.135657] Copyright (c) 2007-2015 Intel Corporation.
[ 14.141711] igb 0000:00:14.0: Hardware Initialization Failure
[ 14.148195] igb: probe of 0000:00:14.0 failed with error -5

Die Versorgungsspannung habe ich in der Zwischenzeit auch gemessen. Scheint alles wie bei einer funktionierenden DS zu sein.

Da die Treiber des e1000e gemäss google und Co. häufig diesen Fehler haben, habe ich mich mal in ein paar Workarounds eingelesen die nichts mit Synology Hardware zutun haben. Ich habe mir den Bootloader gemounted (mount -t vfat synoboot1 /tmp/mountMe) und habe die Kernel Command Line mit den Argumenten pcie_aspm=off und e1000.eeprom_bad_csum_allow=1 ergänzt was dazu führen sollte, dass Checksum Error ignoriert werden. Leider bringt dies die LAN-Anschlüsse auch nicht mehr ans Leben. Eine Option wäre es nun noch, die Treiber manuell zu aktualisieren aber irgendwie fehlt mir gerade die Lust, mich da auch noch genauer einzulesen.

Ich gebe mich geschlagen! Das ist die erste von über 200 DS die ich nicht mehr zum laufen bringe. Danke fürs mitmachen, ich habe wieder viel gelernt. :)
 

EggReg

Benutzer
Mitglied seit
24. Apr 2024
Beiträge
3
Punkte für Reaktionen
4
Punkte
3
[sorry for English, I don't know German]
I faced the same issue with my 1812+ and was able to find the solution:
under "root" execute this:
rmmod e1000e; insmod /sys/module/e1000e
Then reboot and it should boot OK without "NVM checksum invalid" error and interface will be working.
Hope this helps.
 
  • Like
Reaktionen: maxblank und Benie

EggReg

Benutzer
Mitglied seit
24. Apr 2024
Beiträge
3
Punkte für Reaktionen
4
Punkte
3
Try this:
rmmod e1000e; insmod /sys/module/e1000e eeprom_bad_csum_allow=1

If it still doesnt' help, here is Intel's application that works with Intel adapters low-level. I guess that your Synology model has Intel adapter too.
The app is called called bootUtil: https://www.intel.com/content/www/u...t-utility-preboot-images-and-efi-drivers.html

Download "Preboot.tar.gz" and then upload it to your Synology.

Expand with tar -xzf Preboot.tar.gz

Then under root:
cd APPS/BootUtil/Linux_x64
chmod +x bootutil64e

Run it:
./bootutil64e

and it should provide this output, something like:
bash-4.3# ./bootutil64e
Error: Connection to QV driver failed - please reinstall it!

Intel(R) Ethernet Flash Firmware Utility
BootUtil version 1.40.05.0
Copyright (C) 2003-2023 Intel Corporation

Type BootUtil -? for help

Port Network Address Location Series WOL Flash Firmware Version
==== =============== ======== ======= === ============================= =======
1 888888888788 0:25.0 Gigabit YES FLASH Not Present
2 0022645EF31B 1:00.0 Gigabit YES FLASH Not Present
3 0022645EF31C 2:00.0 Gigabit YES FLASH Not Present

Then find the interface that has a failed MAC (typically 000000000 or FFFFFFFFF) and indicate the number in "Port" column for the following commands - run both commands:
(my bad NIC was "Port" 2, hence I used "2" as argument in this command)

./bootutil64e -NIC 2 -WOLDISABLE -defcfg
./bootutil64e -NIC 2 -WOLE -defcfg

Then reboot, maybe this would trigger to reset the NIC to default config.
This is the only extra I did to make my NIC working again. If it still doesn't help, maybe you have some else going...
 
  • Like
Reaktionen: dil88

Gromith2

Benutzer
Mitglied seit
30. Dez 2009
Beiträge
16
Punkte für Reaktionen
3
Punkte
3
it seems that it does not like the -defcfg command :cautious:

Code:
root@TEST:/volume1/Test/APPS/BootUtil/Linux_x64# ./bootutil64e -NIC 1 -WOLDISABLE -defcfg
Error: Connection to QV driver failed - please reinstall it!


Intel(R) Ethernet Flash Firmware Utility
BootUtil version 1.40.05.0
Copyright (C) 2003-2023 Intel Corporation


Disabling Wake On LAN for port 1...Success


ERROR: -DEFCFG not allowed when combo image is present in flash


Port Network Address Location Series  WOL Flash Firmware                Version
==== =============== ======== ======= === ============================= =======
  1   000000000000     0:20.0 Gigabit NO  FLASH Not Present
  2   000000000000     0:20.1 Gigabit YES FLASH Not Present
  3   000000000000     0:20.2 Gigabit YES FLASH Not Present
  4   000000000000     0:20.3 Gigabit YES FLASH Not Present
root@TEST:/volume1/Test/APPS/BootUtil/Linux_x64#

also tried: ./bootutil64e -NIC 1 -defcfg --> same ERROR

and: ./bootutil64e -NIC=1 -UP=Combo --> ERROR:
Option ROM area in the flash is not supported for this device on port 1
 

EggReg

Benutzer
Mitglied seit
24. Apr 2024
Beiträge
3
Punkte für Reaktionen
4
Punkte
3
-defcfg is the command to "reset" the NIC port to its default settings.
When I was trying to revive my NIC port, I didn't have any success with this -defcfg though bootutil application didn't error out on this argument but it didn't do anything good either.
Then I tried enabling/disabling WakeupOnLAN option and then right after that - removing and inserting the e1000e driver. And it worked for me.

In my code snippet bootutil complains about the QV driver that I was not able to compile successfully on my 1812 NAS (I have been trying a lot, its sources are in Preboot.tar.gz file). Maybe this driver is really needed to successfully talk to your NIC, maybe not - I don't know.

Can you try to just disable WOL for all interfaces and then re-enabling WOL for all of them and then reboot? Maybe this would trigger the "default_config" to be enforced on the interfaces?

If you are still curious, you can try to save that combo image
./bootutil64e -NIC 1 -SAVEIMAGE -FILE=good_rom.bin
and then compare these images from all interfaces - maybe only one of them would be somewhat failed and you could write a good image back to NIC, potentially restoring it.

It's probably not a good sign that you have all 4 interfaces with MAC "000000000" - I had just one out of 2 and still had network connectivity through the good interface.
Once I removed/inserted e1000e driver, the MAC that used to be on a good interface, moved to the interface that was not working and originally working interface got a new MAC which was different only by 1 in the last octet.
 
  • Like
Reaktionen: dil88


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat