Debakel beim Update von 10.32 auf 10.40 - Segment wird geflutet

Forum zu den aktuellen LANCOM Wireless Accesspoint Serien

Moderator: Lancom-Systems Moderatoren

Antworten
AndreasL
Beiträge: 130
Registriert: 20 Dez 2009, 21:25
Wohnort: Berlin

Debakel beim Update von 10.32 auf 10.40 - Segment wird geflutet

Beitrag von AndreasL »

Hi,

ich habe eine ziemlich schlaflose Nacht hinter mir nachdem ich versucht habe einen Standort von 10.32.0176RU9 auf 10.40.0291RU1 zu bringen. Zur Erklärung was dort vorhanden ist:

Standort A
Lan1 192.168.2.x -> hier sitzt der WLC mit FW 10.40.0291RU1
Lan2 192.168.3.x
Lan3 172.16.7.x -> Diverse APs mit 10.40.0291RU1 und 8.84.0309SU11

Standort B (spielt hier keine Rolle)

Standort C
Lan1 192.168.7.x
Lan2 192.168.8.x -> Diverse APs mit 10.32.0176RU9 und 8.84.0309SU11
Lan3 172.18.7.x -> Diverse APs mit 10.32.0176RU9

Die Standorte A,B und C sind mit diversen Routern über VPN miteinander verbunden, keine Vlans in den Standorten Die APs connecten alle in den Standort A. Läuft problemlos.

Das Update sollte im Standort C auf den APs im Segment Lan3 erfolgen. Dort sitzen L-322agn und OAP-830. In Lan2 sind alte L-54g anwesend.
Ich aktualisiere den ersten AP (172.18.7.1) auf 10.40 und er kommt sauber wieder hoch, nichts auffälliges. Das geschieht von einem Remote Arbeitsplatz über VPN zum Standort A. Ich gehe via RDP auf einen Rechner am Standort C, rufe dort Lanconfig erneut auf weil ich mir den langsamen VPN Traffic von mir zum Standort A sparen will und will direkt am Standort runter laden und updaten. Das geht viel schneller. Lanconfig meldet mir auch verfügbare Updates und ich lass die restlichen ~25 APs updaten. Jetzt bricht das Chaos aus.

Während das Update noch läuft sehe ich in meinem Lokalen Lanmonitor, der den WLC überwacht, das am Standort C APs ausklinken und einklinken, die ich gar nicht update. Ich mach einen Ping in Standort C und sehe die Antwortzeiten hoch schnellen. Kurz darauf bricht mir die RDP Sitzung zusammen, der Standort C ist nur noch sporadisch erreichbar. Der Default Gateway Router am Standort C ist Quasi dicht. Hier geht nichts mehr, das Netzwerk ist komplett tot da der Router (kein Lancom) wohl geflutet wird und die Lan-Interface das nicht mehr packen.

Mit ganz viel Geduld und Stück für Stück mit vielen Fehlermeldungen schaffe ich es über Stunden die alten Firmwares wieder zu aktivieren. Um so mehr Geräte wieder mit 10.32 laufen umso besser komme ich wieder an das Netzwerk dran. Als alles wieder mit 10.32 läuft ist der Spuk vorbei und jetzt trudeln die ganzen Alarmmeldungen diverser überwachter Geräte ein, die kein Netzwerk mehr erreichen konnten.

Ich kenne diesen Effekt von einem Broadcast-Storm oder Netzwerk Loop. Jetzt frage mich allerdings, was hier genau mit dem Firmware Update passiert. Monitoring war nicht möglich, weil einfach alles dicht war und ich nur in der Nacht Remote beim Kunden arbeiten konnte. Vor Ort am Core Switch mit entsprechenden Tools könnte man vielleicht was sehen. Das kann ich aber Tagsüber so nicht riskieren, da reißen die mir den Kopf ab wenn ich das Netzwerk lahm lege.

Was passiert hier? Und warum am Standort C? Am Standort A konnte ich bislang keine Probleme feststellen. Kann es sein, dass 10.40 Geräte aus dem Segment 3 irgendwie über das Default GW nach den Geräten im Segment 2 suchen und hier massiven Traffic machen, die den Router dann blockieren?
Muss man irgendwas spezielles beachten wenn man von 10.32 auf 10.40 geht? Den AP ggf in Werksconfig starten oder an den Profilen im WLC vorher etwas anpassen? Ich bin ratlos. Ich habe auf dem FTP jetzt schon neuere 10.40'er Versionen gefunden aber weitere Experimente kann ich mir nicht erlauben ohne zu wissen, was da passiert.

Habe ich den Release Notes irgendwas übersehen und wenn ja, was?

Gruß
Andreas
Antworten