LMC Rollout Fehler Troubleshooting - von der OID zum Feld

Forum zur LANCOM Management Cloud (LMC)

Moderator: Lancom-Systems Moderatoren

Antworten
lna
Beiträge: 164
Registriert: 11 Dez 2024, 20:50

LMC Rollout Fehler Troubleshooting - von der OID zum Feld

Beitrag von lna »

Ich habe heute ein VPC Cluster mit zwei YS-7154CF Switches über die LMC aufgesetzt und bin irgendwann in einen Rollout-Fehler geraten.

Da die LMC Rollout Fehler Logs etwas schwierig zu Lesen und Interpretieren sind, dieser Beitrag.

Im LMC-Log der Secondary Node habe ich dann die folgende Meldung gefunden:
Screenshot 2026-01-14 135921.png
Das erste was ich in dem Fall mache ist, dass ich mir die Meldung in einen Text-Editor kopiere und Sinnige Zeilenumbrüche einfüge:

Code: Alles auswählen

[

{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=5}

]
Damit wird es schon etwas übersichtlicher, wir haben offensichtlich zwei Stellen, an denen etwas nicht ganz passt.
Außerdem habe ich jetzt nochmal die OIDs im zweiten Fenster und muss nicht immer zwischen Detailkonfiguration und Gerätelog wechseln.

Im Log selbst haben wir die möglichkeit über den "Fehler in Detailkonfiguration anzeigen" Link direkt an die betroffene Stelle zu springen.
Das Klappt sehr zuverlässig für Einzelfelder, da wird zum richtigen Menü navigiert und das Richtige Feld markiert.
Bei Tabellen wird leider nur bis zur betroffenen Tabelle und nicht direkt in die richtige Zeile/ bzw. zum richtigen Feld gesprungen.
Screenshot 2026-01-14 135954.png
:!: Übrigens, was gerne übersehen wird: wir haben oben zwei Fehler gesehen. Links im Dropdown können wir direkt zu beiden Fehlern springen.

Ab hier wird es etwas schwierig weiter zu deuten.

Mit dieser Zeile

Code: Alles auswählen

{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6}
springen wir über "in der Detailkonfig anzeigen" direkt in die Tabelle 16.1.2.13 --> Konfiguration > Port > Ports

:!: Wenn man den Link aus dem Log nicht nutzen möchte, kann man links im Quickfinder der Detailkonfiguration auch direkt nach den OIDs suchen.

Um die richtige Tabellenzeile (row) zu identifizieren, schauen wir uns zunächst die rowKeys an.

Code: Alles auswählen

rowKeys=[{colOid=1, value=1028}]
--> Betroffen ist die Reihe, in der die Spalte (colOid) 1 den Wert 1028 hat.

colOid 1 ist in der Regel der Primärschlüssel der Tabellen, da wir uns hier in der Port-Tabelle befinden, vermutlich die Portnummer.

Aber es gibt doch nur 54 Ports beim YS-7154CF?
ja, aber es gibt ein paar Port-Ids die für interne Zwecke verwendet werden.
Irgendwas aus alten Zeiten mit SNMP OID Denkweisen.

Der YS-7154CF erlaubt Stacking von bis zu 8 Chassis.
Die Portnummern gehen Je Chassis von 1-54, dann gibt es ein paar interne Ports und ab Port 59 zählt die LMC dann Port 2/0/1 also den ersten Port des zweiten Switches im Stack.
Diese Nummern werden auch dann freigehalten, wenn kein Stackig aktiv ist (schließt sich ja auch mit VPC aus..).
Am Ende der Liste (8*58 Ports =464) werden noch ein paar Nummern für weitere logische Interfaces freigehalten, bis dann bei Port 1026 die LAG Interfaces kommen.

Unsere ColOID=1, Value=1028 ist also das Interface LAG-3.

Hier lesen wir dann die Fehlermeldung weiter:

Code: Alles auswählen

value=1, ... colOid=6}
Also im Interface LAG-3 ist der Wert 1 ungültig für die Spalte 6

über die Detailkonfiguration öffne ich das Interface LAG-3 auf dem Switch und starte auch direkt den Entwickler-Modus (oben Rechts Konfigurationsaktionen > Entwicklermodus aktivieren).
Damit werden mouseover Elemente (Kopier-Symbol) neben den Feldern eingeblendet.
Wenn man mit der Maus darüber hovert werden die OID der Felder als Tooltip eingeblendet. Mit Klick auf das Symbol wird die OID in die Zwischenablage kopiert.
Screenshot 2026-01-14 145944.png
:!: Dieses Troubleshooting bitte immer in der Rolloutkonfiguration (Vorschau) durchführen. Die Vorschau zeigt alles was als Konfiguration an das Gerät geschickt wird (Basis-Konfiguration überschrieben durch Smartconfig ggf. überschrieben durch Add-INs). Damit wird sichergestellt, dass man sich nicht auf die falsche Fährte führen lässt von Default-Einstellungen, die durch die LMC vor dem Rollout verändert werden.

In meinem Fall habe ich jetzt festgestellt, dass die ColOid 6 "Aktiviert" und der Wert 1 --> Aktiv heißt.

Jetzt weiß man welcher Wert aktuell Schwierigkeiten macht und kann interpretieren warum der Switch das nicht mag,
Ich konnte das im ersten Moment nicht ganz nachvollziehen, warum das aktivieren eines VPC LAG nicht klappen soll.
Ich habe mich dann über das Webterminal mit der Kommandozeile des Switches verbunden und habe manuell versucht das LAG3 zu aktivieren.

Code: Alles auswählen


(vpc1-node1)#conf

(vpc1-node1)(Config)#interface lag 3

(vpc1-node1)(Interface lag 3)#do show running-config interface lag 3

!Current Configuration:
!
interface lag 3
shutdown
no adminmode
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>

vpc 3
exit


(vpc1-node1)(Interface lag 3)#no shut

This command is not supported on the port 0/3/3.

Ok, LAG3 steht auf shutdown, soll von der LMC aktiviert werden. Ich scheitere ebenfalls beim aktivieren.
Also weiter ins Troubleshooting im VPC.

Code: Alles auswählen

(vpc1-node1)(Interface lag 3)#do show vpc brief

VPC Domain ID.................................. 1
VPC admin status............................... Enabled
Keep-alive admin status........................ Enabled
VPC operational status......................... Enabled
Self role...................................... Secondary
Peer role...................................... Primary
Peer detection admin status.................... Peer detected, VPC Operational
Operational VPC MAC............................ <gekürzte Ausgabe>
Operational VPC system priority................ 32767
VPC Guard Timer................................ 3

Peer-Link details
-----------------

Interface...................................... 0/3/64
Peer-link admin status......................... Up
Peer-link STP admin status..................... Enabled
Configured VLANs............................... <gekürzte Ausgabe>
Egress tagged VLANs............................<gekürzte Ausgabe>

VPC Details
-----------

Number of VPCs configured...................... 6
Number of VPCs operational..................... 2


VPC id# 1
-----------
Interface...................................... 0/3/1
Configured VLANs............................... <gekürzte Ausgabe>
VPC Operational Mode........................... Active-Active
VPC interface state............................ Active
VPC Revertive Mode............................. Not applicable
VPC Link State................................. Up

Local Members        Status
-----------------    ------
1/0/1                Up

Peer Members         Status
----------------     ------
1/0/1                DOWN

VPC id# 3
-----------
Interface...................................... 0/3/3
Configured VLANs...............................
VPC Operational Mode........................... Active-Active
VPC interface state............................ Disable
VPC Revertive Mode............................. Not applicable
VPC Link State................................. Down

Local Members        Status
-----------------    ------

Peer Members         Status
----------------     ------
<gekürzte Ausgabe>

Das lokale LAG3 mit der VPC LAG ID 3 scheint noch nicht übergreifend konfiguriert / initiiert zu sein. Außerdem bin ich aktuell auf der VPC Secondary node. Ein und Ausschalten von LAGs geht aber nur auf der Primären Node.
als dreckigen Fix habe ich das Lag lokal aus dem VPC-LAG 3 entfernt aktiviert und dann wieder hinzugefügt.

Code: Alles auswählen

(vpc1-node1)(Interface lag 3)#no shut

This command is not supported on the port 0/3/3.

(vpc1-node1)(Interface lag 3)#show running-config interface lag 3

!Current Configuration:
!
interface lag 3
shutdown
no adminmode
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>
vpc 3
exit


(vpc1-node1)(Interface lag 3)#no vpc 3 

(vpc1-node1)(Interface lag 3)#no shut

(vpc1-node1)(Interface lag 3)#vpc 3

(vpc1-node1)(Interface lag 3)#show running-config interface lag 3

!Current Configuration:
!
interface lag 3
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>
vpc 3
exit


Dann habe ich einen neuen Rollout gemacht und augenscheinlich denselben Fehler erneut :oops:

Alter Fehler:

Code: Alles auswählen

[

{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=5}

]
neuer Fehler:

Code: Alles auswählen

[
{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1029}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1029}], colOid=5}
]
OK, richtig hinschauen: der Fehler ist einen Port weiter gewandert und betraf dann auch noch die LAGs 4-6.
ebenfalls korrigiert und der Rollout lief durch.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß Lukas
lna
Beiträge: 164
Registriert: 11 Dez 2024, 20:50

Re: LMC Rollout Fehler Troubleshooting - von der OID zum Feld

Beitrag von lna »

tl;dr:
hier noch das cheatsheet für die Interpretation der Fehler:
shortcut.png
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Gruß Lukas
Antworten