Da die LMC Rollout Fehler Logs etwas schwierig zu Lesen und Interpretieren sind, dieser Beitrag.
Im LMC-Log der Secondary Node habe ich dann die folgende Meldung gefunden:
Das erste was ich in dem Fall mache ist, dass ich mir die Meldung in einen Text-Editor kopiere und Sinnige Zeilenumbrüche einfüge:
Code: Alles auswählen
[
{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=5}
]
Außerdem habe ich jetzt nochmal die OIDs im zweiten Fenster und muss nicht immer zwischen Detailkonfiguration und Gerätelog wechseln.
Im Log selbst haben wir die möglichkeit über den "Fehler in Detailkonfiguration anzeigen" Link direkt an die betroffene Stelle zu springen.
Das Klappt sehr zuverlässig für Einzelfelder, da wird zum richtigen Menü navigiert und das Richtige Feld markiert.
Bei Tabellen wird leider nur bis zur betroffenen Tabelle und nicht direkt in die richtige Zeile/ bzw. zum richtigen Feld gesprungen.
Ab hier wird es etwas schwierig weiter zu deuten.
Mit dieser Zeile
Code: Alles auswählen
{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6}Um die richtige Tabellenzeile (row) zu identifizieren, schauen wir uns zunächst die rowKeys an.
Code: Alles auswählen
rowKeys=[{colOid=1, value=1028}]colOid 1 ist in der Regel der Primärschlüssel der Tabellen, da wir uns hier in der Port-Tabelle befinden, vermutlich die Portnummer.
Aber es gibt doch nur 54 Ports beim YS-7154CF?
ja, aber es gibt ein paar Port-Ids die für interne Zwecke verwendet werden.
Irgendwas aus alten Zeiten mit SNMP OID Denkweisen.
Der YS-7154CF erlaubt Stacking von bis zu 8 Chassis.
Die Portnummern gehen Je Chassis von 1-54, dann gibt es ein paar interne Ports und ab Port 59 zählt die LMC dann Port 2/0/1 also den ersten Port des zweiten Switches im Stack.
Diese Nummern werden auch dann freigehalten, wenn kein Stackig aktiv ist (schließt sich ja auch mit VPC aus..).
Am Ende der Liste (8*58 Ports =464) werden noch ein paar Nummern für weitere logische Interfaces freigehalten, bis dann bei Port 1026 die LAG Interfaces kommen.
Unsere ColOID=1, Value=1028 ist also das Interface LAG-3.
Hier lesen wir dann die Fehlermeldung weiter:
Code: Alles auswählen
value=1, ... colOid=6}über die Detailkonfiguration öffne ich das Interface LAG-3 auf dem Switch und starte auch direkt den Entwickler-Modus (oben Rechts Konfigurationsaktionen > Entwicklermodus aktivieren).
Damit werden mouseover Elemente (Kopier-Symbol) neben den Feldern eingeblendet.
Wenn man mit der Maus darüber hovert werden die OID der Felder als Tooltip eingeblendet. Mit Klick auf das Symbol wird die OID in die Zwischenablage kopiert.
In meinem Fall habe ich jetzt festgestellt, dass die ColOid 6 "Aktiviert" und der Wert 1 --> Aktiv heißt.
Jetzt weiß man welcher Wert aktuell Schwierigkeiten macht und kann interpretieren warum der Switch das nicht mag,
Ich konnte das im ersten Moment nicht ganz nachvollziehen, warum das aktivieren eines VPC LAG nicht klappen soll.
Ich habe mich dann über das Webterminal mit der Kommandozeile des Switches verbunden und habe manuell versucht das LAG3 zu aktivieren.
Code: Alles auswählen
(vpc1-node1)#conf
(vpc1-node1)(Config)#interface lag 3
(vpc1-node1)(Interface lag 3)#do show running-config interface lag 3
!Current Configuration:
!
interface lag 3
shutdown
no adminmode
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>
vpc 3
exit
(vpc1-node1)(Interface lag 3)#no shut
This command is not supported on the port 0/3/3.
Also weiter ins Troubleshooting im VPC.
Code: Alles auswählen
(vpc1-node1)(Interface lag 3)#do show vpc brief
VPC Domain ID.................................. 1
VPC admin status............................... Enabled
Keep-alive admin status........................ Enabled
VPC operational status......................... Enabled
Self role...................................... Secondary
Peer role...................................... Primary
Peer detection admin status.................... Peer detected, VPC Operational
Operational VPC MAC............................ <gekürzte Ausgabe>
Operational VPC system priority................ 32767
VPC Guard Timer................................ 3
Peer-Link details
-----------------
Interface...................................... 0/3/64
Peer-link admin status......................... Up
Peer-link STP admin status..................... Enabled
Configured VLANs............................... <gekürzte Ausgabe>
Egress tagged VLANs............................<gekürzte Ausgabe>
VPC Details
-----------
Number of VPCs configured...................... 6
Number of VPCs operational..................... 2
VPC id# 1
-----------
Interface...................................... 0/3/1
Configured VLANs............................... <gekürzte Ausgabe>
VPC Operational Mode........................... Active-Active
VPC interface state............................ Active
VPC Revertive Mode............................. Not applicable
VPC Link State................................. Up
Local Members Status
----------------- ------
1/0/1 Up
Peer Members Status
---------------- ------
1/0/1 DOWN
VPC id# 3
-----------
Interface...................................... 0/3/3
Configured VLANs...............................
VPC Operational Mode........................... Active-Active
VPC interface state............................ Disable
VPC Revertive Mode............................. Not applicable
VPC Link State................................. Down
Local Members Status
----------------- ------
Peer Members Status
---------------- ------
<gekürzte Ausgabe>
als dreckigen Fix habe ich das Lag lokal aus dem VPC-LAG 3 entfernt aktiviert und dann wieder hinzugefügt.
Code: Alles auswählen
(vpc1-node1)(Interface lag 3)#no shut
This command is not supported on the port 0/3/3.
(vpc1-node1)(Interface lag 3)#show running-config interface lag 3
!Current Configuration:
!
interface lag 3
shutdown
no adminmode
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>
vpc 3
exit
(vpc1-node1)(Interface lag 3)#no vpc 3
(vpc1-node1)(Interface lag 3)#no shut
(vpc1-node1)(Interface lag 3)#vpc 3
(vpc1-node1)(Interface lag 3)#show running-config interface lag 3
!Current Configuration:
!
interface lag 3
no port-channel static
vlan ingressfilter
vlan participation exclude <gekürzte Ausgabe>
vlan participation include <gekürzte Ausgabe>
vlan tagging <gekürzte Ausgabe>
vpc 3
exit
Dann habe ich einen neuen Rollout gemacht und augenscheinlich denselben Fehler erneut
Alter Fehler:
Code: Alles auswählen
[
{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1028}], colOid=5}
]
Code: Alles auswählen
[
{type=3, cfgId=16.1.2.13, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1029}], colOid=6},
{type=3, cfgId=16.1501.3, value=1, info=VALUE_INVALID: commitFailed, rowKeys=[{colOid=1, value=1029}], colOid=5}
]ebenfalls korrigiert und der Rollout lief durch.