Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24)

Forum zu aktuellen Geräten der LANCOM Router/Gateway Serie

Moderator: Lancom-Systems Moderatoren

Benutzeravatar
Jirka
Beiträge: 5225
Registriert: 03 Jan 2005, 13:39
Wohnort: Ex-OPAL-Gebiet
Kontaktdaten:

Re: Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24

Beitrag von Jirka »

Hallo Alfred,

erst mal vielen Dank für Deine Antwort.
alf29 hat geschrieben:mag sein, daß Du frustriert bist,
Nö, frustriert bin ich (noch) nicht. Echt nicht. Vielleicht erstaunt. Auf alle Fälle habe ich mal festgestellt, was Sache ist. Und diese Feststellung kund getan. Die Hoffnung, dass sich hier noch was tut, habe ich auch noch nicht aufgegeben.
alf29 hat geschrieben:aber auf solche "tut (immer noch) nicht" Kommentare hin ohne nähere Angaben wird niemand etwas tun.
Was soll ich dazu noch sagen? Wie in diesem Thread bereits geschrieben, werden urplötzlich Temperaturen gemeldet, die nicht sein können, bevorzugt z. B. 2 oder 6 °C, während die echte Temperatur z. B. bei 36 °C liegt. Die Abfrage erfolgt bei mir eigentlich alle 60 Sek. per PRTG/SNMP. Klar, in 99,9 % der Fälle stimmen die Messwerte, aber bei 60 Messwerten je Stunde und das 24 Stunden lang, also somit 1440 Messwerten, tanzen nach wie vor 1, 2 oder 3 (selten auch mal 4 oder gar keiner) Werte pro Tag aus der Reihe. Wobei es keine Rolle spielt, ob ich die Werte nun per SNMP abfrage oder auf der Konsole ein 'ls st/hard/temp' mache. PRTG ist natürlich bequemer. Aber ein 'repeat 1 ls st/hard/temp' führte gestern innerhalb von gut 2 Minuten zu einem Fehlerwert. Es kann aber auch mal länger dauern. Man kann die Konsolenausgabe ja auch 15 Minuten mitloggen lassen und dann mal nach "INFO: 2" oder "INFO: 6" suchen... Ich kann Dir gerne mal Zugangsdaten zu dem Router zukommen lassen, damit Du Dich selber davon überzeugen kannst.
alf29 hat geschrieben:Ich habe eben bei dem Kollegen nachgefragt und dessen 9100 läuft seit längerer Zeit stabil ohne Phantasiewerte anzuzeigen. Du wirst Dich also schon etwas näher äußern müssen, wo für welchen Sensor welche Werte angezeigt werden.
Ich glaube das auch, wobei welche Firmware hat der auf dem 9100? Eine 10.12? Weil in der 9.24 soll es ja noch nicht gefixt sein, so war die Aussage. Und mit der neuesten 9.24-Beta sind nach wie vor Fehler drin, das sehe ich hier. Und eine 10.12 gibt es ja nicht frei, jedenfalls nicht für den 9100 ohne +.
Aber zum "näher äußern", das ist die OID beim 7100+, die ich abfrage, somit ganz normal Sensor 1 nehme ich an: 1.3.6.1.4.1.2356.500.2.7101.1.47.20.0 Weil Sensor 2 bis 6 kann man ja gar nicht abfragen (und will ich auch gar nicht).
alf29 hat geschrieben:Falls es um die Extremwerte geht: die sind einmal so (falsch) gemessen worden und dann persistent gespeichert, die verschwinden auch durch ein Firmware-Update erstmal nicht.
Nö, natürlich geht es nicht um die Extremwerte. Dass die, so extrem wie sie sind, natürlich als Extrema erhalten bleiben, ist mir klar. Wobei es LANCOM gut stehen würde mit einem Firmware-Update die Werte mal unauffällig zurückzusetzen, weil -1.000 °C natürlich absurd sind. Aussagekraft hat die Tabelle so oder so nicht mehr...

Irgendwie überlege ich noch, ob die Anzahl der Fehlerwerte nicht doch trotzdem zurückgegangen ist. Also es mag schon sein, dass da ein Problem beseitigt wurde, das will ich wie gesagt glauben. Aber vielleicht tritt das gleiche Problem bei einer ähnlichen Konstellation, vielleicht mit etwas verdrehten Bits und Bytes nach wie vor auf? Weil während ich den Beitrag jetzt schrieb, lieferte ein 'repeat 1 ls st/hard/temp' keine Fehlerwerte, das ging früher doch schneller.

Vielen Dank und viele Grüße,
Jirka
Benutzeravatar
alf29
Moderator
Moderator
Beiträge: 6205
Registriert: 07 Nov 2004, 19:33
Wohnort: Aachen
Kontaktdaten:

Re: Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24

Beitrag von alf29 »

Moin,
Was soll ich dazu noch sagen? Wie in diesem Thread bereits geschrieben, werden urplötzlich Temperaturen gemeldet, die nicht sein können, bevorzugt z. B. 2 oder 6 °C, während die echte Temperatur z. B. bei 36 °C liegt. Die Abfrage erfolgt bei mir eigentlich alle 60 Sek. per PRTG/SNMP. Klar, in 99,9 % der Fälle stimmen die Messwerte, aber bei 60 Messwerten je Stunde und das 24 Stunden lang, also somit 1440 Messwerten, tanzen nach wie vor 1, 2 oder 3 (selten auch mal 4 oder gar keiner) Werte pro Tag aus der Reihe. Wobei es keine Rolle spielt, ob ich die Werte nun per SNMP abfrage oder auf der Konsole ein 'ls st/hard/temp' mache. PRTG ist natürlich bequemer. Aber ein 'repeat 1 ls st/hard/temp' führte gestern innerhalb von gut 2 Minuten zu einem Fehlerwert. Es kann aber auch mal länger dauern. Man kann die Konsolenausgabe ja auch 15 Minuten mitloggen lassen und dann mal nach "INFO: 2" oder "INFO: 6" suchen...
Tja, bei dem Kollegen läuft's eben ohne solche Aussetzer, und hier bei mir ein "rep 1..." auf einem 9100 auch seit mindestens einer Viertelstunde ohne Aussetzer.
Ich kann Dir gerne mal Zugangsdaten zu dem Router zukommen lassen, damit Du Dich selber davon überzeugen kannst.
Glauben wir Dir schon, aber das wird wohl nichts mutzen, weil man das nicht sinnvoll remote debuggen kann.
Ich glaube das auch, wobei welche Firmware hat der auf dem 9100? Eine 10.12?
Hier: Auf jeden Fall eine mit dem Fix. Und ja, ein Stand, den's offiziell für ein 9100 ohne Plus nicht gibt. Was dafür jetzt aber nichts zur Sache tut...
Aber vielleicht tritt das gleiche Problem bei einer ähnlichen Konstellation, vielleicht mit etwas verdrehten Bits und Bytes nach wie vor auf? Weil während ich den Beitrag jetzt schrieb, lieferte ein 'repeat 1 ls st/hard/temp' keine Fehlerwerte, das ging früher doch schneller.
Welche Hardware-Release hat Dein Gerät? Wieviel CPU-Last ist im Schnitt drauf? Zumindest meines tut im Augenblick nichts, außer dem rep 1...
“There is no death, there is just a change of our cosmic address."
-- Edgar Froese, 1944 - 2015
Benutzeravatar
Jirka
Beiträge: 5225
Registriert: 03 Jan 2005, 13:39
Wohnort: Ex-OPAL-Gebiet
Kontaktdaten:

Re: Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24

Beitrag von Jirka »

Hallo Alfred,
alf29 hat geschrieben:Tja, bei dem Kollegen läuft's eben ohne solche Aussetzer, und hier bei mir ein "rep 1..." auf einem 9100 auch seit mindestens einer Viertelstunde ohne Aussetzer.
glaube ich Dir auch :-) Hier 30 Minuten Mittagspause 12 Fehlerwerte, wovon sogar PRTG, der ja nur alle 60 Sek. einmal abfragt, zwei von abbekommen hat:
2018-03-02 15_04_52-PRTG Network Monitor (SERVER) _ Details des Sensors.png
Die von mir oben angegebenen "INFO: 2" nach denen man suchen soll, wurden nicht so übernommen, wie ich sie eingegeben hatte mit der Anzahl der Leerzeichen (die werden einfach zu einem Leerzeichen verkürzt dargestellt), in der Praxis sieht es so aus (immer die gleiche Anzahl Leerzeichen, dahinter der Temperaturwert mit den entsprechenden Anzahl Stellen):

Code: Alles auswählen

[1 Sec.-REPEAT];root@CC-RIS-HGW:/
>

Temperature-Degrees  INFO:    35

[1 Sec.-REPEAT];root@CC-RIS-HGW:/
>

Temperature-Degrees  INFO:    2

[1 Sec.-REPEAT];root@CC-RIS-HGW:/
>

Temperature-Degrees  INFO:    35
alf29 hat geschrieben:Glauben wir Dir schon, aber das wird wohl nichts nutzen, weil man das nicht sinnvoll remote debuggen kann.
Aber man kann es mit eigenen Augen sehen. Würde mir zumindest schon mal soweit helfen, als dass akzeptiert wird, dass da eben noch ein Problem ist.
alf29 hat geschrieben:Welche Hardware-Release hat Dein Gerät? Wieviel CPU-Last ist im Schnitt drauf? Zumindest meines tut im Augenblick nichts, außer dem rep 1...
Also es sind ja mehrere Geräte. Den ich jetzt konkret anschaue, der hat z. B.:

Code: Alles auswählen

DEVICE:                LANCOM 7100+ VPN
HW-RELEASE:            D
VERSION:               10.12.0284 / 23.02.2018
LOADER:                4.21.0000
Production-Date:       2015-10-28
MOD-Level:             D0
CPU-Last seit 14 Uhr zwischen 0 und 1 %. Die Firma kann es sich leisten Freitags 14 Uhr Schluss zu machen. Aber auch sonst ist die CPU-Last keinesfalls auffällig, eigentlich immer unter 10 %. Also mit Überlastung kann man das Problem definitiv nicht erklären, da muss was anderes dahinterstecken. Ich schaue mir das jetzt noch mal auf weiteren Geräten an und werde einen WLC-4100 übers Wochenende auch mal dafür auf die 10.12 bringen und dann würde ich mich in einer Woche noch mal melden.

Vielen Dank und viele Grüße,
Jirka
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Benutzeravatar
alf29
Moderator
Moderator
Beiträge: 6205
Registriert: 07 Nov 2004, 19:33
Wohnort: Aachen
Kontaktdaten:

Re: Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24

Beitrag von alf29 »

Es wird sich in dem Bereich wohl noch einmal etwas tun. Und nein, bevor Du fragst, ich werde hier nicht erklären, was.
Wobei es LANCOM gut stehen würde mit einem Firmware-Update die Werte mal unauffällig zurückzusetzen, weil -1.000 °C natürlich absurd sind.
Ja.
“There is no death, there is just a change of our cosmic address."
-- Edgar Froese, 1944 - 2015
Benutzeravatar
Jirka
Beiträge: 5225
Registriert: 03 Jan 2005, 13:39
Wohnort: Ex-OPAL-Gebiet
Kontaktdaten:

Re: Temperatursensor im 7100(+)/9100(+)/WLC-BFG spinnt (9.24

Beitrag von Jirka »

Hallo Alfred,
alf29 hat geschrieben:Es wird sich in dem Bereich wohl noch einmal etwas tun. Und nein, bevor Du fragst, ich werde hier nicht erklären, was.
den Satz habe ich eben erst gelesen, der stand da oben so verloren, den habe ich vor ein paar Tagen wohl übersehen...
Na gut, dann frage ich nicht. Aber hört sich komisch geheimnisvoll an.

Ich wollte Dir jetzt eigentlich schon mal ein Update geben, was bisher so rausgekommen ist. Sind ja auch positive Sachen dabei. Also zwei WLC-4100 (mit Beta-10.12) liefen mit PRTG ohne Mangel, zwei weitere andere Geräte (7100+/9100+) auch. Deswegen nehme ich auch an, dass wirklich was anders/besser ist.

Zwei 7100+ mucken hier aber rum. Wobei ich sagen würde, aber das ist jetzt nicht belastbar, dass vorher Fehlerwerte waren z. B. 2 und 6 °C und jetzt nur noch 2 °C. Möglicherweise auch eine Besserung. Die Anzahl der Fehlerwerte würde ich aber sagen ist gleich geblieben, so sah es unmittelbar vorm Schlafengehen aus:
2018-03-05 02_06_32-PRTG Network Monitor (SERVER) _ Details des Sensors.png
Sind jetzt aber ungewöhnlich viele Fehlerwerte auf dem Diagramm hier.

Nun gut, soweit also. Dann warten wir mal ab. Bzgl. des ersten Satzes: Wenn Du nicht erklären wirst, was sich tun wird, dann doch aber vielleicht, wann sich was getan hat, dann würde ich hier natürlich gerne mal schauen.

Vielen Dank und viele Grüße,
Jirka
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Antworten