Wie temporäre Fehler analysieren?
Moderator: Lancom-Systems Moderatoren
Wie temporäre Fehler analysieren?
Hi,
mein 1781VAW läuft grundsätzlich einwandfrei und dann aus heiterem Himmel sieht es so aus:
- DNS geht nicht mehr
- ping zum Router geht, https und ssh aber nicht mehr
- Zugriff via LANconfig funktioniert
- GUESTS Bereich funktioniert uneingeschränkt
- "Internes Netz" funktioniert praktisch nicht mehr z.B. Firewall Regeln für direkten Internetzugriff
Nach einem Reboot des Routers funktioniert alles für mehrere Minuten, dann wieder derselbe Zustand.
Jetzt, nach rund 2 Stunden nichts tun, funktioniert wieder alles.
Wie und womit kann ich mich auf Fehlersuche begeben? Es funktioniert dann nur noch der Zugriff
via LANconfig und LANmonitor.
TIA
Roland
mein 1781VAW läuft grundsätzlich einwandfrei und dann aus heiterem Himmel sieht es so aus:
- DNS geht nicht mehr
- ping zum Router geht, https und ssh aber nicht mehr
- Zugriff via LANconfig funktioniert
- GUESTS Bereich funktioniert uneingeschränkt
- "Internes Netz" funktioniert praktisch nicht mehr z.B. Firewall Regeln für direkten Internetzugriff
Nach einem Reboot des Routers funktioniert alles für mehrere Minuten, dann wieder derselbe Zustand.
Jetzt, nach rund 2 Stunden nichts tun, funktioniert wieder alles.
Wie und womit kann ich mich auf Fehlersuche begeben? Es funktioniert dann nur noch der Zugriff
via LANconfig und LANmonitor.
TIA
Roland
Re: Wie temporäre Fehler analysieren?
Das hört sich an wie als wenn da die IP-Adresse des LANCOM-Routers doppelt vergeben ist. Ich würde mir im Fehlerfall die ARP-Auflösung mal genauer anschauen.
Re: Wie temporäre Fehler analysieren?
Ich hab jetzt endlich genauere Informationen sammeln können und es sind 2 Fehler:
Fehler 1:
Seit dem Upgrade eines PC von Debian 10 auf 11 funktioniert manchmal das lokale Netz unmittelbar nach dem Booten nicht, nach einem simplen Restart ohne irgendeine Änderung meistens dann doch (selten braucht es weitere Reboots). Seit 20.3. hatte ich 76 Neustarts, davon trat dieser Fehler 14x auf. Alle anderen Devices aus diesem Segment haben keine Probleme d.h. für mich ist das kein Fehler des Routers
arp sieht im Fehlerfall so aus:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 (incomplete) br0
Fehler 2:
Ich habe in meinen Netz einer weiteren Router, der sich als Client im WLAN beim Lancom anmeldet und weitere Geräte so mit dem Netz verbindet. Manchmal (keine Ahnung warum) kommt es zu arp Fehler und das betrifft dann alle Systeme in diesem Segment. Die beiden anderen Segmente funktionieren dagegen problemlos.
Alle Systeme haben dann die MAC Adresse des zweiten Routers in der arp Tabelle für den Lancom Router:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 ether 00:18:f8:38:3c:ab C br0
Richtig wäre:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 ether 00:a0:57:24:9e:97 C br0
Heute lief es erst falsch und hat sich dann von selbst repariert. Der Zeitpunkt liegt ziemlich genau mit dem Einschalten eines Notebooks, dass sich via DHCP eine IP-Adresse geholt hat, zusammen. Im Lancom syslog sieht das so aus:
5 2023-07-09 15:12:26 KERN Notice DHCP: IP 192.168.147.67 assigned to MAC: 00:1c:25:9e:bc:e1 for 500 Minutes
6 2023-07-09 15:06:09 AUTH Notice [WLAN-1] Determined IPv4 address for station 00:18:f8:38:3c:ab (Cisco-Linksys 38:3c:ab): 192.168.147.233
Von einer anderen Applikation bekomme ich den erfolgreichen Verbindungsversuch (was die alle 20s probiert) um 15:12:32 gemeldet.
Für mich sieht das nach einem Fehler des Lancom Routers (Firmware LCOS 10.50.1180 (RU11)) aus. Liest der Support hier mit?
Fehler 1:
Seit dem Upgrade eines PC von Debian 10 auf 11 funktioniert manchmal das lokale Netz unmittelbar nach dem Booten nicht, nach einem simplen Restart ohne irgendeine Änderung meistens dann doch (selten braucht es weitere Reboots). Seit 20.3. hatte ich 76 Neustarts, davon trat dieser Fehler 14x auf. Alle anderen Devices aus diesem Segment haben keine Probleme d.h. für mich ist das kein Fehler des Routers
arp sieht im Fehlerfall so aus:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 (incomplete) br0
Fehler 2:
Ich habe in meinen Netz einer weiteren Router, der sich als Client im WLAN beim Lancom anmeldet und weitere Geräte so mit dem Netz verbindet. Manchmal (keine Ahnung warum) kommt es zu arp Fehler und das betrifft dann alle Systeme in diesem Segment. Die beiden anderen Segmente funktionieren dagegen problemlos.
Alle Systeme haben dann die MAC Adresse des zweiten Routers in der arp Tabelle für den Lancom Router:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 ether 00:18:f8:38:3c:ab C br0
Richtig wäre:
Address HWtype HWaddress Flags Mask Iface
192.168.147.1 ether 00:a0:57:24:9e:97 C br0
Heute lief es erst falsch und hat sich dann von selbst repariert. Der Zeitpunkt liegt ziemlich genau mit dem Einschalten eines Notebooks, dass sich via DHCP eine IP-Adresse geholt hat, zusammen. Im Lancom syslog sieht das so aus:
5 2023-07-09 15:12:26 KERN Notice DHCP: IP 192.168.147.67 assigned to MAC: 00:1c:25:9e:bc:e1 for 500 Minutes
6 2023-07-09 15:06:09 AUTH Notice [WLAN-1] Determined IPv4 address for station 00:18:f8:38:3c:ab (Cisco-Linksys 38:3c:ab): 192.168.147.233
Von einer anderen Applikation bekomme ich den erfolgreichen Verbindungsversuch (was die alle 20s probiert) um 15:12:32 gemeldet.
Für mich sieht das nach einem Fehler des Lancom Routers (Firmware LCOS 10.50.1180 (RU11)) aus. Liest der Support hier mit?
Re: Wie temporäre Fehler analysieren?
Den zweiten Router betreibst Du ja offensichtlich als Access Point. Bist Du sicher, dass auf diesem kein DHCP-Server läuft?
P.S.: Meines Wissens liest die Firma LANCOM hier nicht mit (es heißt ja auch inoffizielles Forum )
P.S.: Meines Wissens liest die Firma LANCOM hier nicht mit (es heißt ja auch inoffizielles Forum )
LANCOM 1781VA mit All-IP-Option, LANCOM 1784VA
Hagen
Hagen
Re: Wie temporäre Fehler analysieren?
Nein, kein Access Point sondern Client Mode d.h. dieser Router loggt sich beim Lancom ein. Ich hab nochmal nachgesehen, DHCP ist bei dem disabled.
Re: Wie temporäre Fehler analysieren?
systemd-resolved.service
macht da evtl. Probleme ...
Mach mal folgendes:
systemctl status systemd-resolved.service
systemctl stop systemd-resolved.service
systemctl disable systemd-resolved.service
rm -rf /etc/resolv.conf
vi(m) /etc/resolv.conf
Code: Alles auswählen
nameserver "IP-Adresse deines Routers"
danach "chattr +i /etc/resolv.conf"
Re: Wie temporäre Fehler analysieren?
systemd-resolved habe ich nicht installiert. Außerdem geht ja schon der Layer drunter schief und betrifft alle Geräte in dem Segment.
Re: Wie temporäre Fehler analysieren?
Der LANCOM Support bietet kostenpflichtigen Support für 200,- Euro netto je angefangene 60 Minuten und grundsätzlich helfe ich gerne Fehler zu finden, allerdings nicht wenn ich dafür zahlen muss. Egal, ich kann mit dem Fehler leben und irgendwann wird ihn halt jemand anderes fixen.
Re: Wie temporäre Fehler analysieren?
Zwei Gedanken dazu:
- Kann es sein, das jemand in Netz Multicast DNS macht?
- Kannst Du einen Syslog Server aufsetzen und
vom LANCOM Router alles dort hin notifizieren lassen?
Syslog hilft mir immer sehr bei der Analyse von merkwürdigen Verhalten.
Viele Grüße
ts
- Kann es sein, das jemand in Netz Multicast DNS macht?
- Kannst Du einen Syslog Server aufsetzen und
vom LANCOM Router alles dort hin notifizieren lassen?
Syslog hilft mir immer sehr bei der Analyse von merkwürdigen Verhalten.
Viele Grüße
ts
TakeControl: Config Backup für LANCOM Router, ALC, APs und Switche...
https://www.linkedin.com/posts/activity ... 04032-DNQ5
https://www.nmedv.de
https://www.linkedin.com/posts/activity ... 04032-DNQ5
https://www.nmedv.de
Re: Wie temporäre Fehler analysieren?
Multicast DNS? Kann ich mir nicht vorstellen, das sind alles Standardsysteme.
Syslog hab ich von Anfang schon eingerichtet, aber darin finde ich nichts erhellendes. Ich gehe davon, dass wenn sich der 2te Router beim Lancom als Client anmeldet, LCOS' ARP Tabellen durcheinander geraten und so die falsche MAC Adresse ins Netz posaunt.
Syslog hab ich von Anfang schon eingerichtet, aber darin finde ich nichts erhellendes. Ich gehe davon, dass wenn sich der 2te Router beim Lancom als Client anmeldet, LCOS' ARP Tabellen durcheinander geraten und so die falsche MAC Adresse ins Netz posaunt.
Re: Wie temporäre Fehler analysieren?
Eigentlich hat das damit nichts zu tun, aber versuche mal:
Proxy ARP auf dem LANCOM auszuschalten
(Dürfte dann Probleme bei Einwahl Verbindungen machen)
Auf der DSL Verbindung die globale MAC auf local umstellen
Schauen ob sich was ändert und dann weitersehen.
Viele Grüße
ts
TakeControl: Config Backup für LANCOM Router, ALC, APs und Switche...
https://www.linkedin.com/posts/activity ... 04032-DNQ5
https://www.nmedv.de
https://www.linkedin.com/posts/activity ... 04032-DNQ5
https://www.nmedv.de