IPv6-Routing zu den Knoten (wieder) sehr instabil

Ich monitore ja viele Knoten, und bei allen kommen seit ca. 3 Tagen hunderte Meldungen über Packet Loss und Latenz. Ist vielleicht seit dem Aufsetzen von Gateway 8 wieder dasselbe Problem mit dem IPv6-Routing zwischen den Gateways reingekommen?

ping6 bensheim-002.nodes.ffrn.de
PING bensheim-002.nodes.ffrn.de(2a01:4f8:100:57ff:c66e:1fff:fee7:aeb4) 56 data bytes
[....]
--- bensheim-002.nodes.ffrn.de ping statistics ---
8 packets transmitted, 3 received, 62% packet loss, time 7042ms
rtt min/avg/max/mdev = 51.788/56.643/61.940/4.165 ms

Das Einspielen der Updates war mit dem Packet Loss fast ein Glücksspiel, da mir andauern bei allen Knoten die Verbindungen hängen geblieben sind.

Ich kann deine Probleme aktuell nicht nachvollziehen. Das Routing stimmt, die Ping Zeiten sind stabil und der Packet Loss eigentlich auch. Der Knoten den du oben getestet hast ist jetzt ja ein Mesh Only Knoten da kann es natürlich zu Störungen auf der Funk Verbindung kommen die für loss sorgen. Das kann ich aber dann leider nicht beeinflussen.

Vom Gateway aus:

Ich bin gerade nicht zu Hause, aber eingetlich steckt der mit einem Kabel am LAN. Sieht auch auf der Weboberfläche so aus, als hätte er LAN Uplink. Folgender Knoten steckt aber hier gegenüber vom Schreibtisch im LAN:

thomasb@pc-tb-debian:~$ ping6 lorsch-013.nodes.ffrn.de
PING lorsch-013.nodes.ffrn.de(2a01:4f8:100:57ff:16cc:20ff:fe37:49d6) 56 data bytes
[...]
--- lorsch-013.nodes.ffrn.de ping statistics ---
10 packets transmitted, 4 received, 60% packet loss, time 9045ms
rtt min/avg/max/mdev = 62.974/81.871/104.305/14.722 ms

Das Problem trat letzten stabilen Version genauso auf wie mit der aktuellen experimental.

Ah, ja er war früher mal ein Mesh only. Ignoriere die Aussage einfach.
Deine Probleme kann ich auch mit diesem Knoten nicht nachvollziehen.

Hier die Pings von den 3 aktiven Gateways:


Evl. machst du von deinem Anschluss aus mal einen langzeit Ping mit dem Tool MTR in Richtung der oben genannten Gateways. Das dann auch sowohl für IPv6 als auch IPv4.

Habe ich gerade versucht. Ist das vielleicht der Fehler?

root@mail:~# host gw06.freifunk-rhein-neckar.de
Host gw06.freifunk-rhein-neckar.de not found: 3(NXDOMAIN)
root@mail:~# host gw08.freifunk-rhein-neckar.de
Host gw08.freifunk-rhein-neckar.de not found: 3(NXDOMAIN)
root@mail:~# host gw05.freifunk-rhein-neckar.de
gw05.freifunk-rhein-neckar.de is an alias for gw05.ffrn.de.
gw05.ffrn.de has address 78.47.110.41
gw05.ffrn.de has IPv6 address 2a01:4f8:d13:53c8::2

Sorry, das war von mir im vorigen Post unpräzise. Du musst gw05.ffrn.de, gw06.ffrn.de und gw08.ffrn.de probieren. Die sind so in der Firmware hinterlegt.

Von meinem vServer bei Hetzner aus:

Heise v4/v6
die 3 Gateways v4/v6
zwei Problematische Knoten (nur v6)

http://paste.ffrn.de/?d23084766ad2af23#E0HFoXa+L/seetzHIL0PpENIgIu+nLtK0DFAZnh2/vc=

Hilft das?

Das hilft mir nur wenn alle diese Knoten auch ihren Uplink über deinen vServer bei Hetzner beziehen. Ansonsten hilft es nicht wenn ich weiß wie die Route von einem Host aussieht der wo ganz anders im Internet platziert ist.

Das verstehe ich nicht. Mein Problem ist, dass ich meine Knoten nicht vernünftig per IPv6 erreichen kann, unabhängig davon, ob ich sie von zu Hause aus erreichen will oder von einem Server im Internet. Ich habe jetzt halt der Server bei Hetzner genommen, da der IPv6 ohne Tunnelanbindung über Hurricane Electric hat, um eine Fehlerquelle auszuschließen.

Ich kann das aber gerne nochmal von meinem lokalen LAN laufen lassen.

Ich habe sowohl die Knoten im Monitoring als auch die Gateways, und die Probleme treten immer nur bei den Knoten auf, die Verbindungen zu den Gateways sind im Allgemeinen OK.

Ich brauche den loalen Test im Netz des Knotens um zu gucken wie gut der Knoten zu den Gateways kommt. Nur so kann ich gucken ob auf der Verbindung Knoten ↔ Gateway ein Problem besteht. Das VPN ist bei eingehenden Pings ja transparent, so das ich da dann einfach nur sehe das es Probleme gibt.

Wenn du jetzt von einem beliebigen Server oder Client mit IPv6 einen Ping zum Gateways machst, muss das ja nicht bedeuten, dass die Verbindung deines Knotens zum Gateway auch gut ist. Schließlich nimmt das Paket da eine ganz andere Route. Gleiches gilt auch für den Weg Knoten ↔ Gateway, den du so nicht sehen kannst da er durch das L2 VPN für dich nicht sichtbar ist.

Was genau meinst Du mit „meinem Anschluss“? Einen Client am Freifunk oder einen beliebigen anderen Client in meinem privaten LAN?

Der Anschluss an dem auch der Knoten selbst hängt.

http://paste.ffrn.de/?7a91731fa9c8505a#WLsAHTde/tehnRFInFSHJ16DztnV62JVind28dYsBTg=

Die Fritz!Box macht leider ICMP Rate Limiting, und auch der Gateway von Unitymedia schickt wohl nicht viel zurück. Trotzdem sieht man, dass die Verbindung zum Knoten schlecht ist im Vergleich zum Weg zum Gateway.

Für mich sieht das eher so aus, als wäre dein HE Tunnel das Problem. Da ab da mindestens 70% Packet Loss dabei sind.

Aber die Pings zu den Gateways gehen problemlos, und die zum Client praktisch garnicht? MTU-Problem?

Habe mal kreuz und quer getracepathed, und jetzt tatsächlich ein Problem beim HE-Tunnel gefunden. Aber ich habe nichts geändert, sein Monaten nicht. Sehr seltsam, ich werde das heute Abend mal weiter debuggen.

Edit: daran lag es aber nicht. Es waren an beiden Tunnelenden leicht unterschiedliche MTUs eingetragen, aber die waren beide klein genug um problemlos zu funktionieren. Wie gesagt, ich habe da auch ewig nichts geändert.

Ich habe jetzt ein paar Knoten (nicht meine, kein HE-Tunnel im Uplink, kein/wenig Mesh) von 2 Servern aus dem Internet mit nativem IPv6 angepingt und bekomme meist zwischen 20% und 60% Packet Loss. Das war bis vor 3 Tagen definitiv nicht so, keine Ahnung was da umgefallen ist.

http://paste.ffrn.de/?4c64e1331fce896b#Q+DVeqkB8v1V9EdHtY3oU/aNh663wa6PYRR++a6JXKw=

Sollte behoben sein. Der Cross Connect von GW08 zum IPv6 Uplink war nicht richtig hoch gekommen als der Gateway deployed wurde. War also diesmal genau das umgekehrte Problem vom letzten mal.

1 „Gefällt mir“

Cool dass Du das Problem gefunden hast! Sollten wir uns nicht mal etwas überlegen, wie man solche Problemen in Zukunft besser vermeiden oder früher erkennen kann? Ich wundere mich immer, dass scheinbar kaum jemand außer mir solche Probleme bemerkt und reported. Wobei es diesmal scheinbar mehr die Kommunikation mit dem Knoten selbst betroffen hat, Client-Traffic lief etwas besser (wobei Meli da auch Probleme hatte).

Die meisten Probleme fallen ja recht schnell auf, sonst würde es hier viel mehr Reports über Probleme geben. Das kann ich als Admin sagen. Also erstmal entspannen :) Du bist nur einer der wenigen die das Netz so intensiv nutzen (monitoren), dass sie die Fehler auch finden. Wer nur surft wird wohl kaum Probleme mit IPv6 feststellen, außer das es vielleicht etwas langsamer ist.

Leider ist es aber auch quasi unmöglich alle möglichen Fehler von vorneherein zu erkennen. Daher bin ich immer auf solche Hinweise wie von dir angewiesen, wenn es mal neue Probleme gibt, die wir so noch nicht hatten. Denn trotz Automatisierung, etc. kann es immer mal sein das ein Interface klemmt oder eine andere Stelle nicht zu 100% funktioniert.

Was man besser machen kann, naja das ist schwer, wenn man nicht ständig aktiv versucht Fehler zu finden. Ich denke aber nicht, dass wir hier wirklich ein Problem haben, dass Fehler lange Zeit ignoriert werden.

Ich erstelle zumindest jedes mal auch einen neuen Check fürs Monitoring, damit so ein Problem beim nächsten mal gleich auffällt. Das funktioniert eigentlich ziemlich zuverlässig und ist denke ich auch ein Sinnvolles vorgehen.

Könnte ich jetzt was zu sagen. Aber lassen wir es. Jeder ist immer dazu eingeladen sich mit dem Netz zu beschäftigen. Wir erklären auch gerne Dinge, wenn es Fragen gibt.

Dieses Thema wurde nach 2 Tagen automatisch geschlossen. Es sind keine neuen Nachrichten mehr erlaubt.