Neue Firmware 0.5.11

also ohne WIFI ist der 841 bei mir stabil … sobald ich WIFI anmache stürzt er ab oder startet neu.

wie kann man IBSS deaktivieren, bzw. wie schaltet man das mesh um?

Also auch ich kann von Knoten berichten, die praktisch gar nicht mehr gehen:

http://s.ffrn.de/dashboard/db/nodes?panelId=4&fullscreen&var-Node=Lorsch-016&var-Node=Lorsch-004&var-Node=Lorsch-021

Uptime > 5 Minuten ist in den letzten Minuten schon die Ausnahme.

Im Config Mode, unter Experteneinstellungen und dann WLAN (glaube ich)

Ich brauche da die SSH-Befehle … an die Oberfläche komme ich kaum ran, bei vielen Knoten

Das könnt ihr leider nicht ohne die 0.5.12er Version machen. Das sind einige Änderungen mehr die Manuell nur umständlich möglich sind. Bitte wartet ein paar Tage ob sich das normalisiert oder nicht.

D.h. wenn man noch folgender Anleitung vorgeht funktioniert das eventuell nicht?

Und auch die Einstellungen im Config-Mode tun nicht unbedingt das, was man erwarten würde?

Das funktioniert nicht nur eventuell nicht, das funktioniert garantiert nicht. Wie schon gesagt, diese Updates hängen insbesondere wegen der VLAN Umstellung sehr eng zusammen und können manuell nur umständlich nachgestellt werden. Das ist nicht schön, muss aber gemacht werden. Am Ende werden wir davon dann aber deutlich profitieren.

Alle Umstellungen die das Mesh betreffen werden evl. nicht sauber funktionieren.

Bedeutet das, dass man in Zukunft Mesh-on-LAN leichter über VLANs leiten kann? Genau das habe ich nämlich vor. Auch wenn es aktuell mit Klimmzügen schon möglich ist, kann man sich mit VLAN-Stacking super in die Füße schießen.

Jap. Die Pakete werden ab Version 0.5.12 der Firmware nicht mehr getaggt. Es ist also ganz normal möglich sie in ein VLAN zu packen. Auch ein Grund für diese Umstellung.

Gegeben sind die 3 Knoten:

  • yahut (WR841 v8.4; Uplink; privates WLAN)
  • croga (WR841 v9; nur per wlan-mesh verbunden; hat in der Regel nur mit yahut eine Verbindung)
  • albert (WR841 v9; Uplink, privates WLAN; hat in der Regel nur mit yahut eine Verbindung)

Ich habe letzte Woche die beiden Knoten croga und yahut auf experimental gestellt, sodass sie dann gestern abend ihr Update bezogen. Anhand der Uptimes im Grafana gehe ich mal davon aus, dass beide ihr Update zwischen 20:30Uhr und 21Uhr einspielten (2016-09-04). Ab diesem Zeitpunkt sehe ich die Uptime-Graphen der beiden Knoten ständig einbrechen, während albert (stable) ununterbrochen steigt.
http://stats.ffrn.de/dashboard/db/nodes?var-Node=albert&var-Node=croga&var-Node=yahut&from=1473012023000&to=1473062400000

Heute (2016-09-05) um kurz nach 11Uhr habe ich dann albert auf experimental gestellt und das Update manuell angestoßen. Wenig später sehe ich im Grafana, wie die etwas erholten Uptimes von yahut und croga wieder einbrechen.
http://stats.ffrn.de/dashboard/db/nodes?var-Node=albert&var-Node=croga&var-Node=yahut&from=1473064223000&to=1473069600000

Ab da rebooten die 3 Geräte ständig und erreichen keine Uptime >41 Minuten. Da ich erstmal davon ausgegangen bin, dass albert da störend wirkt, habe ich ihn um kurz nach 15 Uhr vom Strom getrennt. Seit dem beobachte ich bei yahut und croga keine reboots mehr.
http://stats.ffrn.de/dashboard/db/nodes?var-Node=albert&var-Node=croga&var-Node=yahut&from=1473067223796&to=1473084000000

Auch ist mir aufgefallen, dass die TQ zwischen yahut und croga nun wieder im Bereich von 94% ist. Während albert mit experimental aktiv war, war der Wert auf 27% gesunken. Gleichzeitig konnte ich auf der Karte erstmals eine (schlechte) Verbindung zwischen croga und albert sehen. Wegen 2 Stahlbetondecken und vielen Kalksandsteinmauern sollte eine Verbindung keine großen Geschwindigkeiten liefern.

Hat jemand eine Idee, was ich als nächstes prüfen sollte?

Grundsätzlich ist zu erwarten das mit diesem Update die Last auf den Knoten minimal steigt und es zu einer Verschlechterung der TQ um bis zu 10% kommt. Diese sollten jedoch nur vorübergehend auftreten bis wir auf 0.5.12 gehen.

Das deine Knoten jetzt häufiger rebooten und das scheinbar mit 0.5.11 und 0.5.10 in Abhängigkeit von dem 0.5.11er Knoten überrascht mich doch sehr. Kannst du alle Knoten mal vom Strom trennen und das Ganze dann nochmal beobachten?

Die allermeisten meiner “kleinen” Lorscher Knoten booten im Moment noch viel mehr also die ganze Zeit mit der 5.10 schon. In der Unterkunft ist damit jetzt leider entgültig kaum mehr zu arbeiten :-( Ich bin kurz davor dort alles bis auf den einen 1043er abzuschalten. Aber der ist mit dem Handy nur in einem einzigen Raum empfangbar.

@leah: Wie ich sehe hast du von der 5.12 wohl schon 2 Betas am laufen? richtig ? :-)

Wäre das Image schon so weit benutzbar das ich damit auch mal 1-2 Beta-Knoten bei mir hier im Haus testen könnte um zu sehen, ob das Reboot Problem darauf überhaupt anspricht?

Darf ich fragen warum du in einer Unterkunft gegenwärtig überhaupt auf dem Experimental Branch bist? Der ist explizit nicht dafür gedacht irgendwo in produktiven Umgebungen eingesetzt zu werden. Er ist eben experimentell und da kann mal was kaputt gehen.

Das Problem mit dem Reboots ist definitiv auf diese Firmware Version zurück zu führen, da sie keine Änderungen gegenüber der 0.5.10er enthält außer das aktivieren von 802.11s. Warum sich das bei manchen Knoten so extrem zeigt wundert mich etwas. Die Alpha Version die auf den beiden Knoten von mir läuft, kann ich so nicht raus geben. Ich kann aber gucken das ich mal eine Version der 0.5.12er baue die du testen kannst.

Sorry, ich weiss du hattest es angekündigt - war nicht ganz Absicht . Hatte sie wegen der lezten Updates noch auf dem Zweig.
Ich überlege , ob ich jetzt noch auf die 5.10 zurück gehe. Aber viel besser war es da ja auch nicht.

Danke, dann könnte ich damit zumindest hier schon mal ein wenig rumspielen.

Das wird nicht so viel helfen. Besser wäre es, wenn du die Knoten schon mal auf Stable umstellst.

Wir haben jetzt entschieden die 0.5.11er Firmware in allen Branches auszuliefern, um so schnell wie möglich mit dem Update auf die Version 0.5.12 beginnen zu können. Da die einzige Änderung das zusätzliche aktivieren von 802.11s ist, könnten wir daran leider eh nichts verbessern und müssten diesen Schritt früher oder später gehen.

Für Betreiber von Knoten die den Autoupdater deaktiviert haben. Bitte aktiviert ihn für dieses Update oder spiel die Updates von 0.5.10 auf 0.5.11 auf 0.5.12 manuell ein. Unbedingt aber in dieser Reihenfolge direkt von 0.5.10 auf 0.5.12 geht nicht. Wenn dies nicht erfolgt, ist der Knoten leider bald offline, sofern er keinen Uplink hat.

Das auf der Knoten mehr Knoten als offline angezeigt werden hat btw. nix mit dem Update zu tun und ist eine fehlerhafte Darstellung.

1 „Gefällt mir“

Ich denke, das ist die richtige Entscheidung, auch wenn uns heute vielleicht einiges um die Ohren fliegt.

Mit etwas Glück wird es zumindest langfristig besser, und wirklich andere Lösungen haben wir ja aktuell nicht.

1 „Gefällt mir“