Firmware 0.5.8 verfügbar (Load Patch)

Ich hab gerade die Version 0.5.8 im Experimental Branch veröffentlicht. Diese enthält als einzige Änderung zur vorherigen Version 0.5.4 das von @tobox gebaute Paket mit dem Workarround für die Load. Beobachtet bitte, ob es bei euren Knoten jetzt besser wird oder zu Problemen kommt.

Wenn das alles ohne Problem läuft, kann nächste Woche das Update auch nach beta und stable.

Die Diskussion zu dem Thema sollte jetzt hier fortgesetzt werden. Der alte Thread wird geschlossen.

2 „Gefällt mir“

Ich hatte eben noch die Idee, auf dem Knoten Lorsch-022 temporär eine experimental auf Basis von 2016.1.5 zu spielen, um zu sehen ob der Knoten dann damit stabil läuft. Mit der 2016.1.4 wurden ja scheinbar stabilere WLAN-Treiber eingebunden.

Meinst Du, es kann Probleme im Netz geben, wenn ein Knoten mit einer neueren Firmware läuft? Soweit ich das sehe, müsste das relativ kompatibel sein.

Wenn du das jetzt sofort testen willst, kannst du das machen. Bitte bleib dann aber bei deiner Versionsnummer 0.5.7 und schalte erstmal den Autoupdater aus.

Mir ist vorhin noch etwas eingefallen: Es ist unwahrscheinlich, dass es sich um ein reines RAM-Problem handelt. Beim Firmware-Update laden die Knoten ja problemlos 3.6MB an Daten herunter, die in /tmp und teilweise zusätzlich im RAM liegen. D.h., zu dem Zeitpunkt kann das System ohne abzustürzen über 10% des RAMs bereitstellen.

Ist es auch nicht, lies dir mal den letzten Stand im Gluon Issue durch, da wird in etwa klar wo das Problem liegen könnte. Wenns nicht klar wird, frag gerade nochmal nach.

Also ganz habe ich dort auch noch nicht gesehen, was denn nun das Problem ist. Dass das lesen aus dem debugfs mit seinen reallocs ziemlich ineffizient ist, hatten wir ja vorher schon gemerkt. Da wäre die Frage, ob man nicht vorher die benötigte Größe berechnen kann, und dann in einem Rutsch in einen ausreichend großen Puffer lesen kann.

Den zweiten Punkt, den ich im Gluon als Fehlerquelle verstanden habe, ist dass die TG-Table nur quadratisch größer wird, aber wir sind ja “nur” an der Grenze von 2^6 zu 2^7 pages, also bei einem halben MB (pagesize ist doch 4k, oder?).

Oder ist hier das Problem, dass der freie Speicher zu stark fragmentiert ist, diese Funktionen aber zusammenhängende Bereiche brauchen?

Konnte jemand bisher Probleme mit der neuen 0.5.8er Firmware feststellen, oder tut sie bei euch was sie soll?

Bei mir läuft sie auf einem 841er V8 ohne problemlos. Mit der alten Firmware ist der Knoten mehrmals am Tag neu gestartet, mit dem Load Patch dann praktisch nicht mehr. Mit der neuen Firmware habe ich keinen Unterschied zum Load Patch feststellen können. Alles funktioniert bestens.

Vielen Dank für eure Arbeit und die Behebung des Problems :)

Bei mir dasselbe. Läuft genauso wie die 0.5.7.

Da es in den letzten 7 Tagen keine Probleme gab, habe ich gerade auch für den Beta und Stable Branch die entsprechenden neuen Firmware Versionen freigegeben. Sollte also in den nächsten Stunden und Tagen per Autoupdate kommen.

2 „Gefällt mir“

Ich sehe gerade, dass manche Knoten mit der aktuellen Firmware (aber auch einige ältere) die E-Mailadresse des Besitzers über Alfred verteilen. Ist das Absicht? Und warum machen dass nur so wenige?

Beispiel: FFRN-Eppstein001

Mein Knoten MA-Weberstrasse-Mitte bootet nach update nicht mehr.
Weiß nicht, ob das am Update, oder an anderen Umständen liegt.
LEDs leuchten kurz auf, und bleibt dann sofort auf der Power LED hängen.
Leuchtet dauerhaft.

Wie kann ich den Knoten wieder fixen? Also das Update nochmal neu einspielen?

Ok, dass überrascht mich jetzt auch ein bisschen. Das Modul, dass dafür eigentlich zuständig ist, haben wir nämlich nie installiert gehabt, weil es aus Datenschutzgründen eben fragwürdig ist. Ich vermute, dass diese Knoten mal die Firmware einer anderen Community aufgespielt hatten und dann nicht sauber neu mit unserer geflasht wurden.

Kannst du mir mal ne Liste der Knoten per PM schicken, dann informiere ich die Betreiber.

Hast du ihn schon mal neu gestartet? Wenn ja, guck mal ob du mit dem normalen Prozedere (6 Sek. WPS/Reset drücken in den Config Mode kommst.)

Nein. Es geht gar nix mehr.
Die einzige Reaktion die ich erzeugen kann, ist, wenn ich die Reset-Taste beim einschalten des Gerätes halte. Dann leuchtet kurz das WPS(Schloss) Symbol auf. Erlischt aber dann ach 10sec. wieder. Sonnst tut sich gar nix mehr.

Hab gerade festgestellt, dass der Knoten „Lustadt-Poststrasse_Garten“ seit dem Update auch nicht mehr online gekommen ist. Weiß aber nicht wie der aktuell da steht. Kein Zugriff im Moment.
Scheint sich völlig abgeschossen zu haben.

Es wäre nicht auszuschließen, dass es ein paar sehr wenige Knoten erwischt hat. Wenn genau während dem Update es Load Probleme gab und der Knoten dann rebooted hat, ist die Firmware bricked. Das ist aber kein all zu großes Problem.

Entweder du kommst noch in den Failsafe Mode: https://wiki.openwrt.org/de/doc/howto/generic.failsafe

Oder du Probierst es mit der TFTP Variante: https://www.freifunk-winterberg.net/tp-link-tl-wr841n-retten/

Ansonsten kannst du uns das Gerät mal auf einem Treffen mitbringen und dann gucken wir es uns auch an.

Wer ähnliche Probleme mit seinem Knoten hat, gerade mal hier melden bitte!

Ich bin die Tage vor Langeweile nicht dazu gekommen … gnnn
Aber ich nehme an, ich muss dann die Änderungen in der sysctl.conf wieder raus machen, oder?

Ich vermute nicht das es die Überlebt haben.

Stimmt, aber dafür ist die Load jetzt leider wieder extrem hoch … kein Vergleich zu vorher …

http://s.ffrn.de/dashboard/db/nodes?var-Node=schriesheim-CBS-001&var-Node=schriesheim-CBS-002&var-Node=schriesheim-CBS-011&var-Node=schriesheim-CBS-012&var-Node=schriesheim-CBS-013&var-Node=schriesheim-CBS-021&var-Node=schriesheim-CBS-offloader&panelId=3&fullscreen&from=1467147749832&to=1467214048788

Hm, das ist schon sehr komisch. Ich hab gerade auch nochmal geguckt, der Patch funktioniert. Allerdings sehe ich auch im Grafana noch immer eine zu hohe durchschnittliche Load, wie wenn der Patch keinerlei Wirkung hätte. (@bitboy0 guck mal in den Chat)

So, große und wichtige Information. Ich hab beim bauen der Metrik in der Spielwiese damals nicht richtig aufgepasst. Dadurch sind die Gateways (die ja auch auf der Karte sind) mit in die Load reingerutscht was die Werte enorm verfälscht hat. Daher waren wohl einige unserer Annahmen was das globale Verhalten angeht falsch. Der Patch hat natürlich trotzdem einen Gewinn, da die Probleme ja schon trotzdem existieren, das haben wir ja auf den individuellen Graphen gesehen. Den Graph hab ich jetzt gefixt. Viel Spaß beim neue Ideen sammeln unsere alten waren es wohl nicht :P

Werde das später auch im Github Issue Updaten. [DONE]