Experimental Firmware 0.5.10

Ich hab heute Nacht eine neue Experimental Version der Firmware veröffentlicht die nur eine kleine Änderung enthält.
Der Patch für unser Load Problem wird jetzt zeitgleich mit dem laden der anderen Parameter aus der sysctl.conf gestartet. Vielleicht können wir so das Problem beheben, dass der Patch nicht genau so wirksam ist. (Danke an wer auch immer das vorgeschlagen hatte, finde gerade nicht mehr wer es war.)

https://forum.ffrn.de/t/workaround-841n-load-neustart-problem/1167/102?u=tobox

Auf all meinen Knoten wurde die Firmware gegen 4:00 Uhr heute morgen eingespielt, und seit ca. 11:00 Uhr habe ich eine avg. Load von fast 1. Ist das ein Problem des Netzes oder der Knoten? Bei mir ist niemand zu Hause, an den Clients kann es also eigentlich nicht liegen.

http://s.ffrn.de/dashboard/db/nodes?panelId=3&fullscreen&var-Node=Bensheim-002&var-Node=Bensheim-006&var-Node=Bensheim-014&var-Node=Bensheim-015&from=1469483983753&to=1469702778979

Edit: Ist scheinbar der bekannte Load-Sprung bei 1500 clients. Aber warum hatten meine Knoten den in den letzten Tagen nicht? Sehr seltsam das ganze. Ist vielleicht nur beim ersten Sprung über 1500 clients.

Das hatte ich auch nach den letzten Updates … direkt danach lief es schlecht, aber ein Neustart hat dann wieder stabilere Verhältnisse gebracht.

Aktuell hab ich aber auch einige Probleme … ein Knoten ist “weg” und auch in Grafana fehlen zeitweise die Daten für einige Knoten…

Hui, das ihr das Problem habt überrascht mich doch etwas. Sollte durch diese kleine Änderung eigentlich nicht passieren. Ich würde vorschlagen wir beobachten bei unseren Knoten mal ob sich in den nächsten Tagen eine Besserung einstellt und wenn nicht, versuchen wir es nochmal mit einem anderen Wert. Einen unterschied macht es ja offensichtlich :)

Das lag vermutlich an den Problemen mit dem Karten Server im laufe des Tages.

Heute haben alle meine Knoten die 1500er Marke problemlos (ohne sichtbare Auswirkungen auf die Load) übersprungen.

1 „Gefällt mir“

Seht ihr jetzt nach ein paar Tagen eine Verbesserung bei euren Knoten im vergleich zur 0.5.9er Firmware?

Schwer zu sagen, meine Knoten zu Hause liefen sonst auch einigermaßen durch, und den “Roaming-Stresstest” kann ich gerade nicht machen, da ich nicht zu Hause bin. Ein gutes Indiz ist allerdings, dass Lorsch-021 mit der neuen Firmware eine längere Uptime geschafft hat, als die letzten 3 Wochen mit der alten Firmware:

http://s.ffrn.de/dashboard/db/nodes?from=1467401031622&to=1469992971623&var-Node=Lorsch-021&panelId=4&fullscreen

Von den Neustarts keine Änderung. Nach wie vor eine höhere Load als bei der FW davor, wo es manuell gepatcht war.
Aber “okay” … besser wird es vermutlich nicht, wenn man es mit dem Script versucht.

Du könntest ja mal den Patch deaktivieren und die Werte wieder manuell einfügen und gucken ob es dann besser wird. Evl. hängt es ja auch mit der neueren Firmware Version zusammen.

wenn es für das de/aktivieren des Patches einen Tip gibt, dann gerne! Ich hab das nicht so verfolgt, wie ihr den da eingebaut habt.

Diese Firmware Version ist jetzt seit dem 23.08 auch in Stable verfügbar gewesen und inzwischen auf fast allen Knoten ausgerollt. Seit dem sieht die Uptime der Knoten deutlich besser aus. Die Load ist zwar insgesamt wieder etwas gestiegen, aber solange die Knoten stabil laufen scheint das nicht das größte Problem zu sein.