Neue stabile Firmware Version 0.5.2-20160307

@chrisSL ich habe meinen 842nd zum Leben erwecken können, indem ich die Reset Taste gedrückt gehalten habe und um dann Strom gegeben habe. Bei darauf folgenden Boot war er wieder erreichbar.

@leah ich habe nun die beiden 842er mit dem neuen Image versorgt.
http://s.ffrn.de/dashboard/db/nodes?from=1458318579437&to=1458320379438&var-Node=HD-Altstadt-023&var-Node=HD-Altstadt-026

Ich lasse sie mal etwas laufen und teste dann ob sie auch einwandfrei laufen, wenn ich ihnen einen Uplink gebe.
Sie haben sich nun eine Stunde gut gehalten. Ich habe sie gerade (19:05 Uhr) an den Uplink gehängt.
Bei beiden ist mir aufgefallen, dass das Schloss-Symbol nicht blinkt. Das kann bei der Serie aber auch schon so gewesen sein.
https://map.ffrn.de/#!v:m;n:90f6522b5a04
https://map.ffrn.de/#!v:m;n:64700252bf88

Den einen 841er v7.2 konnte ich auch mit der neuen Firmware bespielen
https://map.ffrn.de/#!v:m;n:f8d111811504

Einen 841ND v5 habe ich ebenso bespielt:
https://map.ffrn.de/#!v:g;n:002586d67cd6

Zwei 841ND v8
https://map.ffrn.de/#!v:m;n:647002f1db76
https://map.ffrn.de/#!v:m;n:a0f3c1059a1c


Drei 850re laufen auch
https://map.ffrn.de/#!v:g;n:e894f6bdce36
https://map.ffrn.de/#!v:g;n:10feedda82e0
https://map.ffrn.de/#!v:g;n:c04a0036fdfa


WR1043N/ND v2
https://map.ffrn.de/#!v:m;n:10feed3bafea
https://map.ffrn.de/#!v:m;n:e8de27fd14ac
https://map.ffrn.de/#!v:m;n:c46e1fb3b84e

WR1043N/ND v1
https://map.ffrn.de/#!v:m;n:f4ec38c9c0ba

Es sieht nicht so aus, als würde die generische Failsafe Lösung in meinem Fall funktionieren. Allerdings scheint die TFTP-Lösung zu klappen, denn da sehe ich bereits ohne TFTP-Server paar ausgehende Netzwerkpakete …

https://wiki.openwrt.org/toh/tp-link/tl-wr841nd#tftp_recovery_via_bootloader_for_v8_v9_v10_v11

Ist es bei diesem Bug wirklich so, dass identischer Quellcode manchmal lauffähige, manchmal kaputte Firmwares ausspuckt? Dann ist das wirklich nicht durch testen zu finden. Ich dachte, der Quellcode für die Experimental-Version wäre einfach 3 Wochen älter gewesen als der für die Stable. Zumindest hatte ich das mit den Buildbezeichnungen mal so verstanden. Oder bezieht sich das Builddatum nur bei Experimental-Versionen auf den Gluon-Stand, und bei Stable nicht?

Ja, ein eigener Build ist klar, aber eben mit (nahezu) identischem Source-Code,

Genau das ist das Problem. Das war wirklich ein mieser Bug.

Jain. Das Build Datum bezieht sich eigentlich nie wirklich auf den Stand des Source Code. Sondern auf den Zeitpunkt, zu dem ich die Images baue. Allerdings kann es bei Experimental passieren das Build Datum und Source Stand gleich sind.

Das Build Schema sieht wie folgt aus:

Bei Änderungen am Source zähle ich den Versionscounter hoch. Also wie jetzt zum Beispiel von 0.5.2 auf 0.5.3. Die erste Zahl ändert sich dabei nur wenn die Firmware oder weite Teile des Netzes inkompatibel würden. Die zweite Zahl nur bei einem neuen Gluon Major Release. Die dritte für Bugfix Releases oder Source Änderungen innerhalb eines Major Release. Das Datum ändert sich, wenn ich z.B. nur in der Config der Firmware etwas ändere und zum Beispiel einen neuen Gateway hinzufüge oder aber bei jedem darüber stehenden Release Typ.

1 „Gefällt mir“

@leah Der HD-Altstadt-002 841 v7.2hat vor 30 Minuten neu gestartet und kam von alleine nicht wieder hoch. Nur die Power LED leuchtet und der Uplink flackert. Nach einem stromlos machen, ging er wieder.

@leah HD-Hendesse-03 ist laut Grafana gegen 11:30 offline gegangen:
http://s.ffrn.de/dashboard/db/nodes?from=1458380867236&to=1458384467236&var-Node=HD-Hendesse-03
Wenn ich ihn mir anschaue, blinkt er aber so weiter als ob nichts wär. Anzeigefehler bei Grafana?

Kommst du per SSH drauf? Das wäre ein verlässlicher Test, den man auch Remote durchführen kann, ob er noch geht.

Dazu müsste ich SSH vorher aktiviert haben, richtig?

entweder durch Vergabe eines Passworts oder durch hochladen deines Public SSH Keys, ja.

Dann fällt das aus, denn das habe ich in der Regel nicht aktiv. Ich habe mich eben per WLAN und per Kabel verbunden und konnte einwandfrei surfen. Auch die Statusseite wurde korrekt angezeigt (http://10.142.255.1). Komischerweise ist er nicht mehr mit dem Gateway verbunden, obwohl er einen Uplink hat.

@leah Ich habe bei dem WR1043ND v1 jetzt genau das Problem beobachten können, dass sich gegen 11:30 Uhr im Grafana angekündigt hat. (Ich gehe davon aus, dass das ein separates Problem ist und nicht mir der kaputten Firmware zu tun hat, da ich das schon vor der 0.5.2 gesehen habe).

11:30 Uhr Grafana zeigt bei Uptime nach 7,28 Stunden, dass er offline ist. Die Datenübertragung geht weiter. Ich kann über den Knoten surfen und die Statusseite wird angezeigt.
12:00 Uhr etwa verliert der Knoten die direkte Verbindung zum Gateway, obwohl er einen Uplink hat.
13:10 Uhr Ist mir aufgefallen, dass nur noch die Power LED an ist.
13:18 Uhr Gerät stromlos gemacht.
13:20 Uhr wieder online
13.55 Uhr scheint er die Verbindung kurz verloren zu haben (laut Grafana)
15.25 Uhr scheint er die Verbindung kurz verloren zu haben (laut Grafana)
http://s.ffrn.de/dashboard/db/nodes?from=1458379329679&to=1458390129679&var-Node=HD-Hendesse-03
https://map.ffrn.de/#!v:m;n:f4ec38c9c0ba

1 „Gefällt mir“

Beim HD-Altstadt-002 war heute morgen nur die Power-LED und die für den Uplink an. (etwa seit 7 Stunden)
Seit einem Stromlosmachen ging geht er wieder. Edit: im Laufe des Sonntages ist das noch zwei male passiert.
https://map.ffrn.de/#!v:m;n:f8d111811504

HD-Hendesse-03 hat selbstständige Neustarts/Verbindungsverluste gegen 12:40, 12:50 und 12:55 Uhr:
http://s.ffrn.de/dashboard/db/nodes?from=1458468766385&to=1458479566385&var-Node=HD-Altstadt-002&var-Node=HD-Hendesse-03&var-Node=HD-Hendesse-04&var-Node=HD-Hendesse-05&var-Node=HD-Hendesse-06

@leah Edit: HD-Hendesse-03 und HD-Altstadt-002 habe ich nun abgebaut.

Spannen, werde mir das mal genauer angucken. Wäre es möglich das du einen der betroffenen Knoten erstmal so zurück hältst, falls wir was gucken müssen?

Kein Thema. Kann die Knoten mit dem Problem ja eh nicht zuverlässig einsetzen.

Wie es aktuell in dem Gluon Issue aussieht, hat sich das Problem doch noch nicht gelöst.

Danke. Ich freue mich auf eine neue experimentelle Firmwareversion. :-)

Anstatt der beiden abgebauten beiden Knoten laufen nun zum Test HD-Altstadt-023 und 026

2 „Gefällt mir“

Habe gestern Abend eine neue experimentelle Version gebaut und veröffentlicht die auf dem aktuellen Gluon Master basiert. Darin enthalten ist ein Patch der evl. die Boot Probleme mancher Knoten behebt. Die Version heißt: 0.5.3-20160327

1 „Gefällt mir“

Hallo @leah, danke dafür. Ich habe den Browsercache schon geleert, aber ich sehe unter http://fw.ffrn.de/ > Experimental nur die Version 0.5.3-20160317 Könntest Du bitte noch einmal schauen?

Fixed, hatte vergessen die Liste neu zu generieren.

1 „Gefällt mir“

Ich kann eine unnatürlich hohe Ram-Auslastung erkennen:
http://s.ffrn.de/dashboard/db/nodes?from=1459276248262&to=1459278048262&var-Node=HD-Altstadt-023&var-Node=HD-Altstadt-026&var-Node=zu-verteilen-003-temp

Die WR842ND starten immer wieder neu. (Altstadt023 und 026)

1 „Gefällt mir“