Aktuell Probleme?

Weiß ich nicht, sorry, nach einem Kaltneustart hat er sich bei mir automatisch mit einem anderen Gateway verbunden.

1 „Gefällt mir“

Das war dann Glück… hab 3 Mal Rebootet. Bei nur Zuhause hat sich der Offloader dann mit gw8 verbunden. In der Flüchtlingsunterkunft klappt das leider nicht … die sind weiterhin Offline

Klar mal eben nicht, aber dafür ist ja eine Ein-Lernphase gut. Niemanden in die Infrastruktur mit einzubeziehen kann auf dauer sehr schief gehen… ( Ausfall von Personen, niemand hat Ahnung da keiner Zugriff und Know-how was die Person davor gemacht hat)
Aber das ist eine Andere Thematik die jetzt hier nicht wichtig ist.

Erstmal sollte jetzt das Firmware (Netzwerk) Problem behoben werden

mit 30 Sekunden googlen sollte man das Thema aber auch sofort finden:
https://wiki.freifunk.net/Konsole#Gateways_im_Router_an-.2Fabschalten

Danke (; , das hatte ich auch schon Gefunden. Nur am Befehl bin ich gescheitert…
COMMUNITY-NAME sollte doch ffrn sein ?
und gateway nummer dann 4 ?

Mach mal nen:

uci show

Dann solltest du es sehen wie die Gateways heißen bzw. wie genau der Befehl auszusehen hat.

1 „Gefällt mir“

Danke dir hat geklappt, aber Ihrgendwie geht gw5 auch nicht gescheit? Hab jetzt meine Offloader und der in der Unterkunft auf gw5 umgeändert.

Die einzigen Router mit Nightly hatte ich bereits abgeschaltet um Fehler auszuschließen. An den Gateways wurde da nichts geändert. Leider brachte dies keine Veränderung.

Wie bereits im Chat schon gesagt, kann ich die Firmware als Grund so gut wie ausschließen.
Auch die Gateways haben wir überprüft und bis auf GW04 (Inodes im Root-FS waren voll) nichts gefunden.

Aktuell schauen wir tief ins B.A.T.M.A.N.-ADV rein, weil dort einige Anomalien vorhanden sind.
Ich bin aktuell bei der selben Vermutung wie @Mitsch , dass ein Node (oder evtl doch ein Gateway) das gesamte Netz lahmlegt.

Leider haben weder Leah noch ich aktuell genug Zeit um das Problem zeitnah zu lösen.

Ein Firmware Rollback wird wenig helfen, zumal die Gluon (oder besser OpenWRT) Versionen eventuell nicht ohne manuelles Eingreifen nach einem Downgrade laufen. - Ich habe keine Lust 500 Knoten manuell zu fixen.

Ein weitere Problem was ich unter dieser Überschrift adressieren möchte ist der Wunsch nach mehr Leuten im Admin Team.
Wir haben seit mehreren Monaten, wenn nicht sogar Jahren, nach weiteren Leuten im Admin-Team gesucht. Bisher ohne jeglichen Erfolg weil sich gefühlt nur gemeldet wird wenn etwas nicht läuft oder die Kandidaten nicht genügend Zeit aufbringen können. Alles Verständlich und Nachvollziehbar.
Leider ist ein komplettes einlernen von unserer Seite ohne Vorkenntnisse über Netzwerke, Linux und grob über Gluon quasi unmöglich (das wäre gleichzusetzen mit einer Vollzeitstelle).

Wenn sich jetzt eine Person findet, die das erstens langfristig (auch nach einer eventuellen Auflösung des Vereins inklusive aller Risiken wie Haftungsprivileg etc.) machen möchte, und zweitens sich technisch in der Lage fühlt das zu übernehmen, steht wohl niemand im Wege.

Nur um aber mal die Zahlen zu nennen:

  • ein Firmware Release ohne Änderungen an unserer Konfiguration dauert ca. 2h (plus die Zeit die es zum kompilieren braucht was aktuell bei etwa 3-4h liegt) - Vorbereitung durch Git Commits und Changelogs lesen + Teilautomatisierung in Bash
  • Ein Debugging wie wir es aktuell haben frisst zwischen 4 und 40 Stunden, kann aber auch mal mehr sein.
  • Regelmäßige Tasks wie Software Updates im Forum, Chat, Unifi Controller, Server & Gateways frisst etwa 1-2h/Monat
  • Ticket Bearbeitung (Hetzner Abuse, BSI Infos, Nutzeranfragen) hat mich in den letzten 4 Wochen etwa 3h gekostet, wird aber aktuell sehr schleifen gelassen. Realistisch sind eher 2-3h/Woche
  • Man sollte zusätzlich mindestens 1h/Monat für Unterhaltungen und Vergleiche mit anderen Communities einplanen, um die zukünftigen Optionen für VPN, Mesh etc auszuloten und auf dem Stand zu bleiben

Es sind noch viel mehr Dinge die Leah und Ich machen, auch wenn vieles davon der geringen zeitlichen Verfügbarkeit zum Opfer gefallen sind.

2 „Gefällt mir“

Verzeiht bitte wenn ich im folgenden Text irgendwelchen Unfug verzapfen sollte, ich schildere lediglich meinen Eindruck.

So wie ich das verstanden habe hat es einen Wechsel des Vereinsvorstandes gegeben, die Admin-Situation ist aber nachwievor ungelöst. Auch kontinuierliches Hinweisen auf diesen Missstand hat zu keiner Veränderung geführt. Woraus sich ableiten lässt, dass sich auch in Zukunft nichts daran ändert, weil es ja immer noch irgendwie erledigt wird.

Die Admins müssen viel Zeit in das Projekt investieren, die sie eigentlich gar nicht haben und sind dadurch dauerhaft überlastet, was weder gesund für das Privatleben, noch für Physis und Psyche sein kann.

Die Menschen, die nur die Knoten-Infrastruktur bereitstellen und ansonsten nichts beitragen, haben jetzt ein technisches Problem was nicht kurzfristig behoben werden kann und ärgern sich damit herum.

Die Menschen die nur das Freifunknetz nutzen haben ein momentan nur schlecht oder gar nicht funktionierendes Netz, verstehen nicht warum, sind genervt und bekommen einen negativen Eindruck was die Zuverlässigkeit von Freifunk angeht, erzählen das womöglich weiter, was wiederum zu schlechter PR für das bundesweite Projekt führt.

Wäre es nicht im Sinne aller Beteiligter, wenn man einen geordneten und terminlich geplanten Rückzug bzw. Abwicklung des Projektes durchführen würde?

Edit: Und vielleicht führt ja eine definitive Ankündigung, ganz ähnlich wie bei der Vorstandssituation, dazu, dass doch plötzlich ein paar Admins auftauchen ;)

1 „Gefällt mir“

Eventuell kann euch ja @dgoersch unter die Arme greifen. Er hatte sich in einen anderen Beitrag vor 18 Tagen vorgestellt. Er war anscheinend selbst Admin in der Domäne ''Niersufer""

1 „Gefällt mir“

Jede Hilfe ist gerne gesehen. Wir organisieren uns aktuell in unserem Chat.

Seit heute 16:40 sieht erstmal alles wieder gut aus. Durchschnittliche Load ist von 1.00 auf 0.40 gesunken.

1 „Gefällt mir“

Und jetzt ist natürlich die spannende Frage: Was war es denn?

Ich habe keine Ahnung, habe auf allen Server Updates eingespielt inlusive Batman und dann alles rebootet.
Danach ging es aus Geisterhand wieder.

Es ist aber noch nicht gesagt dass es langfristig wieder gut ist. Wenn es ein Amok-laufender Knoten ist/war, kommt dieser auch irgendwann zurück.

Daher werde ich die Graphen in den nächsten Tagen genau beobachten.

2 „Gefällt mir“

Dann einfach mal vielen Dank für Deinen und Euren Einsatz!

4 „Gefällt mir“

Zu der Ganzen Thematik ist mir Folgendes Aufgefallen.

Ich Betreue in Heddesheim eine Flüchtlingsunterkunft.
Diese hatten Probleme mit Freifunk und meinten nichts mehr geht.
Zugleich hatte auch die gesamte Netz Thematik angefangen.
Habe den Besagten Offloader nun mal Rebootet.
Wenn ich nun von meinen Offloader oder einen Offloader in Viernheim diesen Pinge bekomme ich Latenzen von im Schnitt von 1500ms… (Kann natürlich auch ein Kaputtes Kabeln sein) Kann dieser Offloader eventuell unser Netz beeinflussen kaputt machen ?

Vorort war ich noch nicht, da der Offloader bei jemanden Privates in der Wohnung steht.

Offloader Name: Offloader-HDH-Unterkunft
Offloader IP: [2a01:4f8:171:fcff:219:99ff:fe67:fd7f]

Ich war heute wieder in der Gausstraße und habe die beiden CPE zurückgeflasht auf die aktuelle Firmware: LA-RW-GSS001 wollte sich imemr noch nicht verbinden mit dem Offloader. Diesen habe ich mehrfach neu gestartet. Er ist laut map auch online und nicht im overload. Ich habe Testweise einen 1043er von zu Hause an den Offloader angeschlossen, wieder keine Verbindung.
Daraufhin habe ich also die CPE mit mesh vpn direkt an den Unitymedia upload angeschlossen, ( Besser langsam als nichts? ). Jetzt geht es wieder, aber nur die Richttfunkstrecke ( GSS001-002) und er erste Router Gss003. Der Rest will nicht funktionieren, obwohl sich da gar nichts verändert hat…Bildschirmfoto 2.pdf (299,0 KB)
Komischer weise wird hier der GSS005 online angezeigt, obwohl er gar nicht erreichbar ist.

Der 1043er GSS003, der funktioniert hat merkwürdigerweise die IP Adresse doppelt drinstehen!
Bildschirmfoto.pdf (154,9 KB)

Also, Notversorgung geht, aber alles ist sehr merkwürdig. Ich habe den Offloader laufen lassen, falls Leah da draufschauen will. Allerdings hängt da jetzt keine CPE mehr dran…
Die Router 005und 006 sind auch aus, damit sie die Luft nicht mit sinnlosem WLan verpesten…

Ich hab leider bis auf weiteres keine Zeit das Setup zu debuggen. Da muss dir jemand anderes aus der Community helfen.

1 „Gefällt mir“

Hier ist die Logdatei von LA-RW-Gss002
https://paste.ffrn.de/?b699f8992fa5ce78#CDUBqKs0NZtrU7/MJOPsYdopaUpCaLn3R5qLFyBABAI=

Er ist per Lan1 mit GSS005 verbunden. Daran hat sich in den letzten Jahren nichts geändert. Gss005 ist auf der Karte blau, aber nicht erreichbar, wenn man draufklickt. Er versprüht auch kein Internet.
Vielleicht kann mir ein kluger Mensch hier aus der Logdatei sagen, in welche Richtung ich ermitteln muss.
Hatte noch zuletzt den Befehl gesendet, mesh on Lan einzuschalten ( just to make shure…)

Diese Probleme sieht man im Log nicht.

Mittels swconfig prüfen, ob die Hardwareverbindung steht, dann per batclt if schauen ob batman auf dem richtigem Interface lauscht und mittels batctl n schauen, wer gesehen wird.