[hannover] Ausfall Webdienste

Achim Hut a.hut at digital-impact.de
Sa Dez 17 12:59:14 CET 2016



Am 17.12.2016 um 11:40 schrieb Bernd Schittenhelm:
> Hallo Achim.
>
> Ja, wir hatten in letzter Zeit gelegentlich mal Ausfälle. Da wir keine
> Hochverfügbarkeits-Farmen haben, sondern nur ganz normale Server (dazu
> auch noch ohne Überwachungsinfrastruktur), kann es schon mal sein, dass
> es keinen auffällt wenn die Webseite nicht verfügbar ist. Solange das
> Freifunk Netz funktioniert ist ja eigentlich alles OK und die Webseite
> erst mal zweitrangig. Dazu kommt noch, dass wir Freifunk ja nicht
> hauptberuflich betreiben sondern in unserer Freizeit. Der jeweilige
> Serverbetreuer muss also auch erst mal Zeit haben, sich des Problems
> anzunehmen. Ich hoffe, du hast dafür Verständnis. Spenden für neue
> Hardware sind aber immer gerne willkommen :-)
>
> Lieben Gruß aus der Nordstadt
> Bernd


Hallo Bernd, Hallo Lukas.
Erst einmal vielen Dank für die Antworten und für die Info, dass sich 
jemand um das Problem kümmert.

Mir ist schon klar, dass sich bei Freifunk viele Menschen in ihrer 
Freizeit für das Projekt engagieren. Dafür noch einmal ein grosses 
Dankeschön :-)

Ich selbst betreibe und überwache drei Knoten in Hannover und kann 
bestätigen, dass die Verfügbarkeit des Netzes hervorragend ist. Auch 
dafür ein grosses Dankeschön.

Aber warum nicht gute Dinge verbessern? Zum Thema Verfügbarkeit der 
Dienste hier ein paar Gedanken, Fragen und Beobachtungen, die ich in die 
Runde werfen möchte.

1) Erfassen von Störungen
Wer beobachtet auf regelmässiger Basis die Dienste?
Wenn das bisher eher zufällig war: ich hab ein paar Icinga/nagios 
Instanzen laufen. Da könnte ich ein paar FFH Dienste mit überwachen.

2) Wer ist Ansprechpartner bei Störungen?
Anstatt in die Liste zu posten - wer ist für was (Dienste) zuständig?
Gibt es da aktuelle Infos und Kontakte? Gibt es eine "Ersatzmannschaft" 
wenn jemand im verdienten Urlaub ist, krank oder einfach zu beschäftigt? 
Also ein Team aus 2-3 Menschen, das für bestimmte Dienste Verantwortung 
trägt und Zugriff auf die entsprechenden Systeme hat.

3) status.hannover.freifunk.net
Wo kann ich nachsehen, ob eine Störung bereits erkannt wurde und in 
Arbeit ist (oder auch nicht)?

4) Klare Strukturen der Kommunikationskanäle
Auf welchem Kanal (Twitter, Mailing Liste) werden Störungen zuverlässig 
kommuniziert? Beim grossen Firmware Umbau dieses Jahr wurde ich als 
Leser der Mailingliste auf Twitter verwiesen, als ich mich wunderte, was 
los war. OK, also Twitter beobachtet. Und nun? Letzter Eintrag von 17. 
November...


Es muss keine "Hochverfügbarkeits-Farm" sein, um einen stabilen Dienst 
anzubieten. Und Ausfälle kommen vor und sind absolut OK, sofern der 
"normal sterbliche" nicht im Dunkeln steht, sprich, Informationen 
bekommt wie "es gibt ne Störung" und "wir arbeiten dran"


Also redet mit uns, den einfachen FFH Nutzern.
Und sagt uns bitte, wo ihr (wir) das tun möchtet (Liste, Twitter, was immer)

My two cents
Achim

p.s. Hardware und Infrastruktur Spenden gerne, aber was?



Mehr Informationen über die Mailingliste hannover