Monitoring

Tim Niemeyer tim at tn-x.org
So Nov 13 11:12:54 CET 2016


Moin Max

Am Sonntag, den 13.11.2016, 10:11 +0100 schrieb Moexe:
> In den letzten 3 Tagen hat das Monitoring immer wieder Aussetzer. 
Hehe.. Nicht nur in den letzten 3 Tagen.. :(
> 
> Woran liegt das? 
In den meisten Fällen, weil die Netmon-VM abstürzt. Hier haben wir die
Ursache noch nicht gefunden. Ich vermute, dass es mit dem batman Bug
zusammen hängt. Andere vermuten sogar, dass es mit dem alfred selbst zu
tun haben könnte.

> Seid ihr gerade dabei, dort umzubauen? 
Auch.. Der Alfred-Proxy (das Ding, was die Daten aus dem L2 Netz ins
Monitoring drückt) scheint hin und wieder "Amok" zu laufen. Da bleiben
dann etwa 10-20 Prozesse am laufen, was den RAM der Maschine auffrisst.
Daraufhin kommt der OOM killer und töten das MySQL auf der Kiste. Das
das kein guter Zustand ist sollte klar sein.
Ich hab gestern Vormittag angefangen die Sache zu untersuchen, musste
dann aber bis zum Abend ne Pause einlegen. Leider hatte ich es kaputt
gemacht. :(

Zur Zeit sollte es wieder laufen, wobei ich das Teil mit na Hand-Voll
Debug Messages geziert habe. Der langsamste Part scheint tatsächlich das
Monitoring selbst zu sein. Wenn das wirklich das größte Problem dabei
ist, wäre eine Dezentralisierung vermutlich aktuell schädlicher. :-(

Soll nicht heissen, dass wir das nicht trotzdem tun sollten, nur sollten
wir da vllt vorher am Monitoring etwas verbessern.
> 
> Zu meinem Verständnis:
> Die Alfred-Daten, werden ja aktuell über das Layer 2 Netz direkt an
> den Alfred-Server gesendet.
Ja.

> Ist es dann sinnvoller, wenn die GWs für die Hood die sie bedienen,
>  diese Daten auf Layer 2 abgreifen, und dann per Layer 3 an das
> Monitoring senden? Würde das evtl. etwas Entlastung bringen? 
Für die Netmon-VM ja. Sicher. Generell war das auch immer die Idee
dabei. Aber ich befürchte das Monitoring is dann total überlastet.
Vielleicht kann da aber der Asdil12, der MiFritscher oder der Kratz00
noch was dazu sagen?

> Ich kenne mich mit damit überhaupt nicht aus, würde mich aber gerne
> einlesen, wenn das so Sinn macht. 
Tatsächlich geht mir das ähnlich. Ich wollte mich eigentlich am liebsten
gar nicht mit dem Monitoring beschäftigen. Nun macht aber aktuell ein
Teil des Monitorings eine andere VM kaputt. Das hab ich vor Wochen den
"Monitoring-Jungs" mal gesagt, aber da nichts passiert ist hab ich jetzt
selber mal Hand angelegt. Dabei natürlich gleich das ganze n Tag
komplett kaputt gemacht. Sorry dafür.

Tim
> Grüße 
> 
> 
> Moexe
> 
> -- 
> franken-dev mailing list
> franken-dev at freifunk.net
> http://lists.freifunk.net/mailman/listinfo/franken-dev-freifunk.net

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 473 bytes
Beschreibung: This is a digitally signed message part
URL         : <http://lists.freifunk.net/pipermail/franken-dev-freifunk.net/attachments/20161113/80fef970/attachment.sig>


Mehr Informationen über die Mailingliste franken-dev