[hannover] Schlechter Datendurchsatz, Verbindungsabbrüche zur Zeit

Oliver Krüger freifunk at oliverkrueger.de
Fr Aug 17 13:07:15 CEST 2018


Hallo Liste.

Sebastian schrieb uns:

> ich muss die letzten Tage/Wochen wieder zunehmend feststellen, dass der Datendurchsatz an meinem Knoten doch relativ schlecht wieder zu sein scheint.
> Webseiten werden teilweise nur unvollständig geladen und der Speedtest, welcher nach der Netztrennung so bei 6/6 MBit/s lag ist jetzt schwankend bei 1-2 in beide Richtungen.


Ich antworte mal öffentlich auf der Mailingliste, da es vermutlich mehrere betrifft und interessiert.

Einige von Euch haben es vielleicht der Fachpresse [1] entnommen. Es wurden weitere Designschwachstellen bei (Intel) Prozessoren gefunden, die es erlauben - vereinfacht gesagt - dass ein Prozess in die Daten eines anderen Prozesses schauen kann. Das ist hinreichend blöd, wenn auf einem Prozessor mehrere virtuelle Maschinen verschiedener Kunden laufen. Um das Problem zu umgehen, wurden und werden bei unseren Providern gerade Patches eingespielt, die - vereinfacht gesagt - zentrale Beschleunigungsmechanismen (Caches, Hyperthreading,…) zugunsten der Sicherheit abschalten. Das geht mit einem massiven Performanceverlust einher. Genannter Artikel spricht von 15-50%. Praxiserfahrung der letzten Tage hat gezeigt, dass es bei unseren (CPU-hungrigen) Supernodes eher 50% sind.

Unsere Supernodes sind zu einem nicht unerheblichen Teil bei Feld-und-Wiesen-Hostern wie Hetzner, Contabo oder netcup angemietet. Die gebuchten Pakete sind - unseren finanziellen Rahmenbedingungen geschuldet - nicht die größten und leistungsstärksten Pakete. Wie man an [2] erkennen kann, ist in den letzten Tagen die CPU Auslastung durch obige Patches massiv nach oben gegangen. Exemplarisch an der Kurve von sn02 kann man in [3] sehr schön erkennen, dass die CPU gegen die 100% Decke geknallt ist und nicht weiter konnte. Folge sind dann in der Regel Netzwerk-Paketverluste bis hin zur Unbrauchbarkeit der Verbindung. Da, wo es technisch und finanziell möglich war, haben wir dann eine zweite CPU dazugebucht und die 100%-Decke zu einer 200%-Decke umgebaut.

Wir sammeln uns gerade und schauen, wie wir weiter mit den Problemen umgehen. In den nächsten Tagen kann es daher passieren, dass hier und da Supernodes umgestöpselt werden oder Routen ausgetauscht. Wenn Webseiten nicht vollständig laden, kann es sein, dass wir gerade im Hintergrund umbauen.

Gruß,
Oliver


[1] https://www.heise.de/security/meldung/Linux-Kernel-und-Distributionen-schuetzen-vor-Prozessorluecke-Foreshadow-L1TF-4137264.html <https://www.heise.de/security/meldung/Linux-Kernel-und-Distributionen-schuetzen-vor-Prozessorluecke-Foreshadow-L1TF-4137264.html>
[2] https://stats.ffh.zone/d/000000026/supernodes-erweiterte-daten?panelId=4&fullscreen&orgId=1&from=1533900149323&to=1534499207550 <https://stats.ffh.zone/d/000000026/supernodes-erweiterte-daten?panelId=4&fullscreen&orgId=1&from=1533900149323&to=1534499207550>
[3] https://stats.ffh.zone/d/000000026/supernodes-erweiterte-daten?panelId=4&fullscreen&orgId=1&from=1534242332898&to=1534325272131 <https://stats.ffh.zone/d/000000026/supernodes-erweiterte-daten?panelId=4&fullscreen&orgId=1&from=1534242332898&to=1534325272131>


-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <https://lists.freifunk.net/pipermail/hannover-freifunk.net/attachments/20180817/21b7d1ae/attachment.html>


Mehr Informationen über die Mailingliste hannover