[ffda] Methode zum Auslösen des OOM-Bugs (TL-WR 841ND v9)

tuccity at posteo.net tuccity at posteo.net
So Mär 25 19:20:14 CEST 2018


Hallo!


Ich habe bei der zeitweisen Inbetriebnahme meiner alten 841 zuverlässige 
Crashes unter bestimmten Bedingungen festgestellt. Beide Kisten haben im 
Normalzustand einen Load < 0.6.

Evtl. ist das nur alter Käse, aber vielleicht hilft's bei der Analyse des 
OOM/High Load-Bugs weiter.


Ich bekomme nach ca. 20-60 Sekunden einen Crash, wenn...

1. Der 841 zuerst nur mit den benachbarten Nodes vermesht ist, und dann im 
Betrieb per Ethernet mit dem Uplink verbunden wird.
Wenn der 841 vom Start an per Ethernet verbunden ist, und man dann 
abstöpselt, verursacht der Wechsel auf das Mesh nur einen kurzen Aussetzer.

2. Wenn der 841 vom Start an per Ethernet verbunden ist, und dann ein 
Client über LAN angeschlossen wird.
Sind von Anfang an Ethernet und LAN-Client angeschlossen, bootet der Router 
ständig neu.

Vielleicht lässt sich der Bug damit auch auf anderen Routern triggern.


Aus /sys/kernel/debug/crashlog:
[..]
<6>[   40.618584] batman_adv: bat0: Interface activated: mesh-vpn
<6>[  479.787327] eth0: link up (1000Mbps/Full duplex)
<6>[  479.818912] br-client: port 1(eth0) entered forwarding state
<6>[  479.824953] br-client: port 1(eth0) entered forwarding state
<6>[  481.821372] br-client: port 1(eth0) entered forwarding state
<4>[  501.694006] dhcpv6.script invoked oom-killer: gfp_mask=0x2420848, 
order=0, oom_score_adj=0
[..]
(Absturz nach 22 Sekunden, es laufen auch andere Prozesse ins oom)


In beiden Fällen geht das cached mem innerhalb weniger Sekunden runter, 
free mem nimmt gleichzeitig noch etwas zu (Ausgabe von top -d0):

Vorher (nur Uplink)
Mem: 24948K used, 2820K free, 124K shrd, 1468K buff, 3708K cached
CPU:   8% usr  14% sys   0% nic  41% idle   0% io   0% irq  36% sirq
Load average: 1.12 1.01 0.56 1/53 2987

Stillstand kurz nach Anschließen eines LAN-Client
Mem: 23532K used, 4236K free, 124K shrd, 876K buff, 1516K cached
CPU:  42% usr   0% sys   0% nic   0% idle   0% io   0% irq  57% sirq


Modell: TL-WR 841ND v9
Firmware:
1.1~20180322 / gluon-v2017.1-356-g38b1306e (ffda testing),
auch bei 1.0.5 / gluon-v2017.1.5-4-gd54b0865 (ffda beta)


Viele Grüße,

Dustin


Mehr Informationen über die Mailingliste darmstadt