[WLANnews] dezentrale Suche in der Freifunk Wolke.

Frank Rühlemann ruehlema at informatik.uni-luebeck.de
Mo Apr 1 17:55:07 CEST 2013


Mit Yacy hab ich recht schlechte Erfahrungen gemacht.

Obwohl es anfangs ganz gut funktionierte, als ich es erstmal dazu
gebracht hatte, dass es auch mit privaten Adressen umgehen kann, lief es
später einfach immer schlechter und dann gar nicht mehr.
Leider fand ich zu Yacy nur sehr wenig Dokumentation, selbst auf der
offiziellen Seite. Daher blieb dann oft nur das Rumspielen mit den wenig
sagenden Parametern übrig. Irgendwann bekam ich es in einen Zustand, wo
zwar der Crawler eindeutig Traffic verursachte, sich aber der Index
nicht mehr veränderte.
Zu dem Zeitpunkt habe ich es abgeschaltet.
An sich versuche ich grad noch selbst nebenbei eine Suchmaschine auf
Basis von Lucene & Nutch zusammen zu klöppeln, aber dafür bleibt gerade
nur wenig Zeit über.

Aber zurück zur eigentlichen Frage:
Das Problem ist gar nicht so trivial, wie es scheint. Du musst da mit
sehr großen Datenmengen hantieren und dafür sind diese kleinen
Plastikkisten nicht gemacht. Das betrifft sowohl die Speicherkapazität,
als auch die Rechenleistung, die neben dem anderen Kram noch übrig sein
müsste.
Das müsste also eher auf Servern laufen. Das könnte günstigerweise auch
ein angeschlossener Raspberry Pi sein! Der hat deutlich mehr
Rechenleistung, wenn er nur dafür abgestellt wird.

Das Suchen nach Geo-Koordinaten bedingt aber auch wieder, dass diese mit
den Informationen verknüpft werden. Das ist nicht zwingend möglich oder
gewollt. Für die Suche nach lokalen Geschäften bietet sich eher OSM an.
Das muss man nicht noch mit aufnehmen.
Die Suche in internen Dokumenten ist erstmal Aufwand genug. (^_~)

Ich selbst sehe auch die Notwendigkeit einer internen Suchmaschine, aber
nur, wenn sie auch sinnvoll läuft. Auch diese braucht einen gewissen
Wartungsaufwand, damit sie gut läuft. :)

Gruß
    Frank

Am 01.04.2013 03:30, schrieb Mario Behling:
> Hallo,
>
> versuch mal Yacy. Hat ganz gut funktioniert im Netz in Berlin vor einer
> Weile. Der Entwickler ist auch fuer Ideen offen falls wir weitere Features
> fuer das Freifunk- Netz brauchen.
>
> LG,
>
> Mario
>
>
> 2013/4/1 <smilebef at gmail.com>
>
>> Hallo Leute,
>>
>> wie ihr sicherlich schon mitbekommen habt, suche ich nach einer Lösung
>> für eine dezentralen Suchfunktion in der Freifunk-Wolke.
>>
>> Das das nicht so einfach ist, hatte ich mir ja schon gedacht, aber ich
>> gehe davon aus, dass sich irgendwann in meinem Kopf ein Bild ergibt,
>> was die Sache greifbarer macht.
>> Ich weiss ja im Grunde was ich will, und überlege mir wie dies aussehen
>> könnte. Ich möchte Schritt für Schritt an diese Geschichte herangehen
>> und erst einmal die Bausteine dazu zusammen suchen, welche mich einen
>> Schritt weiter bringen.
>>
>> Nun habe ich im Netz einen interessanten Artikel über swish-e/swish++
>>  gefunden. Dieses Programm generiert ein Index-file aus dem Inhalt von
>>  Dateien.
>>
>> Die Ausgabe sieht wie folgt aus.
>>
>> user:~$ swish-e -f .swish_index/howto-html.index  -w Antenne
>> # SWISH format: 2.4.7
>> # Search words: Antenne
>> # Removed stopwords:
>> # Number of hits: 3
>> # Search time: 0,000 seconds
>> # Run time: 0,007 seconds
>> 1000 ../Daten/Nachschlagewerke/Antennen/Wlan/biquad.html "Biquad WLAN
>>  Selbstbau 10 dB" 7478
>> 588 ../Daten/Linkbudget/Linkbudget.html  "Linkbudget.html" 21324
>> 226 ../Daten/Nachschlagewerke/Antennen/Wlan/omni_mario.html "Omni Mario"
>> 935
>>
>>
>> Warum soll man solch ein Programm nicht für eine dezentrale Suche
>> benutzen können? Im Grunde braucht man nur noch die URL des
>> Ziel-Rechners vorne ran basteln und erhält einen Link.
>> Es ist auch noch ein olsr/batman-Plugin zu schreiben, welches das
>> größere Problem darstellen dürfte.
>> Einmal nach einer Änderung des Dateisystems muß das Index-file erneuert
>> werden.
>> Letztlich könnte man das Netz durch solch eine Suche-Funktion extrem
>> attraktiv machen.
>> Ich fände es sehr interessant, wenn man die Suchfunktion in einem
>> selbst bestimmten Umkreis zur Ausführung bringen könnte.
>> Zum Beispiel könnte man eine Region auf der Karte markieren und eine
>> lokale Suche nach Friseur oder Psychiatrie absenden.
>> Oder ich sage, suche nur in den nächsten 10 Knoten.
>> Ein Kunststück dürfte dann noch die Zusammenführung der Ergebnisse auf
>> einer Webseite sein. Aber das müsste es dann auch gewesen sein.
>> Oder ist jemand anderer Meinung, damit wette ich doch mal. (:
>>
>> Gibt es jemanden, den ich mit diesem Gedanken überzeugen könnte?
>> Ich schaffe das definitiv nicht alleine.
>>
>>
>> LG
>
>
> _______________________________________________
> WLANnews mailing list
> WLANnews at freifunk.net
> Abonnement abbestellen? -> http://lists.freifunk.net/mailman/listinfo/wlannews-freifunk.net
>
> Weitere Infos zu den freifunk.net Mailinglisten und zur An- und Abmeldung unter http://freifunk.net/mailinglisten

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.freifunk.net/pipermail/wlannews-freifunk.net/attachments/20130401/22b6db0d/attachment-0001.html>
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : smime.p7s
Dateityp    : application/pkcs7-signature
Dateigröße  : 4748 bytes
Beschreibung: S/MIME Kryptografische Unterschrift
URL         : <http://lists.freifunk.net/pipermail/wlannews-freifunk.net/attachments/20130401/22b6db0d/attachment-0001.bin>


Mehr Informationen über die Mailingliste WLANnews