Seit ein paar Tagen gibt es Blogfox.de, laut Eigenwerbung:
BlogFox ist eine Suchmaschine, die ausschließlich Weblogs durchsucht.
BlogFox ist seit dem 21.02.2005 online und befindet sich noch im Beta-Stadium. Momentan sind 21450 deutschsprachige Blog-Feeds und darin 114595 einzelne Posts in unserem Index.
BlogFox sucht nicht live. Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.
Blogfox.de wird von Thomas Promny betrieben, der bereits als auffällig geworden ist. Grund genug, sich Blogfox.de einmal genauer anzugucken.
Die Feeds sind von Blogg.de geklaut worden.
Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary, das seit Monaten inaktiv ist und von dem kein Permalink mehr vorhanden ist, sondern nur noch der RSS-Feed. Dieses Weblog ist bei unserer manuellen Prüfung vor ein paar Monaten durchgerutscht, denn es ist nicht aus dem deutschsprachigen Raum. Dieses Weblog ist bei Blogfox.de zu finden. Die Daten können nur von uns gescraped worden sein.
Werfen wir doch mal einen Blick auf die Logfiles der letzten Tage:
85.93.15.3 - - [01/Mar/2005:01:00:17 +0100] "GET /list.php?char=a&off= HTTP/1.1" 200 64997 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:00:19 +0100] "GET /list.php?char=a&off=50 HTTP/1.1" 200 64372 "-" "-"85.93.15.3 - - [01/Mar/2005:01:00:20 +0100] "GET /list.php?char=a&off=100 HTTP/1.1" 200 64419 "-" "-"
[...]
85.93.15.3 - - [01/Mar/2005:01:16:42 +0100] "GET /list.php?char=z&off=2650 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2700 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2750 HTTP/
1.1" 200 20785 "-" "-"
Dies ist nur ein kleiner Auszug. Unsere robots.txt enthält ausdrücklich ein Disallow: /list.php – aber Thomas Promny hält sich nicht daran und spidert einfach alle unsere Inhalte. Die IP-Adresse 85.93.15.3 löst sich auf addicted.de auf und diese Domain gehört Thomas Promny.
Nun weiss man also auch, was der Passus “Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.” bedeutet. Die Inhalte werden von Blogg.de geklaut und dann in die eigene Datenbank gepackt. Wir erlauben die Nutzung unserer Feeds für nichtkommerzielle Zwecke, aber das Projekt Blogfox.de sieht nicht danach aus. Blogg.de aggregiert die Daten entweder über Weblogs.com oder blo.gs, oder wird selber angepingt. Wir setzen Filter ein, um lediglich Weblogs aus dem deutschsprachigen Raum zu finden. Jedes einzelne Weblog wird dann manuell freigeschaltet, damit die Qualität von Blogg.de gewährleistet bleibt.
Wer eine eigene Blog-Suchmaschine betreiben will, muss genauso verfahren und nicht einfach anderer Leute Arbeit dreist kopieren.
Ähnliche Artikel:
- Alles nur für die eigene Sicherheit? Ich fand die Einreise-Bestimmungen für die USA ja schon immer leicht merkwürdig, insbesondere der auszufüllende...
- Jabber: Alles Gute zum 6. Geburtstag! Jeremie Miller stellte am 4.1.99 bei /. sein Open Real Time Messaging System vor. Mittlerweile...
- Alles Verrückte hier Eigentlich, ja eigentlich finde ich, Gewerkschaften könnten eine sinnvolle Einrichtung sein. Mit den bundesdeutschen Gewerkschaften...
























