BlogFox: alles nur geklaut

Nico —  2.03.2005

Seit ein paar Tagen gibt es Blogfox.de, laut Eigenwerbung:

BlogFox ist eine Suchmaschine, die ausschließlich Weblogs durchsucht.
BlogFox ist seit dem 21.02.2005 online und befindet sich noch im Beta-Stadium. Momentan sind 21450 deutschsprachige Blog-Feeds und darin 114595 einzelne Posts in unserem Index.
BlogFox sucht nicht live. Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.

Blogfox.de wird von Thomas Promny betrieben, der bereits als auffällig geworden ist. Grund genug, sich Blogfox.de einmal genauer anzugucken.

Die Feeds sind von Blogg.de geklaut worden.
Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary, das seit Monaten inaktiv ist und von dem kein Permalink mehr vorhanden ist, sondern nur noch der RSS-Feed. Dieses Weblog ist bei unserer manuellen Prüfung vor ein paar Monaten durchgerutscht, denn es ist nicht aus dem deutschsprachigen Raum. Dieses Weblog ist bei Blogfox.de zu finden. Die Daten können nur von uns gescraped worden sein.

Werfen wir doch mal einen Blick auf die Logfiles der letzten Tage:
85.93.15.3 - - [01/Mar/2005:01:00:17 +0100] "GET /list.php?char=a&off= HTTP/1.1" 200 64997 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:00:19 +0100] "GET /list.php?char=a&off=50 HTTP/1.1" 200 64372 "-" "-"85.93.15.3 - - [01/Mar/2005:01:00:20 +0100] "GET /list.php?char=a&off=100 HTTP/1.1" 200 64419 "-" "-"
[...]
85.93.15.3 - - [01/Mar/2005:01:16:42 +0100] "GET /list.php?char=z&off=2650 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2700 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2750 HTTP/
1.1" 200 20785 "-" "-"

Dies ist nur ein kleiner Auszug. Unsere robots.txt enthält ausdrücklich ein Disallow: /list.php – aber Thomas Promny hält sich nicht daran und spidert einfach alle unsere Inhalte. Die IP-Adresse 85.93.15.3 löst sich auf addicted.de auf und diese Domain gehört Thomas Promny.

Nun weiss man also auch, was der Passus „Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.“ bedeutet. Die Inhalte werden von Blogg.de geklaut und dann in die eigene Datenbank gepackt. Wir erlauben die Nutzung unserer Feeds für nichtkommerzielle Zwecke, aber das Projekt Blogfox.de sieht nicht danach aus. Blogg.de aggregiert die Daten entweder über Weblogs.com oder blo.gs, oder wird selber angepingt. Wir setzen Filter ein, um lediglich Weblogs aus dem deutschsprachigen Raum zu finden. Jedes einzelne Weblog wird dann manuell freigeschaltet, damit die Qualität von Blogg.de gewährleistet bleibt.

Wer eine eigene Blog-Suchmaschine betreiben will, muss genauso verfahren und nicht einfach anderer Leute Arbeit dreist kopieren.

25 responses to BlogFox: alles nur geklaut

  1. Erst spammen, jetzt klauen: Nico Lumma über Thomas Promny >…

  2. Nicht Promnys erstes Auftauchen in der Blog-Szene. Vor kurzem mit bloggerforum.de. Im eigenen Umfeld eine ganze Latte von Websites, Blogs und Suchmaschinen mit düftigsten Content, deren Hauptziel wohl dass gegenseitige Hochjazzen im Pagerankin sein soll. da lacht das „Suchmaschinenoptimierer-Herz“.

  3. >Die Feeds sind von Blogg.de geklaut worden.

    Wie man jetzt zb meinen Feed „von Blogg.de klauen“ kann ist mir nicht ganz klar, dachte ich doch keinerlei Besitzrechte an blogg.de übertragen zu haben. ;-)

    Ansonsten würde ich aber auch sagen, daß BlogFox nicht wirklich eine Erwähnung wert ist.

  4. von besitzrechten habe ich auch nicht gesprochen und die feeds liegen ja auch bei den einzelnen blogs. wir sind allerdings diejenigen, die diese feeds mit einigem aufwand zusammentragen.

  5. Mir gings nur um die Formulierung „geklaut“, da ich sie in dem Kontext nicht sehr dienlich finde.

    Unbestreitbar ist das was dort bei Blogfox passiert nicht gerade die feine englische Art.

    Und blogg.de ist in der Tat ein Service den ich sicher nicht missen will!

  6. Nicht nur zusammentragen, sondern auch mit blogstats.de ein Tool bereitstellen, welches eindeutig aktueller, eindeutig aufgeräumter und eindeutig schneller ist als alles, was so im englischsprachigen Bereich rumfleucht.

    Ich habe ja Verständnis für eine höhere Komplexität im internationalen Business, aber ich wünsche mir jedes Mal ein englischsprachiges blogstats mit der gleichen Qualität, um ein wenig uptodate bleiben zu können und die Kommunikation verfolgen zu können.

    Für meine eigenen Seiten sind in der Regel meine eigenen Referrer aussagekräftiger als Technorati und Co :(

  7. Ich hatte hier von BlogFox berichtet und dieser Beitrag im Lummaland scheint mein Gefhl, das irgendwas seltsam ist an BlogFox, zu besttigen. Dann werd' ich mal das IP-Banning einschalten gehen.

  8. Ich hab zwar etwas weniger Feeds als blogg.de* und habe sicher viel weniger Arbeit damit. Aber ich würde mich auch ärgern, wenn sich ein anderer einfach so bediente und das dann als Eigenleistung ausgibt. Ich Dummerchen stell die Feeds auch noch als OPML-File zur Verfügung.

    *ca. 0.5%

  9. 85.93.15.3 = adicted.de
    adicted.de ≠ addicted.de
    adicted.de ≠ Thomas Promny
    adicted.de = Roland Becker

  10. danke, fixe ich.

  11. Thomas Promy und Roland Becker waren mal zusammen ein Laden… bis vor gar nich so langer Zeit, dann wars auf einmal nur noch einer.

  12. Krasse show, kann ich dazu nur sagen…

    BTW: Ich würde gerne sowas wie eine deutsch-spanische Connextion aufbauen. So richtig habe ich noch keinen Plan wie ich das anstellen soll. Einen spanischen blog-Betreiber habe ich schon angeschrieben. Vielleicht besteht bei Dir ja Interesse?! Würde mich freuen :-)

    lg
    Checkov

  13. Thomas hat eine Blog-Suchmaschine gebaut. Nico behauptet nun, dass die Daten alle nur bei seinem Blogg.de geklaut wurden. Beweise? Blogfox kennt den Feed eines Blogs namens Arbitrary, welches seit längerem nicht mehr existiert, aber noch bei Blogg.d

  14. wenn das so weitergeht, werden demnächst einige blog betreiber einfach ihre feeds wieder abschalten. RSS/Atom waren gedacht um es den lesern angenehm zu machen, nicht um pageranks geschubse bei suma spammern zu unterstützen.

  15. @Andreas: es geht doch nicht um die RSS-Feeds, sondern um die Sammlung der URL’s zu den Feeds. Die hat Blogfox abgegriffen, damit er sich das Suchen nach den URL’s spart.

    Kleiner feiner Unterschied

  16. Wer meint seinen Feed abschalten zu müssen damit der nicht „geklaut“ wird, der soll das ma besser tun..

  17. Nico über die Blogsuchmaschine BlogFox: Die Feeds sind von Blogg.de geklaut worden. Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary,…

  18. @Siegfried: schon klar, aber die kausalkette ist doch recht eindeutig -> wo keine feeds, da gibt es auch keine feedsammlung, ergo kann die url sammlung auch nicht geklaut werden.

    @moe: feed abschalten um „klau“ zu vermeiden ist ja nur die halbe wahrheit. feed abschalten um missbrauch zu unterbinden ist entscheidender.

  19. Zur Zeit ein heißes Thema: Blogfox und das „Klauen“ von Newsfeeds aus der Blogg.de-Datenbank. [1] [2] [3] [4] [5] Man kann ja von neuen Suchdiensten halten was man will, aber Thomas Promny bedient sich bei der Datensammlung einer doch etwas dubiosen Me….

  20. Sammlung von Blog-, RSS- und Suchmaschinen-VerzeichnissenWas
    macht den Erfolg für den Shop aus? Unserer Meinung nach benötigt ein
    erfolgreicher Online-Shop drei Dinge: Community, Content und Commerce:Community – BLOG.eCommerce-Handbuch.de (evtl. FORUM

  21. kaka kaka kaka

  22. kaka kaka kaka

  23. ??????????? 4.11.2005 at 10:11

    uh lecke doch mein bestes stück ich fiecke jeden tag aber mit euch würde ich jede sekunde fiecken

  24. Wie ist das rechtlich? Ist es illegal was Promny macht oder nicht?