02. März 2005

BlogFox: alles nur geklaut

Seit ein paar Tagen gibt es Blogfox.de, laut Eigenwerbung:

BlogFox ist eine Suchmaschine, die ausschließlich Weblogs durchsucht.
BlogFox ist seit dem 21.02.2005 online und befindet sich noch im Beta-Stadium. Momentan sind 21450 deutschsprachige Blog-Feeds und darin 114595 einzelne Posts in unserem Index.
BlogFox sucht nicht live. Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.

Blogfox.de wird von Thomas Promny betrieben, der bereits als auffällig geworden ist. Grund genug, sich Blogfox.de einmal genauer anzugucken.

Die Feeds sind von Blogg.de geklaut worden.
Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary, das seit Monaten inaktiv ist und von dem kein Permalink mehr vorhanden ist, sondern nur noch der RSS-Feed. Dieses Weblog ist bei unserer manuellen Prüfung vor ein paar Monaten durchgerutscht, denn es ist nicht aus dem deutschsprachigen Raum. Dieses Weblog ist bei Blogfox.de zu finden. Die Daten können nur von uns gescraped worden sein.

Werfen wir doch mal einen Blick auf die Logfiles der letzten Tage:
85.93.15.3 - - [01/Mar/2005:01:00:17 +0100] "GET /list.php?char=a&off= HTTP/1.1" 200 64997 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:00:19 +0100] "GET /list.php?char=a&off=50 HTTP/1.1" 200 64372 "-" "-"85.93.15.3 - - [01/Mar/2005:01:00:20 +0100] "GET /list.php?char=a&off=100 HTTP/1.1" 200 64419 "-" "-"
[...]
85.93.15.3 - - [01/Mar/2005:01:16:42 +0100] "GET /list.php?char=z&off=2650 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2700 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2750 HTTP/
1.1" 200 20785 "-" "-"

Dies ist nur ein kleiner Auszug. Unsere robots.txt enthält ausdrücklich ein Disallow: /list.php – aber Thomas Promny hält sich nicht daran und spidert einfach alle unsere Inhalte. Die IP-Adresse 85.93.15.3 löst sich auf addicted.de auf und diese Domain gehört Thomas Promny.

Nun weiss man also auch, was der Passus “Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.” bedeutet. Die Inhalte werden von Blogg.de geklaut und dann in die eigene Datenbank gepackt. Wir erlauben die Nutzung unserer Feeds für nichtkommerzielle Zwecke, aber das Projekt Blogfox.de sieht nicht danach aus. Blogg.de aggregiert die Daten entweder über Weblogs.com oder blo.gs, oder wird selber angepingt. Wir setzen Filter ein, um lediglich Weblogs aus dem deutschsprachigen Raum zu finden. Jedes einzelne Weblog wird dann manuell freigeschaltet, damit die Qualität von Blogg.de gewährleistet bleibt.

Wer eine eigene Blog-Suchmaschine betreiben will, muss genauso verfahren und nicht einfach anderer Leute Arbeit dreist kopieren.

Ähnliche Artikel:

  1. Alles nur für die eigene Sicherheit? Ich fand die Einreise-Bestimmungen für die USA ja schon immer leicht merkwürdig, insbesondere der auszufüllende...
  2. Jabber: Alles Gute zum 6. Geburtstag! Jeremie Miller stellte am 4.1.99 bei /. sein Open Real Time Messaging System vor. Mittlerweile...
  3. Alles Verrückte hier Eigentlich, ja eigentlich finde ich, Gewerkschaften könnten eine sinnvolle Einrichtung sein. Mit den bundesdeutschen Gewerkschaften...

Post comment as twitter logo facebook logo
Sort: Newest | Oldest

Wie ist das rechtlich? Ist es illegal was Promny macht oder nicht?

uh lecke doch mein bestes stu00c3u00bcck ich fiecke jeden tag aber mit euch wu00c3u00bcrde ich jede sekunde fiecken

Sammlung von Blog-, RSS- und Suchmaschinen-VerzeichnissenWas
macht den Erfolg fu00c3u00bcr den Shop aus? Unserer Meinung nach benu00c3u00b6tigt ein
erfolgreicher Online-Shop drei Dinge: Community, Content und Commerce:Community - BLOG.eCommerce-Handbuch.de (evtl. FORUM

Zur Zeit ein heiu00c3u009fes Thema: Blogfox und das "Klauen" von Newsfeeds aus der Blogg.de-Datenbank. [1] [2] [3] [4] [5] Man kann ja von neuen Suchdiensten halten was man will, aber Thomas Promny bedient sich bei der Datensammlung einer doch etwas dubiosen Me....

@Siegfried: schon klar, aber die kausalkette ist doch recht eindeutig -> wo keine feeds, da gibt es auch keine feedsammlung, ergo kann die url sammlung auch nicht geklaut werden.

@moe: feed abschalten um "klau" zu vermeiden ist ja nur die halbe wahrheit. feed abschalten um missbrauch zu unterbinden ist entscheidender.

Nico u00c3u00bcber die Blogsuchmaschine BlogFox: Die Feeds sind von Blogg.de geklaut worden. Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary,...

Wer meint seinen Feed abschalten zu mu00c3u00bcssen damit der nicht "geklaut" wird, der soll das ma besser tun..

@Andreas: es geht doch nicht um die RSS-Feeds, sondern um die Sammlung der URL's zu den Feeds. Die hat Blogfox abgegriffen, damit er sich das Suchen nach den URL's spart.

Kleiner feiner Unterschied

wenn das so weitergeht, werden demnu00c3u00a4chst einige blog betreiber einfach ihre feeds wieder abschalten. RSS/Atom waren gedacht um es den lesern angenehm zu machen, nicht um pageranks geschubse bei suma spammern zu unterstu00c3u00bctzen.

Thomas hat eine Blog-Suchmaschine gebaut. Nico behauptet nun, dass die Daten alle nur bei seinem Blogg.de geklaut wurden. Beweise? Blogfox kennt den Feed eines Blogs namens Arbitrary, welches seit lu00c3u00a4ngerem nicht mehr existiert, aber noch bei Blogg.d

Krasse show, kann ich dazu nur sagen...

BTW: Ich wu00c3u00bcrde gerne sowas wie eine deutsch-spanische Connextion aufbauen. So richtig habe ich noch keinen Plan wie ich das anstellen soll. Einen spanischen blog-Betreiber habe ich schon angeschrieben. Vielleicht besteht bei Dir ja Interesse?! Wu00c3u00bcrde mich freuen :-)

lg
Checkov

Thomas Promy und Roland Becker waren mal zusammen ein Laden... bis vor gar nich so langer Zeit, dann wars auf einmal nur noch einer.

85.93.15.3 = adicted.de
adicted.de u00e2u0089u00a0 addicted.de
adicted.de u00e2u0089u00a0 Thomas Promny
adicted.de = Roland Becker

Ich hab zwar etwas weniger Feeds als blogg.de* und habe sicher viel weniger Arbeit damit. Aber ich wu00c3u00bcrde mich auch u00c3u00a4rgern, wenn sich ein anderer einfach so bediente und das dann als Eigenleistung ausgibt. Ich Dummerchen stell die Feeds auch noch als OPML-File zur Verfu00c3u00bcgung.

*ca. 0.5%

Ich hatte hier von BlogFox berichtet und dieser Beitrag im Lummaland scheint mein Gefhl, das irgendwas seltsam ist an BlogFox, zu besttigen. Dann werd' ich mal das IP-Banning einschalten gehen.

Nicht nur zusammentragen, sondern auch mit blogstats.de ein Tool bereitstellen, welches eindeutig aktueller, eindeutig aufgeru00c3u00a4umter und eindeutig schneller ist als alles, was so im englischsprachigen Bereich rumfleucht.

Ich habe ja Verstu00c3u00a4ndnis fu00c3u00bcr eine hu00c3u00b6here Komplexitu00c3u00a4t im internationalen Business, aber ich wu00c3u00bcnsche mir jedes Mal ein englischsprachiges blogstats mit der gleichen Qualitu00c3u00a4t, um ein wenig uptodate bleiben zu ku00c3u00b6nnen und die Kommunikation verfolgen zu ku00c3u00b6nnen.

Fu00c3u00bcr meine eigenen Seiten sind in der Regel meine eigenen Referrer aussagekru00c3u00a4ftiger als Technorati und Co :(

Mir gings nur um die Formulierung "geklaut", da ich sie in dem Kontext nicht sehr dienlich finde.

Unbestreitbar ist das was dort bei Blogfox passiert nicht gerade die feine englische Art.

Und blogg.de ist in der Tat ein Service den ich sicher nicht missen will!

von besitzrechten habe ich auch nicht gesprochen und die feeds liegen ja auch bei den einzelnen blogs. wir sind allerdings diejenigen, die diese feeds mit einigem aufwand zusammentragen.

>Die Feeds sind von Blogg.de geklaut worden.

Wie man jetzt zb meinen Feed "von Blogg.de klauen" kann ist mir nicht ganz klar, dachte ich doch keinerlei Besitzrechte an blogg.de u00c3u00bcbertragen zu haben. ;-)

Ansonsten wu00c3u00bcrde ich aber auch sagen, dau00c3u009f BlogFox nicht wirklich eine Erwu00c3u00a4hnung wert ist.

Nicht Promnys erstes Auftauchen in der Blog-Szene. Vor kurzem mit bloggerforum.de. Im eigenen Umfeld eine ganze Latte von Websites, Blogs und Suchmaschinen mit du00c3u00bcftigsten Content, deren Hauptziel wohl dass gegenseitige Hochjazzen im Pagerankin sein soll. da lacht das "Suchmaschinenoptimierer-Herz".

Erst spammen, jetzt klauen: Nico Lumma u00c3u00bcber Thomas Promny >...