02. März 2005

BlogFox: alles nur geklaut

Seit ein paar Tagen gibt es Blogfox.de, laut Eigenwerbung:

BlogFox ist eine Suchmaschine, die ausschließlich Weblogs durchsucht.
BlogFox ist seit dem 21.02.2005 online und befindet sich noch im Beta-Stadium. Momentan sind 21450 deutschsprachige Blog-Feeds und darin 114595 einzelne Posts in unserem Index.
BlogFox sucht nicht live. Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.

Blogfox.de wird von Thomas Promny betrieben, der bereits als auffällig geworden ist. Grund genug, sich Blogfox.de einmal genauer anzugucken.

Die Feeds sind von Blogg.de geklaut worden.
Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary, das seit Monaten inaktiv ist und von dem kein Permalink mehr vorhanden ist, sondern nur noch der RSS-Feed. Dieses Weblog ist bei unserer manuellen Prüfung vor ein paar Monaten durchgerutscht, denn es ist nicht aus dem deutschsprachigen Raum. Dieses Weblog ist bei Blogfox.de zu finden. Die Daten können nur von uns gescraped worden sein.

Werfen wir doch mal einen Blick auf die Logfiles der letzten Tage:
85.93.15.3 - - [01/Mar/2005:01:00:17 +0100] "GET /list.php?char=a&off= HTTP/1.1" 200 64997 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:00:19 +0100] "GET /list.php?char=a&off=50 HTTP/1.1" 200 64372 "-" "-"85.93.15.3 - - [01/Mar/2005:01:00:20 +0100] "GET /list.php?char=a&off=100 HTTP/1.1" 200 64419 "-" "-"
[...]
85.93.15.3 - - [01/Mar/2005:01:16:42 +0100] "GET /list.php?char=z&off=2650 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2700 HTTP/
1.1" 200 20785 "-" "-"
85.93.15.3 - - [01/Mar/2005:01:16:43 +0100] "GET /list.php?char=z&off=2750 HTTP/
1.1" 200 20785 "-" "-"

Dies ist nur ein kleiner Auszug. Unsere robots.txt enthält ausdrücklich ein Disallow: /list.php – aber Thomas Promny hält sich nicht daran und spidert einfach alle unsere Inhalte. Die IP-Adresse 85.93.15.3 löst sich auf addicted.de auf und diese Domain gehört Thomas Promny.

Nun weiss man also auch, was der Passus “Wir aktualisieren die Inhalte der Weblogs momentan mehrmals täglich.” bedeutet. Die Inhalte werden von Blogg.de geklaut und dann in die eigene Datenbank gepackt. Wir erlauben die Nutzung unserer Feeds für nichtkommerzielle Zwecke, aber das Projekt Blogfox.de sieht nicht danach aus. Blogg.de aggregiert die Daten entweder über Weblogs.com oder blo.gs, oder wird selber angepingt. Wir setzen Filter ein, um lediglich Weblogs aus dem deutschsprachigen Raum zu finden. Jedes einzelne Weblog wird dann manuell freigeschaltet, damit die Qualität von Blogg.de gewährleistet bleibt.

Wer eine eigene Blog-Suchmaschine betreiben will, muss genauso verfahren und nicht einfach anderer Leute Arbeit dreist kopieren.

You're following this conversation Unfollow
Conversation 
Sign in and Post
Frank moderator

Wie ist das rechtlich? Ist es illegal was Promny macht oder nicht?

??????????? moderator

uh lecke doch mein bestes stück ich fiecke jeden tag aber mit euch würde ich jede sekunde fiecken

Sau moderator

kaka kaka kaka

Sau moderator

kaka kaka kaka

eCommerce Handbuch moderator

Sammlung von Blog-, RSS- und Suchmaschinen-VerzeichnissenWas macht den Erfolg für den Shop aus? Unserer Meinung nach benötigt ein erfolgreicher Online-Shop drei Dinge: Community, Content und Commerce:Community - BLOG.eCommerce-Handbuch.de (evtl. FORUM

Sinus Weblog - Szientometrie definiert Van Raan moderator

Zur Zeit ein heißes Thema: Blogfox und das "Klauen" von Newsfeeds aus der Blogg.de-Datenbank. [1] [2] [3] [4] [5] Man kann ja von neuen Suchdiensten halten was man will, aber Thomas Promny bedient sich bei der Datensammlung einer doch etwas dubiosen Me....

Andreas (dekaf) moderator

@Siegfried: schon klar, aber die kausalkette ist doch recht eindeutig -> wo keine feeds, da gibt es auch keine feedsammlung, ergo kann die url sammlung auch nicht geklaut werden. @moe: feed abschalten um "klau" zu vermeiden ist ja nur die halbe wahrheit. feed abschalten um missbrauch zu unterbinden ist entscheidender.

Dobschats Weblog moderator

Nico über die Blogsuchmaschine BlogFox: Die Feeds sind von Blogg.de geklaut worden. Das kann man zum einen an Logfiles festmachen, zum anderen aber auch interessanten kleinen Details. So existiert bei uns in der Datenbank ein Weblog namens Arbitrary,...

Moe moderator

Wer meint seinen Feed abschalten zu müssen damit der nicht "geklaut" wird, der soll das ma besser tun..

Siegfried Hirsch moderator

@Andreas: es geht doch nicht um die RSS-Feeds, sondern um die Sammlung der URL's zu den Feeds. Die hat Blogfox abgegriffen, damit er sich das Suchen nach den URL's spart. Kleiner feiner Unterschied

Andreas (dekaf) moderator

wenn das so weitergeht, werden demnächst einige blog betreiber einfach ihre feeds wieder abschalten. RSS/Atom waren gedacht um es den lesern angenehm zu machen, nicht um pageranks geschubse bei suma spammern zu unterstützen.

Webmaster Blog moderator

Thomas hat eine Blog-Suchmaschine gebaut. Nico behauptet nun, dass die Daten alle nur bei seinem Blogg.de geklaut wurden. Beweise? Blogfox kennt den Feed eines Blogs namens Arbitrary, welches seit längerem nicht mehr existiert, aber noch bei Blogg.d

checkov moderator

Krasse show, kann ich dazu nur sagen... BTW: Ich würde gerne sowas wie eine deutsch-spanische Connextion aufbauen. So richtig habe ich noch keinen Plan wie ich das anstellen soll. Einen spanischen blog-Betreiber habe ich schon angeschrieben. Vielleicht besteht bei Dir ja Interesse?! Würde mich freuen :-) lg Checkov

Daniel moderator

Thomas Promy und Roland Becker waren mal zusammen ein Laden... bis vor gar nich so langer Zeit, dann wars auf einmal nur noch einer.

Nico moderator

danke, fixe ich.

Frank moderator

85.93.15.3 = adicted.de adicted.de ≠ addicted.de adicted.de ≠ Thomas Promny adicted.de = Roland Becker

Matthias moderator

Ich hab zwar etwas weniger Feeds als blogg.de* und habe sicher viel weniger Arbeit damit. Aber ich würde mich auch ärgern, wenn sich ein anderer einfach so bediente und das dann als Eigenleistung ausgibt. Ich Dummerchen stell die Feeds auch noch als OPML-File zur Verfügung. *ca. 0.5%

Silberlinge moderator

Ich hatte hier von BlogFox berichtet und dieser Beitrag im Lummaland scheint mein Gefhl, das irgendwas seltsam ist an BlogFox, zu besttigen. Dann werd' ich mal das IP-Banning einschalten gehen.

Nicole Simon moderator

Nicht nur zusammentragen, sondern auch mit blogstats.de ein Tool bereitstellen, welches eindeutig aktueller, eindeutig aufgeräumter und eindeutig schneller ist als alles, was so im englischsprachigen Bereich rumfleucht. Ich habe ja Verständnis für eine höhere Komplexität im internationalen Business, aber ich wünsche mir jedes Mal ein englischsprachiges blogstats mit der gleichen Qualität, um ein wenig uptodate bleiben zu können und die Kommunikation verfolgen zu können. Für meine eigenen Seiten sind in der Regel meine eigenen Referrer aussagekräftiger als Technorati und Co :(

Moe moderator

Mir gings nur um die Formulierung "geklaut", da ich sie in dem Kontext nicht sehr dienlich finde. Unbestreitbar ist das was dort bei Blogfox passiert nicht gerade die feine englische Art. Und blogg.de ist in der Tat ein Service den ich sicher nicht missen will!

Nico moderator

von besitzrechten habe ich auch nicht gesprochen und die feeds liegen ja auch bei den einzelnen blogs. wir sind allerdings diejenigen, die diese feeds mit einigem aufwand zusammentragen.

Moe moderator

>Die Feeds sind von Blogg.de geklaut worden. Wie man jetzt zb meinen Feed "von Blogg.de klauen" kann ist mir nicht ganz klar, dachte ich doch keinerlei Besitzrechte an blogg.de übertragen zu haben. ;-) Ansonsten würde ich aber auch sagen, daß BlogFox nicht wirklich eine Erwähnung wert ist.

dogfood moderator

Nicht Promnys erstes Auftauchen in der Blog-Szene. Vor kurzem mit bloggerforum.de. Im eigenen Umfeld eine ganze Latte von Websites, Blogs und Suchmaschinen mit düftigsten Content, deren Hauptziel wohl dass gegenseitige Hochjazzen im Pagerankin sein soll. da lacht das "Suchmaschinenoptimierer-Herz".

hebig.org/blog moderator

Erst spammen, jetzt klauen: Nico Lumma über Thomas Promny >...

heiko moderator

*hüstel*

Trackbacks