Tag Relatedness: fett.

Flickr ist sowieso klasse, aber das hier ist genial:

tag relatedness, which makes surfing around the tag space that much more fun. It’s the first version of the first part of the first of four planks on which we will build a platform to take over the world. It’s all done algorithmically (no human editing involved) and the results can be eerily good.

For example: the „urban“ tag is related to city, street, and graffiti.

Ich staune etwas, wie die Zusammenhänge automagisch aufgedröselt werden, kann mir da jemand auf die Sprünge helfen?

5 Antworten auf „Tag Relatedness: fett.“

  1. Ich würde das so machen: Jedes Bild hat ja meistens mehr als ein Tag. Also nimmt man ein Tag, bestimmt alle weiteren Tags und nimmt davon die, die am häufigsten in Kombination mit dem ursprünglichen Tag genannt werden.

  2. kann mich dirks meinung nur anschließen. einfach analysieren, welche tags besonders häufig mit in kombination mit einem anderen verwendet werden. diese methode (selbes prinzip wie „collaborative filtering“ bei den empfehlungen in amazon ist die einfachste und nicht schwierig zu implementieren. sie kann allerdings zu manchmal absurden „relations“ führen – was aber nicht wirklich stört. wie das „im kleinen“ (bei einer person) funktioniert, kann man sich sehr schön bei del.icio.us ansehen. auf einen tag klicken und man bekommt die anderen tags angezeigt, die man selbst häufig in kombination mit diesem tag verwendet.

    sehr einfach verbessern läßt sich die plausibilitätsquote bei diesem verfahren, wenn man eine art dictionary/thesaurus darüber legt. das hat allerdings den nachteil, dass die sache dann schwer sprachabhängig wird. spannend könnte die sache aber werden, wenn tatsächlich mehrsprachige wörterbücher integriert würden, damit beziehungen wie „tree“ – „baum“ deutlich werden. ich denke, wir werden bald das eine oder andere tagging-system sehen, das so etwas verwendet.

  3. Dirk: Jo, genau das wirds sein. Macht eRONA genauso, und Bloglines wahrscheinlich auch, genau wie zig andere Dienste, die Ähnlichkeiten vergleichen.

    Markus: Von wegen Mehrsprachigkeit. Wenn Du Tags nach einer numerischen ID auflöst und Übersetzungstabellen für mehrere Sprachen anbietest, kannst Du Dir einen Teil der Arbeit sparen. Jetzt noch schnell nen Thesaurus gezimmert und los gehts ;)

Kommentare sind geschlossen.