Blogs: Cartographie sémantique
Hubert Wassner, prof à l'ESIEA, applique les méthodes de distances entre textes dont je suis friand (voir par exemple ici, ou là) à la blogosphère et nous livre une superbe cartographie du top 100 de Wikio :
Les connexions ne sont pas une matérialisation des liens hypertextes, comme dans la Blogopole de RTGI. Ils reflètent la distance lexicale entre les blogs. Hubert n'utilise pas une représentation en arbre comme je le fais souvent, mais une représentation en graphe (et sa "distance" est différente de celle que j'utilise), mais vous trouverez dans nos travaux comme un air de parenté !
Comme il est prévisible la méthode regroupe bien les blogs qui sont monothématiques. Vous retrouverez des "pelotes" high-tech ou politique, par exemple. Mais vous pourrrez constater que ce blog, qui parle aussi bien (ou aussi mal ;-) de l'un que de l'autre, se retrouve quelque peu flottant, entre Affordance, Transnets et Maître Eolas (de bonnes lectures, je suis très honoré).
Mais j'ai l'habitude. J'ai toujours été le c... entre deux chaises : de la linguistique et de l'informatique. Déjà à l'école, ça agaçait les profs. On préfère vous mettre dans des boîtes. Des chiffres ou des lettres, mais pas les deux !
Les connexions ne sont pas une matérialisation des liens hypertextes, comme dans la Blogopole de RTGI. Ils reflètent la distance lexicale entre les blogs. Hubert n'utilise pas une représentation en arbre comme je le fais souvent, mais une représentation en graphe (et sa "distance" est différente de celle que j'utilise), mais vous trouverez dans nos travaux comme un air de parenté !
Comme il est prévisible la méthode regroupe bien les blogs qui sont monothématiques. Vous retrouverez des "pelotes" high-tech ou politique, par exemple. Mais vous pourrrez constater que ce blog, qui parle aussi bien (ou aussi mal ;-) de l'un que de l'autre, se retrouve quelque peu flottant, entre Affordance, Transnets et Maître Eolas (de bonnes lectures, je suis très honoré).
Mais j'ai l'habitude. J'ai toujours été le c... entre deux chaises : de la linguistique et de l'informatique. Déjà à l'école, ça agaçait les profs. On préfère vous mettre dans des boîtes. Des chiffres ou des lettres, mais pas les deux !
Libellés : Blogs
9 Commentaires:
J'ai du mal à en extraire du sens. Oui, ok, les blogues de cuisine sont ensemble par exemple, mais quoi d'autre ?
Vous dites ne pas en comprendre le sens... c'est justement de "sens" dont il s'agit... Les "mots", ici les noms de blogs, sont regroupés quand ils ont un "sens" commun.
A quoi ça sert ?
Déjà regrouper automatiquement (je rappelle qu'il s'agit d'une production logicielle) est très utile :
Par exemple je pourrais automatiquement conseiller une entreprise voulant faire une campagne de pub virale pour une nouvelle casserole.
Il m'est facile d'identifier les blogs de cuisine et ceux qui y sont connexe.
Dit autrement, cela me permet d'explorer la blogosphère alors que, à priori, je ne la connais(sait) pas...
Plus étonnant encore, dans la mesure ou cela est automatique je pourrais même le réaliser dans une langue que je ne connais pas ...!
(il suffit de changer de langue dans la requête de moteur de recherche)
Autre utilité ?
Identifier un blog : imaginons que je connaisse les blogs de Affrodance et Transnet, mais ne connaisse pas "technologie du langage".
Et bien je pourrais me dire qu'il ressemble un peu au deux...
Cela peut etre utile pour faire de la recommandation ("vous aimez ce blog/livre/disque/artiste/... , vous aimerez probablement aussi ceux-là.)"
Fascinant ! comme bien souvent. Merci.
ah voila ! Je me suis toujours demandé pourquoi j'étais un grand admirateur de ce blog. Parce qu'on a un point commun en fait : le c... entre deux chaises !
J'ai eu beau répliqué toute ma scolarité que Descartes ou Pascal aussi avaient mal aux fesses, personne n'a voulu m'écouter !
Un logicile qui utilise votre algorythme c'est Critéo, installez le vous serez surpris des résultats !
Vous êtes dans le vrai ;-)
Saviez vous que vous êtes référencé en septième position des blogs sarkozystes sur l'annuaire de blogs UMP du site Internet de l'UMP?
Clémence> Alors ça, ça m'épate... Ils n'ont pas du lire mon livre !
D'autres intéressants jeux mathématico / esthetico / littéraires avec Jack Kerouac (au cas improbable ou vous ne connaissiez pas ces travaux) :
http://www.notcot.com/archives/2008/04/stefanie_posave.php
Oui, superbe, n'est-ce pas ! Il faudrait que j'en parle un de ces jours !
Enregistrer un commentaire