Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, mars 26, 2008

Blogs: Cartographie sémantique

Hubert Wassner, prof à l'ESIEA, applique les méthodes de distances entre textes dont je suis friand (voir par exemple ici, ou ) à la blogosphère et nous livre une superbe cartographie du top 100 de Wikio :


Les connexions ne sont pas une matérialisation des liens hypertextes, comme dans la Blogopole de RTGI. Ils reflètent la distance lexicale entre les blogs. Hubert n'utilise pas une représentation en arbre comme je le fais souvent, mais une représentation en graphe (et sa "distance" est différente de celle que j'utilise), mais vous trouverez dans nos travaux comme un air de parenté !

Comme il est prévisible la méthode regroupe bien les blogs qui sont monothématiques. Vous retrouverez des "pelotes" high-tech ou politique, par exemple. Mais vous pourrrez constater que ce blog, qui parle aussi bien (ou aussi mal ;-) de l'un que de l'autre, se retrouve quelque peu flottant, entre Affordance, Transnets et Maître Eolas (de bonnes lectures, je suis très honoré).



Mais j'ai l'habitude. J'ai toujours été le c... entre deux chaises : de la linguistique et de l'informatique. Déjà à l'école, ça agaçait les profs. On préfère vous mettre dans des boîtes. Des chiffres ou des lettres, mais pas les deux !

Libellés :


9 Commentaires:

Anonymous Anonyme a écrit...

J'ai du mal à en extraire du sens. Oui, ok, les blogues de cuisine sont ensemble par exemple, mais quoi d'autre ?

26 mars, 2008 14:34  
Anonymous Anonyme a écrit...

Vous dites ne pas en comprendre le sens... c'est justement de "sens" dont il s'agit... Les "mots", ici les noms de blogs, sont regroupés quand ils ont un "sens" commun.

A quoi ça sert ?

Déjà regrouper automatiquement (je rappelle qu'il s'agit d'une production logicielle) est très utile :

Par exemple je pourrais automatiquement conseiller une entreprise voulant faire une campagne de pub virale pour une nouvelle casserole.
Il m'est facile d'identifier les blogs de cuisine et ceux qui y sont connexe.

Dit autrement, cela me permet d'explorer la blogosphère alors que, à priori, je ne la connais(sait) pas...

Plus étonnant encore, dans la mesure ou cela est automatique je pourrais même le réaliser dans une langue que je ne connais pas ...!
(il suffit de changer de langue dans la requête de moteur de recherche)

Autre utilité ?
Identifier un blog : imaginons que je connaisse les blogs de Affrodance et Transnet, mais ne connaisse pas "technologie du langage".
Et bien je pourrais me dire qu'il ressemble un peu au deux...

Cela peut etre utile pour faire de la recommandation ("vous aimez ce blog/livre/disque/artiste/... , vous aimerez probablement aussi ceux-là.)"

26 mars, 2008 20:00  
Blogger Otir a écrit...

Fascinant ! comme bien souvent. Merci.

28 mars, 2008 16:20  
Anonymous Anonyme a écrit...

ah voila ! Je me suis toujours demandé pourquoi j'étais un grand admirateur de ce blog. Parce qu'on a un point commun en fait : le c... entre deux chaises !
J'ai eu beau répliqué toute ma scolarité que Descartes ou Pascal aussi avaient mal aux fesses, personne n'a voulu m'écouter !

01 avril, 2008 20:46  
Blogger Unknown a écrit...

Un logicile qui utilise votre algorythme c'est Critéo, installez le vous serez surpris des résultats !
Vous êtes dans le vrai ;-)

04 avril, 2008 11:39  
Blogger Unknown a écrit...

Saviez vous que vous êtes référencé en septième position des blogs sarkozystes sur l'annuaire de blogs UMP du site Internet de l'UMP?

04 avril, 2008 12:44  
Blogger Jean Véronis a écrit...

Clémence> Alors ça, ça m'épate... Ils n'ont pas du lire mon livre !

07 avril, 2008 18:56  
Anonymous Anonyme a écrit...

D'autres intéressants jeux mathématico / esthetico / littéraires avec Jack Kerouac (au cas improbable ou vous ne connaissiez pas ces travaux) :

http://www.notcot.com/archives/2008/04/stefanie_posave.php

08 avril, 2008 00:01  
Blogger Jean Véronis a écrit...

Oui, superbe, n'est-ce pas ! Il faudrait que j'en parle un de ces jours !

08 avril, 2008 07:08  

Enregistrer un commentaire