Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

lundi, décembre 01, 2008

Buzz: Les nuages s'améliorent

Vous vous souvenez sans doute de mes nuages de buzz, qui essaient de donner une image des personnes qui font l'actu en temps réel (billet d'avril). Vous aviez été nombreux à réagir à l'époque, et j'avais été d'ailleurs (agréablement) surpris, une fois de plus, par la qualité et la pertinence des commentaires. En gros, vous aviez détecté la plus grande partie des difficultés, car aussi simple que ce problème puisse paraître, il est rempli d'embûches et de chausses-trapes... Il y a les variantes (Hillary Clinton / Hillary Rodham Clinton), les patronymes seuls (ok, on peut rattacher sans grand risque la plupart du temps Sarkozy et Nicolas Sarkozy, mais que faire de Clinton ?), les fausses pistes (on voudrait Taj Jackson mais pas Taj Mahal...), les personnages de fiction (Harry Potter ou Mickey Mouse : faut-il les garder ?). Etc. etc. La liste est impressionnante.


Depuis avril, j'ai pas mal travaillé sur le sujet avec la complicité éclairée de Jérôme de Wikio, que je remercie au passage, c'était un vrai plaisir (tient au fait : Jérôme de Wikio, ce n'est pas comme Albert de Monaco, n'est-ce pas ?). Le résultat est passé en production sur la nouvelle page d'accueil de Wikio depuis quelques jours :



Ce n'est pas parfait, il y a encore par-ci par-là de petits soucis, mais je pense que vous pourrez constater que la situation s'est améliorée (vous pourrez aussi regarder le buzz des différents pays ici -- la qualité est hélas un peu moins bonne).

Et voici une nouvelle fonctionnalité, qui n'est pour l'instant que sur Wikio Labs : les personnages de l'actu pour quatre grandes catégories : culture, international, politique et sport (les autres catégories comme santé ou science se prêtent mal à l'exercice : elles ne font pas assez apparaître de personnalités pour que le nuage ait un intérêt). Jérôme y travaille d'arrache-pied, et je pense que ça va passer en production sur les pages de catégories correspondantes sur Wikio d'ici quelque temps, mais en attendant vous pouvez jouer avec sur Labs:


Vos remarques sont comme toujours les bienvenues ! Et votre indulgence aussi... Parole : c'est un problème difficile !

Libellés :


11 Commentaires:

Blogger J2J2 a écrit...

Mais, mais, que vois-je ? Il n'y a pas de catégorie people (oui, je sais, il y a culture, mais ce n'est pas tout à fait la même chose) ???
Dommage, j'aurais comparé avec nos nuages sur staragora.

01 décembre, 2008 21:04  
Blogger Jean Véronis a écrit...

Tu peux regarder . Mais ce n'est pas pertinent, c'est pour ça que je ne l'ai pas retenue. En fait, les "people" sont chez Wikio sous acteurs, chanteurs etc., c'est-à-dire sous "culture". Ce n'est pas très bon... Ca fait partie des choses à changer. Britney Spears et Claude Levy Strauss dans la même catégorie, ça défrise !

01 décembre, 2008 21:15  
Anonymous Anonyme a écrit...

Ça me semble plutot réussi en effet, aussi bien pour le français que l'anglais (UK comme US). Je suppose que ce sont à la fois les langues qui ont la priorité de Wikio et sur lesquelles vous travaillez le plus facilement... Une déception cependant sur l'allemand : l'article défini y est toujours très présent en guise de prénom. Je suis sûr que vous avez réglé des problèmes bien plus complexes que celui-là ! Mais, après tout, faire voisiner Markt et Fehler n'est pas un si mauvais résumé d'une certaine actualité récente ;-)

01 décembre, 2008 22:59  
Anonymous Anonyme a écrit...

1/ Le nuage ne renforce-t-il pas la force d'impact des plus gros blogs, peut-être au détriment de blogs plus modestes?
En même temps, c'est un peu le principe du Buzz...
Au secours, il me faut un peu de geek attitude au prochain petit déjeuner!
2/ Culture, international, politique et sport: ça ressemble un peu à du TF1 (quoique l'ordre des priorités soit inversé)
3/ Les sciences posent problème tout comme les domaines techniques alors? (mais pourquoi donc :-/ ?)
4/ Il faut donc "peopleiser" Levy-Strauss de toute urgence!
A+

02 décembre, 2008 00:57  
Blogger Jean Véronis a écrit...

Nono> L'allemand est très difficile : la présence d'une majuscule n'y est pas significative comme dans les autres langues pour signaler les noms propres comme dans les autres langues. Ca fit partie des choses à améliorer...

02 décembre, 2008 08:07  
Blogger Jean Véronis a écrit...

Ferocias>

1) tous les articles sont pris dans pondération ni discrimination aucune, donc effectivement, ça privilégie dans la pratique les sources qui publient le plus

2) et encore, Culture est un bien grand mot. People serait sans doute plus adapté dans la plupart des cas (cf. discussion avec Jérôme Charron ci-dessus) - C'est un reflet de notre société, je suppose : on ne parle pas beaucoup des derniers prix Nobel...

3) Les sciences : c'est ce que je disais à l'instant : peu de news, et on parle peu des personnes

4) Lévy-Strauss: et encore, il a de la chance, il est déjà une star !

02 décembre, 2008 08:12  
Blogger Charles a écrit...

Pour l'allemand je remarque que les noms propres déclinés (au génitif : Angela Merkels) sont perçus comme distincts du nominatif...
Peut-être faudrait-il se lancer dans une langue slave, ou la déclinaison est encore plus présente et donc complexe, pour résoudre ce problème inexistant en français.

02 décembre, 2008 11:12  
Anonymous Anonyme a écrit...

Pardon si vous en avez parlé ailleurs, mais il y a aussi la différence entre les tags que nous déclarons et ceux que se construit Google sur nos mêmes articles. Autre différence : cliquer sur un tag dans un blog, puis saisir le mot dans le moteur interne du même blog. Obtenez-vous le même résultat ? Et oui ! ...

02 décembre, 2008 18:27  
Anonymous Anonyme a écrit...

Une remarque scientifique de fond : la palette de couleurs aurait besoin d'être reprise par un graphiste, amha !

03 décembre, 2008 09:41  
Blogger Jean Véronis a écrit...

FredéricLN> Oui, la palette ne me plaît guère, non plus. Mais elle n'est pas de mon choix...

03 décembre, 2008 15:05  
Blogger Jean Véronis a écrit...

Charles B> Oui, l'allemand est décidément difficile (voir réponse à Nono ci-dessus). Ce sont des améliorations qui viendront peu à peu. En tout cas ces erreurs ont une vertu pédagogique : elles montrent la difficulté immense du traitement automatique des langues !

03 décembre, 2008 15:07  

Enregistrer un commentaire