Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mardi, septembre 09, 2008

Blogs: Wikio enlève le haut

Je sais bien que depuis mon annonce des Wikio Labs, beaucoup d’entre vous aimeraient aller droit au but : qu’y a-t-il donc dans les recoins les plus intimes de ce satané classement Wikio qui déchaîne tant de passion chaque mois ? Mais comme dans tout strip-tease qui se respecte, il faut faire les choses dans l’ordre, faire un peu monter la pression (ou autre chose ;-) Donc, aujourd’hui on n’enlève que le haut...

Blague à part, j’ai besoin, avant d’expliquer les « gory details » du classement, de vous expliquer un certain nombre de petites choses sur le fonctionnement de Wikio, et, sinon d’y répondre, au moins de poser la question : « A quoi ça sert, un classement de blogs » ? J’en profite pour vous livrer tout de suite ma position personnelle sur la question : les vieux lecteurs de ce blog savent que je ne suis pas un accro des stats et de l’égomètre. Bien sûr, ça m’a amusé comme un gamin quand j’ai vu que ce blog, démarré sur un coin de table, dépassait le million de « visiteurs uniques », mais il faut garder la tête froide... Tout le monde peut avoir ses « 15 minutes of fame ». D'ailleurs, que le Monde me classe dans les « leaders d’opinion » à la Une, voilà qui m’a franchement fait rigoler ! Je crois que je n’ai pas assez d’ego pour m’exciter sur ce genre de choses (et quand la tête commence à me tourner, bien que je sois un incurable mécréant, je relis ce texte, qui est à mon sens un des plus beaux de notre héritage...). Le classement Wikio m’intéresse pour de tout autres raisons.

*

Tout d’abord, l’océan d’informations dans lequel nous vivons désormais est de plus en plus difficile à la navigation. Vous vous souvenez peut-être de l’âge d’or de l’annuaire Yahoo ! quand le Web est apparu. Quelques catégories bien organisées de façon arborescente, quelques clics et vous aviez l’univers virtuel entier sous la souris... Les choses ont bien changé. Le Web est devenu d’une taille et d’une complexité effarante, et ce serait bien difficile de s’y retrouver sans instruments adéquats. Pour ne parler que des blogs, il y en a quelques millions qui traînent, rien qu’en langue française, mélangés de surcroît à des agrégateurs, du spam, des piles, des listes de bookmarks et autres objets virtuels plus ou moins bien identifiés. Comment découvrir rapidement les blogs sur mes centres d’intérêt ? Littérature, cuisine, vins, équitation, que sais-je ? Dans un commentaire sur un précédent billet, Christelle nous expliquait par exemple que l’idée de classement l’intéresse comme outil de navigation et de décryptage du média internet avec ses élèves collégiens. Elle suggérait (c’est une excellente idée) de créer une catégorie « Education ». Voilà qui serait un bon point d’accès pour tous les profs qui cherchent des blogs sur le sujet !

Voilà donc la première utilité pour moi d’un classement de blogs. Evidemment, cela peut avoir des effets pervers. Ainsi, qu’une ministre nouvellement nommée se serve du top 10 du classement Wikio High-Tech pour choisir ses interlocuteurs sur l’évolution de la recherche en France ou la réforme des Universités, ou que sais-je encore, voilà qui est quand même un peu fort de café... Et, bien entendu, la tentation est grande pour les journalistes de se servir des « célébrités » du top 10 ou 20 à tout bout de champ pour alimenter leurs papiers. Nicolas (ex-Versac) nous a expliqué qu’il a fini par vivre ça comme un harcèlement. Je conçois que ce soit lourd à porter, comme toute exposition médiatique. Mais ce sont des épiphénomènes, à mon sens, d’ailleurs à part quelques blogueurs du « top » (non professionnels, évidemment, car les autres se réjouissent), personne n’a à souffrir trop de cette surexposition...

*

Deuxième aspect, qui m’intéresse encore plus, en tant que chercheur, le classement est la base du tri et de l’organisation des articles, de façon à présenter les nouvelles et billets les plus « pertinents » (notion bien difficile à cerner, nous y reviendrons !) à l’utilisateur. Le Web a sa potion magique : le « Page Rank » (même s’il a bien évolué dans la pratique depuis la belle formule initiale simple et propre comme du cristal). Le classement Wikio reprend globalement la même idée : mesurer l’ « influence » des sources grâce à leurs rétroliens (nous entrerons dans les détails dans les billets suivants, promis). C’est ce qui permet d’afficher les informations de façon lisible sur le site, en faisant apparaître en premier les informations les plus « pertinentes » dans les pages de résultats ou en choisissant des « têtes » représentatives dans le groupage des infos similaires. A part l’aspect com et le buzz médiatique mensuel, il a donc une utilité profonde : c’est lui qui vous permet d’avoir des résultats à peu près présentables sur les pages d’infos. Chaque blog a un « poids » qui résulte directement du classement, de façon très analogue au Page Rank de Google : 7 pour le top 100, 6 pour le top 1000 et ainsi de suite. On peut bien sûr discuter des paramètres, et de la façon de décider algorithmiquement de la pertinence (et c’est ce que nous ferons – en attendant je vous conseille la lecture du billet de Vicnent, qui nous fait un inventaire magistral des différents paramètres que l’on pourrait prendre en compte), mais qui voudrait voir 125 fois la même information sur une page (c’est ce qui se passe quand une nouvelle importante arrive), ou à l’inverse voir en tête des résultats papy et mamy qui s’extasient de la naissance du petit dernier ? Ce sont donc des choses à garder en tête quand nous discuterons des pistes d’amélioration !


A lire


(on attend la suite avec impatience, Vicnent !)

Libellés : ,


16 Commentaires:

Anonymous Anonyme a écrit...

Au vu de tout ce qui se dit en analyse du classement Wikio et des autres classements de blogs, les blogueurs semblent avant tout souhaiter que la pertinence du classement puisse classer leur propre blog au dessus des autres. Les uns ne voient que par le nombre de visiteurs, d’autres par la « qualité » de leur retroliens ou simplement le nombre de ces retroliens. Forcément un classement pouvant faire de chaque blogueur un n°1 en fonction de ses propres critères serait un peu compliqué à mettre en place. Personnellement, un classement sur tous les blogueurs de ma rue, dans ma petite, ville m’irait bien. A vue de nez j’y serais n°1 et je serais fier de le dire à tout le monde. Certains annonceurs pourraient même être motivés pour y placer de la pub très localisée (ex : mon boucher ou mon boulanger).

09 septembre, 2008 13:00  
Blogger Jean Véronis a écrit...

Christophe> Oui, tu as sans doute raison ! Mais c'est humain, n'est-ce pas ? En anglais il y a un proverbe qui dit en gros "plus la mare est petite, plus la grenouille paraît grosse"... Ca s'applique, non ?

09 septembre, 2008 13:03  
Blogger Vicnent a écrit...

"on attend la suite avec impatience" : tu serais quand même pas en train d'essayer de me mettre la pression, là, sur ce coup là ? hein ? :-)

09 septembre, 2008 13:22  
Blogger Jean Véronis a écrit...

Vicnent> Mais non, mais non ;-) C'est sincère... Mais prends ton temps. Pour filer la métaphore du strip-tease, il vaut mieux ne pas arracher la petite culotte tout de suite !

09 septembre, 2008 13:27  
Anonymous Anonyme a écrit...

"de façon très analogue au Page Rank de Google"

pas vraiment, car Wikio ne prend pas en compte les liens en blogroll.

Sont donc favorisées les polémiques (on cite souvent un blog dans un article pour de mauvaises raisons: untel a dit une grosse connerie).

Une blogroll qualifie des sites qu'on recommande. Un lien fait dans un article peut être n'importe quoi, un avis négatif aussi bien.

Et puis il y a les liens mondains. Je ne pourrai jamais comprendre qu'un lien fait au nom de la présence de X dans un événement mondain puisse déterminer la pertinence d'un blog.

Faites le compte des blogs politiques en tête de Wikio qui sont composés des participants parisiens à la république des blogs, par exemple... Cela vous donnera une idée de la façon dont ce classement est biaisé par des choses sans rapport avec la pertinence du contenu.

10 septembre, 2008 17:58  
Blogger Jean Véronis a écrit...

Anonyme> Vous avez raison. J'y reviendrai quand on parlera des détails des algos (j'ai dit "analogue", pas identique ;-)

Wikio a fait le choix de ne pas prendre en compte les blogrolls (et de limiter les liens à 4 mois) justement pour refléter un aspect plus dynamique, des mouvements rapides d'opinion. Ca mesure quelque chose d'assez différent de Google. J'ai des graphiques mettant en XY le classement Wikio et le PR de Google, c'est assez instructif !

Evidemment ce choix peut-être discuté, la preuve ;-) Nous pourrons analyser tout ça plus en détail (et vous verrez que les blogrolls ne sont pas exemptes de phénomènes de "cliques", voire de spam...)

10 septembre, 2008 18:11  
Anonymous Anonyme a écrit...

Il y a un s de trop dans la citation.

10 septembre, 2008 22:08  
Anonymous Anonyme a écrit...

L'orthographe...quelle vanité !

10 septembre, 2008 22:09  
Blogger Jean Véronis a écrit...

C'est vrai, quelle vanitation !

(merci)

10 septembre, 2008 22:11  
Anonymous Anonyme a écrit...

Il y a plusieurs choses sur lesquels il faut réfléchir.
Déjà la classification d'un blog :
- comment classer un blog "marketing" vs "pub", "développement durable" vs "environnement", "politique" vs "actualité" etc...
S'il y a un point sur lequel le classement Wikio était hilarant, c'est que certains blogs étaient classé politique alors qu'en fait ils n'en parlaient pas. Et que d'autres blogs classés divers parlaient surtout de politique.

Ensuite comment faire un classement logique?
Un classement doit se baser sur des faits scientifiques. Utiliser des outils 100% anglais pour se baser sur un classement? A rejeter, les blogueurs ne sont pas tous anglophones.
- Il faut travailler sur les liens entrants (très bonne idée) et aussi les liens sortant (car un bon blog c'est aussi un blog capable de renvoyer vers d'autres blogs).
- Il faut travailler sur l'ergonomie. Un blog illisible ne peut pas être classé dans les meilleurs blogs.
- Il faut travailler sur la vitesse d'affichage d'une page.
- Il faut travailler sur le contenu des articles. Parce que voler des articles de presse/communiqués de presse voire de voler les contenus d'autres blogs ne peut pas faire un blog.
- Il faut travailler sur l'orthographe, la grammaire. Le ration nombre de faute de français/nombre de mots doit entrer en considération.

Voilà quelques pistes. Et comme je l'ai dit à Pierre Chappaz, je suis ouvert pour entrer dans le pôle de réflexion. Si je ne suis pas linguiste, universitaire ou quoique ce soit, je suis un fourmillement d'idées !

11 septembre, 2008 12:07  
Anonymous Anonyme a écrit...

Je vais pousser un petit coup de gueule, je trouve que tout est trop policé sur ce blog !

Un des gros problèmes d'Internet est l'immatérialité des échanges. Ce problème, souvent oublié par les internautes, me gêne ici.

D'une, j'ai un peu perdu le fil de la conversation depuis 2/3 posts (n'étant pas connaisseur du tout). De deux, j'aimerais bien pouvoir échanger de tout ça en direct. Pourquoi ne pas essayer d'organiser une petite rencontre ? J'ai l'impression que la "communauté des fans de JV" n'est pas très grande, donc ce n'est pas complètement irréaliste.

Qu'en pensez-vous ? (Je sais bien que la France est grande, et que tout le monde a un emploi du temps chargé, mais on peut sûrement s'arranger).

12 septembre, 2008 14:47  
Blogger Jean Véronis a écrit...

Vincent²>Vous voulez dire "autour d'une bière" (par exemple) ? Ca devrait pouvoir se faire... Mais nous sommes probablement tous aux 4 coins de la planète (ou au moins de l'hexagone). Vous êtes où ? D'ailleurs depuis le temps que vous commentez (et je vous remercie), je réalise (cruelle immatérialité !) que nous ne nous connaissons pas vraiment. Qui êtes-vous en vrai ? avez-vous un blog, un site ?

12 septembre, 2008 14:52  
Anonymous Anonyme a écrit...

Je suis le vengeur masqué ! C'est vrai que c'est injuste pour vous, vous prenez des risques en vous exposant, et en retour, vous prenez des commentaires acerbes de crétins anonymes !

Je n'ai pas de blog ni de site, c'est beaucoup trop de travail pour moi. Je vis (oh, quelle surprise) en banlieue parisienne, je suis fonctionnaire dans un bureau, 23 ans, ni riche ni pauvre. Je suis tombé sur ce site je ne sais plus comment, il me semble pendant les présidentielles de 2007.

Il m'arrive d'aller à Aix parfois (mais je ne connais pas Rognes). Et je suis tout à fait d'accord pour vous rencontrer.

A bon entendeur...

12 septembre, 2008 15:26  
Anonymous Anonyme a écrit...

Dites, il enlève quand le bas wikio ?
j'attends toujours la suite, moi...

29 septembre, 2008 15:21  
Blogger Jean Véronis a écrit...

cette semaine...
j'attendais les résultats du petit nettoyage d'automne afin d'y voir plus clair

29 septembre, 2008 15:35  
Anonymous Gavilan a écrit...

A tiens, je cherchais - pas activement du tout - une édition en ligne de la Bible. Merci du lien vers celle de Jérusalem. Et à part ça, être mécréant et aimer l'Ecclésiaste, ce n'est pas si étonnant, lisez donc Sagesse et blessures Réflexions sur l'Ecclésiaste et Tchouang-Tseu de Charles Juliet chez Bayard. ;-)

04 décembre, 2009 06:45  

Enregistrer un commentaire