Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

jeudi, octobre 02, 2008

Blogs : Dans les entrailles du classement Wikio (1)

La blogosphère bruisse d’une réprobation montante :

Cher Professeur Aixtal, vous nous avez promis de nous expliquer le fonctionnement du classement Wikio, mais nous ne voyons toujours rien venir...

J'avoue : j'avais enlevé le haut, mais après je vous ai fait patienter un peu (« pas tout de suite, pas trop vite », chantait Juliette Gréco...). Le plus urgent était de finir le nettoyage dont j’ai parlé ici, et de s’assurer que de gros bugs n’en avaient pas profité pour se faufiler sur le podium. Voilà qui est fait, Mlle Agnès s’assure qu’il n’y a pas eu d’erreur majeure et le tout sera sur les ondes lundi (avec, qui sait, quelles fuites d’ici-là ;-). Le classement sortira désormais non plus le premier, mais dans les tout premiers jours du mois (j’espère que ce sera toujours vers le 5, mais nous verrons bien), car il intègre désormais les rétroliens du mois exact alors qu’auparavant la période de référence allait du 20 au 20 de chaque mois... C’était un peu compliqué à suivre et à expliquer ! Les blogueurs qui avaient eu un énorme buzz le 25 du mois ne comprenaient pas toujours très bien de ne pas monter dans le classement...




Mais pourquoi ce délai entre le calcul du classement et sa publication ?

Eh bien, tout simplement parce que le Web est un univers compliqué. Ce que je redoutais par-dessus tout ce mois-ci, par exemple, c’est que le grand nettoyage d’automne ait éliminé non seulement les blogs morts, mais aussi des blogs bien vivants qui auraient simplement changé de flux sans crier gare. Hop, on passe sur Feedburner (par exemple), et on ne dit rien à personne... Un autre problème est lié au spam. Un blog qui monte soudain de 500 places attire l’attention : légitime ? ou bien y a-t-il une astuce quelque part ?

Ca arrive souvent ?

Non, c’est plutôt rare. Wikio n’est pas facile à spammer (je vous expliquerai pourquoi), mais il faut tout de même regarder ce qui se passe. Car pour tout compliquer, il y a aussi les bugs, qui existent chez Wikio comme ailleurs (si vous suivez de près Technorati ou Blogsearch, vous savez que ça frappe tout le monde !). Je pense qu’à l’avenir, grâce aux nouveaux outils développés sur mes conseils, la période pourra être coupée en deux : le gros des vérifications peuvent se faire sur la base d’un classement préliminaire le 25 du mois, et il suffit de quelques jours après la fin du mois pour faire un contrôle final. D’où mon idée de publication vers le 5, peut-être même avant.

Bien, mais ce classement, comment ça marche ? Vous continuez à tourner autour du pot, Professeur, sauf votre respect...

Bon, alors allons-y. Que voulez-vous savoir ?

Eh bien, commençons par le principe général. Sur quoi se fonde ce classement au juste ? On lit beaucoup de choses ici ou là, parfois contradictoires...

Facile : le classement n’utilise qu’un seul type d’information. Le nombre de rétroliens que chaque blog reçoit (les backlinks, comme on dit en bon franglais). C’est ce qu’on appelle l’ « influence », à tort ou à raison, mais le mot est consacré.

Wikio n’utilise pas le nombre de visiteurs, de pages lues ?

Non, strictement pas. Mesurer l’audience est une chose qui a souvent été suggérée, mais ce serait extrêmement difficile. Seul le blogueur la connaît, et encore s’il dispose des outils adéquats sur sa plateforme. De façon externe, je ne vois pas de méthode fiable qui pourrait le faire. Mais de toute façon audience et influence sont deux choses différentes. Un blog peut avoir beaucoup d’audience et pas beaucoup d’influence, et vice versa. L’influence est la capacité à être repris, cité par d’autres, contribuer à la propagation des idées... ou des rumeurs, et en tout cas au buzz. La communauté scientifique ne fait pas autre chose lorsqu’elle évalue la production des chercheurs par le nombre de citations dans les publications savantes.

Mais justement, ces index de citations font l’objet de pas mal de critiques...

Oui, c’est vrai. Il peut y avoir des biais, des modes, des effets de cliques, du « spam » (même chez les chercheurs, il n’y a pas que des anges !). Mais pour l’instant on n’a pas trouvé beaucoup mieux. D’ailleurs « influence » ne veut pas dire qualité. Pas plus qu’ « audience », d’ailleurs... Pensez à TF1... Meilleure qu’Arte ? Ca se discute ! Cette confusion est d’ailleurs source de pas mal de polémiques à mon avis. Les journalistes aiment bien faire des papiers sur les 20 ou 50 « meilleurs blogs », mais aucun classement basé sur des indicateurs objectifs ne pourra jamais dire si un blog est « meilleur » qu’un autre ! C’est un jugement de qualité éminemment personnel, qui dépend des goûts de chacun, des objectifs que l’on poursuit en lisant des blogs (ou de l’absence d’objectifs), etc. L’influence ne mesure qu’une chose, le fait qu’un blog est plus ou moins cité qu'un autre. Point barre.

On pourrait imaginer compléter cette mesure avec d’autres indications ? le nombre de billets publiés, le nombre de commentaires...

Et l’âge du capitaine ? Pourquoi pas. Bien des propositions ont été faites. Vicnent nous a fait un billet magistral il y a quelque temps, où il décrivait une vingtaine de critères qui pourraient être utilisés en « blogométrie »... Mais il faut faire attention à deux choses à mon avis. Tout d’abord, il n’est pas sûr que tout soit facile à mesurer (automatiquement s’entend). J’en parlais à l’instant à propos de l’audience. Calculer le nombre de commentaires par exemple, semble être une excellente idée, mais elle est d’une complexité technique inouïe : pensez au nombre de plateformes, de « templates » etc. Et puis, à mélanger les indicateurs, on risque de tout transformer en mesure d’eau tiède. Ce n’est donc pas forcément simple. Mais ça n’empêche pas d’y réfléchir, d’échanger des idées, de faire évoluer les choses. C’est un peu l’idée des Wikio Labs. Je faisais la comparaison avec la communauté scientifique. Quels que soient les indicateurs, il faut d’abord qu’ils soient compris et acceptés (ce qui n’empêche pas qu’ils soient critiqués). C’est la même chose avec les blogs...

Bon. Rentrons dans le détail. Nous aimerions bien avoir des précisions techniques. Vous parliez du spam par exemple. Qu’est-ce qui m’empêche de faire des dizaines de billets avec des liens vers mes meilleurs potes, qui me le rendront bien parce qu’ils sont sympa ? Montée dans le classement Wikio garantie, non ?

Désolé de vous décevoir, mais non, justement ! Mais dites-moi, ce billet commence à être plus long que la moyenne (tiens la longueur des billets pourrait être un critère aussi, mais pas sûr que les plus longs soient les meilleurs !). C’est l’heure du pastis. Ca ne vous dit pas de vous en jeter un, en attendant la suite ? Et puis, dans tout strip-tease, il faut savoir faire attendre. « Sachez me convoiter, me désirer », disait Juliette...

Donc la suite demain. Quelques olives avec votre pastis ?


Lire la suite

Libellés :


29 Commentaires:

Blogger TOMHTML a écrit...

Le problème est que certains ne citent pas leurs sources ;)

La seule chose que j'apprends dans cet article est "le classement n’utilise qu’un seul type d’information. Le nombre de rétroliens que chaque blog reçoit."
Ce qui pose des problèmes de base, concernant ce sujet :
- Que penser des liens vers lesite.com dont on reprend l'info et pas vers lesite.com/news/news1234.html ?
- Les liens vers l'adresse feedburner de l'article ? Pierre Chappaz m'avait affirmé qu'ils étaient bien considérés comme de "vrais" liens vers l'article, j'espère que c'est toujours d'actualité.
- Et que penser de ceux, de plus en plus rares heureusement (quoique !), qui citent le nom du blog dans leur article sans faire de lien ? Certes, je comprends qu'il soit difficile de faire une expression régulière de la mort pour détecter tous les noms de blogs possibles dans un texte, mais peut-être serait-il intéressant d'avoir un avis là-dessus.

A demain, donc.

02 octobre, 2008 20:10  
Blogger Jean Véronis a écrit...

TomHtml> Tu as décidé de me gâcher l'apéro ? L'heure du pastis c'est sacré par ici ;-)

Mais oui, ce sont de très bonnes questions. Et c'est le genre de détail que je vais aborder demain (et si je comprends bien, après-demain et ça va peut-être même me pourrir le week-end, si vous continuez avec des questions comme ça !)

Pour l'instant, juste un commentaire sur le commentaire "Le problème est que certains ne citent pas leurs sources" : hélas... Je faisais une analogie avec la recherche scientifique : c'est pareil.

:sigh:

02 octobre, 2008 20:28  
Blogger Jean Véronis a écrit...

@Malaiac : Si tu savais...

(bien le bonjour ;-)

02 octobre, 2008 20:42  
Anonymous Christophe D. a écrit...

Pour aider un peu Jean à boire son apéro tranquille (si tant est qu'il en ai besoin !), malgré leurs nombreux défauts, l'intérêt majeur que je vois dans les liens, c'est leur rapport à l'actualité du milieu.

Si on cherchait à faire un classement « ultime » (utopique ?), basé sur la « qualité absolue » des blogs, à la limite, si il est bien fait, il n'aurait pas beaucoup de raisons de bouger d'un mois sur l'autre (sauf peut être quelques nouveaux une fois de temps en temps).
Un classement par rétroliens ne colle pas à toutes les situations de recherche et d'analyse mais dans le contexte Wikio, je trouve qu'il se justifie car c'est à mon avis cet aspect actualité du milieu qui intéresse les utilisateurs Wikio (qui ne sont pas tous classés et qui ne sont d'ailleurs même pas tous blogueurs). Ce sont les changements, les mouvements, qui sont intéressants (ou plutôt : ce que ces mouvements nous disent) mais ce n'est pas forcément de savoir qui est « meilleur » que l'autre. D'ailleurs, en ce qui me concerne, les meilleurs blogs, ceux qui me touchent le plus et qui me donnent le plus d'intérêt, ce sont ceux de mes amis ;-)

Dans d'autres contextes, comme les stratégies de communication internet par exemple, chaque agence et chaque « expert » fait sa cuisine multicritères selon ses objectifs et son champs d'activités, en sachant interpréter chaque forme de mesure et en essayant de les pondérer (tant bien que mal) de façon à tirer une vraie complémentarité entre chacune… mais cela se fait dans des contextes précis qui n'ont au final que rarement à voir avec la « qualité » ou l'actualité du milieu.

Après, le seul critère des liens n'empêche cependant pas d'imaginer tout un tas de pondérations et de fonctionnalités propres à ce critère, qui peuvent aider les utilisateurs à mieux interpréter le classement. Si c'est juste pour mesurer « simplement » du volume de liens, Technorati le fait déjà très bien et je suis sûr que Wikio peut apporter plein de chose au public, rien qu'en se basant sur les liens (les classements thématiques du classement actuel sont déjà très utiles, par exemple).

Mais tout cela n'est que mon point de vue ! ;-)

02 octobre, 2008 21:51  
Blogger Malaiac a écrit...

oh mais j'ai une petite idée de la quantité de spam qu'une folksonomie peut recevoir.. et une petite idée sur la permissivité actuelle de wikio pour les... bad boys en général

02 octobre, 2008 23:18  
Blogger Malaiac a écrit...

et bonjour quand meme et aussi... enfin bonsoir :)

02 octobre, 2008 23:19  
Anonymous philippe a écrit...

Hello tout le monde

Belle analyse et bon final ( et oui l'apéro c'est sacré :) )

Mais tout de même, il me semble qu'il faudrait ajouter une chose à cette analyse.

Tu dis que seuls les Backlinks comptent pour le classement Wikio. Je me demande s'il y a vraiment que ça, je m'explique.

A partir du moment ou un blog a acquis une certaine " influence " ( selon Wikio ) et est donc monté dans les hautes sphères du classement, il devient, vu son rang, le chef de liste de billet semblables. Ce qui veut dire en clair, que lorsque plusieurs blogs traitent d'un même sujet, en faisant référence par exemple à un blog américain, ce n'est pas spécialement le premier qui est cité en home page de Wikio, ni même celui qui a forcément le plus de Backlink.

Il s'agit bien souvent de celui qui est au plus haut dans le classement. ( je l'avais évoqué chez moi http://www.accessoweb.com/Comment-fonctionne-le-classement-Wikio-mon-point-de-vue-_a3671.html )

Et si je ne m'abuse, ces publications en tête de listes doivent quelque peu influer sur le classement du blog non ?

Mais pourquoi je dis ça, me direz vous , puisqu'on vient de nous dire que seul les backlink comptent.

Et bien, si je prend mon cas personnel, AccessOWeb est aujourd'hui 4ème au général de Wikio et ceci depuis un bon petit moment ( avec les départs de certains ). Hors, je vérifie de temps en temps les rétroliens menant vers mon blog, afin de remercier certaines personnes d'avoir fait un lien vers le billet de référence, et certains mois, je n'ai pas eu bcp de backlinks et je suis pourtant rester en tête du classement et ce, durant plusieurs mois, donc en tenant compte des 4 mois de référence pour le classement.

Bizarre ... vous avez dit bizarre ?

Enfin moi ce que j'en dis ... Je ne suis ni expert, ni dans l'algo du classement. Mais bon ... j'aimerais bien savoir :)

Allez, prochain coup je fournis les olives :)

02 octobre, 2008 23:31  
Anonymous Christophe Berge a écrit...

Grand merci pour ce premier jet d’informations sur les méthodes de classement de Wikio, nous attendons la suite avec impatience.

Une première observation. Baser le classement sur les backlinks semble en effet être le b-a-ba des classements de blogs, ce que nous trouverons chez Technorati et Wikio et qui a fait sa renommé avec le Page Rank de Google. Mais cela n’est quand même à mon gout pas suffisant. A défaut de tout baser sur d’autres critères ceux-ci pourraient simplement être pris en compte pour pondérer le classement issu des backlinks. Techniquement et pour m’être moi-même penché sur la question, il est difficile d’extraire plus d’informations sur les billets (nombre de commentaires, taille des billets), si on se base de préférence sur les contenus RSS qui ne possèdent pas ces éléments d’informations, quand ils ne sont tout simplement pas tronqués volontairement par les blogueurs. Malgré tout ne pas du tout en prendre compte serait dommage.

Quand au fait de compter les billets vus, l’audience, c’est me semble t-il un paramètre important à prendre en compte. Qu’aujourd’hui Wikio n’ai pas les moyens de proposer un traceur d’audience, comme un Xiti ou un Google Analytics, pour s’en servir dans le calcul du classement est concevable. Mais il serait dommage de laisser ca de coté tout simplement parce que c’est trop complexe à mettre en œuvre. Le fait que Wikio souhaite nous proposer un classement le plus représentatif possible de la blogosphère doit forcément passer par la mise en place des moyens nécessaires, sans devoir se cacher sous une formule du type : « on aurait bien voulu prendre cela en compte, mais comme c’est trop difficile, tant pis ».

Après tout je fais partie de ceux qui utilisaient Wikio avant que le fameux classement des blogs ne soit là et a part fournir un bon outil de buzz pour faire parler du service au début de mois dans les milieux informé (les blogueurs égocentriques) et auprès de quelque médias et agences de marketing web qui n’ont pas compris grand-chose de tout cela, Wikio peut très bien vivre sans son classement des blogs que certains pourraient trouver, peut-être même du coup à juste titre, imparfait.

J’ai aussi de plus en plus de mal avec le mot « influence ». Je crois le terme est simplement consacré par ceux qui l’ont utilisé au tout début. Les backlinks me semblent ne pas du tout être proche de la définition « psychologie » de l’influence.

03 octobre, 2008 00:41  
Anonymous narvic a écrit...

Bonjour Jean

Il est peut-être temps que je formule plus précisément les raisons de mon hostilité vis à vis du principe même du classement des blogs de Wikio. ;-)

Ces raisons ne sont pas essentiellement d'ordre technique : je ne suis pas compétent pour aborder vraiment cette question ; et elles ne concernent Wikio au premier chef que dans la mesure où c'est le classement devenu classement de référence dans l'espace des blogs francophones : ma critique porte en réalité sur tous les classements basés sur la comptabilisation des retroliens avec pondération accordant une valeur supérieure aux liens issus des blogs les plus liés.

La critique vaut donc également pour le principe de PageRank lui-même, et elle est de nature philosophique, voire politique.

Ce fonctionnement est aristocratique par nature et nullement démocratique (je crois que c'est un point désormais admis parmi les spécialistes, non ?).

Il accroît la visibilité de ceux qui sont déjà les plus visibles et tend à renforcer une hiérarchisation déjà installée.

Il accorde aux blogs de haut de classement une forme de pouvoir de cooptation sur les blogs de bas de classement.

A sa nature aristocratique et cooptatrice s'ajoute ainsi une dimension conservatrice.

L'image qu'un tel classement renvoie de la blogosphère n'est ainsi, selon moi, pas du tout conforme à son fonctionnement réel - c'est une image faussée. De surcroît, un tel classement perverti son fonctionnement et la dénature. Il lui est donc toxique.

C'est malsain d'introduire de telles règles dans un espace social vivant. Ça fait moins de mal avec PageRank car il porte sur des pages, parmi des milliards de pages, et que nombre d'entre elles sont "impersonnelles" car issues d'oeuvres collectives ou d'auteurs décédés. ;-) L'impact "personnel" de ce système aristocratique conservateur sur les individus est donc dilué (même s'il persiste).

Avec le classement de blogs ce système porte sur l'ensemble de la production d'un individu désigné, donc très directement sur lui-même. C'est là que ça devient socialement malsain (et philosophiquement autant que politiquement contestable).

La blogosphère est, à mes yeux, dans son fonctionnement d'avant les classements automatisés de ce type, basée sur un pur système de recommandation inter-individuel. C'est un système d'élection par les pairs et pas du tout une aristocratie. L'élu n'en reste pas moins pair et son élection est révocable à tout moment.

Il n'est donc pas légitime pour moi d'accorder une pondération favorable proportionnelle à la hauteur dans le classement. Toutes les voix se valent.

Je ne suis pas à ce point naïf en politique pour ne pas reconnaître que ce n'est pas aussi simple. Dans le cadre des élections démocratiques, toutes les voix se valent en droit, si elles ne valent pas en fait. Ou plus justement, le vote étant secret, c'est l'intention de vote affichée de certains votants disposant d'un pouvoir de recommandation particulier qui peut peser plus lourd que l'intention de vote exprimée par un inconnu.

C'est bien pour tenter de limiter l'impact de cet effet pervers que le vote est secret et que l'on impose l'isoloir. Et surtout chacun ne dispose... que d'une voix !

Un classement qui attribue d'autant plus de voix qu'on est haut placé dans le classement est purement destructeur pour cette logique de pair à pair.

Tant qu'on ne me proposera pas un classement qui respecte cette logique et reste conforme à un fonctionnement sain de la blogosphère je lui resterai donc hostile (et je m'en tiendrai à l'extérieur, invitant chacun à faire de même ;-) ).

Cordialement.

03 octobre, 2008 03:04  
Anonymous narvic a écrit...

Une précision, pour être un peu constructif tout de même ;-)

Si je ne m'abuse, le classement Wikio exclut la prise en compte des blogrolls. C'est, à mon sens, en faisant tout de le contraire qu'on contribuerait à améliorer les choses : compter les liens dans les blogrolls et ne compter que ceux-là (sans aucune pondération).

Un classement de ce type aurait le mérite de ne comptabiliser que des votes réellement validés par le votant (en ne comptant pour positifs les liens associés à un jugement négatif sur le contenu lié), et surtout d'exprimer une addition de réelles recommandations. Tout en laissant à chacun le droit de s'abstenir de voter.

Un tel classement serait, selon moi, respectueux de la blogosphère. Le classement à la Wikio ne l'est pas.

03 octobre, 2008 03:15  
Blogger Jean-Marie Le Ray a écrit...

effets de cliques ou effets de clics ;-)

Jean-Marie

03 octobre, 2008 03:50  
Blogger Jean Véronis a écrit...

Christophe D.> Je suis bien d'accord : ce sont les mouvements qui sont intéressants... Mais comme on en discutait sur d'autres billets, il faut trouver un compromis entre une certaine stabilité sur une période raisonnable (quelques mois) et la mesure de l'instantanéité. Pas facile dans un classement unique. Ton idée de "curseur" (dans de précédents commentaires) est excellente (je n'ai pas encore eu le temps de répondre, mille excuses), comme l'idée d'ajouter des pondérations, et options de classement diverses. Mais j'ai le sentiment que ça ne sera compris et utilisé que par des "power users" (veilleurs, journalistes, etc.). Il faut sans doute deux niveaux : un classement "grand public" simple à comprendre et un ensemble de fonctionnalités avancées pour experts. J'essaierai de proposer des choses comme ça dans les mois qui viennent, si le temps le permet...

03 octobre, 2008 08:43  
Blogger Jean Véronis a écrit...

Malaic> Evidemment les "spammeurs" qui essaient d'infiltrer Wikio ne sont pas nécessairement des marchands de viagra. Pour eux ce n'est pas rentable. Mais il y en a d'autres : des groupes politiques d'une couleur qui tire sur le brun sombre par exemple... Comme ils n'ont quasiment aucun trafic naturel, tout apport leur est probablement "bénéfique".

03 octobre, 2008 08:47  
Blogger Jean Véronis a écrit...

Philippe> Il y a beaucoup de choses dans ton commentaire, et dans le billet que tu cites... Je pense que bien des points s'éclairciront dans la suite de mon explication, mais d'ores et déjà, un élément de réponse : il me semble important de distinguer le classement de l'usage qui en est fait (qui, comme tu le dis très justement, peut influer à nouveau sur le classement en retour).

A un instant t, AccessOWeb par exemple, est 4e du classement général (scoop: tu gardes exactement cette place ce mois-ci, sauf si Mlle Agnès trouve un énorme bug d'ici ce soir ;-). Si c'est le cas c'est parce que tu es un des blogs les plus cités. C'est tout.

Mais il est évident que cette place dans le classement te donne une certaine visibilité. Par exemple sur la page du classement Blogs, et aussi dans les pages de résultats sur Wikio. Les blogs du top sortent plus volontiers en haut de page (principe identique à celui de Google). Donc les gens auront peut-être plus tendance à te lire et à te linker. Du coup, tu auras tendance à rester en haut du classement. On peut voir ça comme une injustice (cf. Narvic ci-dessous), ou bien comme un facteur de pertinence et de stabilité... Au choix.

Quant aux discussions (c'est à dire les groupes que détecte Wikio à la façon de Techmeme), elles obéissent à un principe simple : le billet qui est linké par les autres prend la tête de la discussion. Le classement n'influe pas. Cela contrebalance quelque peu l'effet précédent. Dans toute démocratie (à supposer que la blogosphère en soit une !), il faut à la fois des facteurs de stabilité et des facteurs de changement, qui permettent par exemple à de "petits candidats" de s'exprimer, et qui sait, un jour, d'être élus...

Le système n'est peut-être pas idéal (on est là pour en parler), mais au moins il est clair, et globalement il fonctionne. Comme disait Churchill à propos de la démocratie, c'est peut-être le pire des sytèmes.. à l'exclusion de tous les autres.

03 octobre, 2008 09:05  
Blogger Jean Véronis a écrit...

Christophe Berge> Oui, tu as complètement raison ! Ce n'est pas parce que c'est difficile qu'il faut jeter le bébé avec l'eau du bain. Mais il faut expérimenter, il y a du développement, etc. Donc, on est nécessairement dans un processus à double détente : amélioration minimale du classement actuel, et en parallèle recherche de solutions meilleurs ou en tout cas alternatives. C'est l'idée derrière Wikio Labs.

Et bien d'accord sur le mot "influence". Il ne me plaît pas non plus...

03 octobre, 2008 09:22  
Anonymous Cratyle a écrit...

Salut Jean - un grand bravo d'abord pour le travail que tu mènes en ce moment avec les blogueurs et wikio!

La blogosphère francophone a certainement besoin d'un outil tel que Wikio, or le fossé entre l'outil et sa communauté naturelle était en train de prendre des proportions inquiétantes. Il était temps de renouer les liens, d'ouvrir l'outil à ceux qui l'alimentent et l'utilisent en priorité - probablement pas facile au jour le jour, mais certainement utile à tous.

A propos de ton sujet du jour, je crois le mot "influence" extrêmement mal choisi : il crée des ambiguïtés nuisibles à la fois aux blogueurs et à wikio.

L'influence est par nature multiforme, et les nombreux critères que tu cites permettent tous d'en mesurer les degrés. Le nombre de backlinks ne mesure donc qu'une variété très restreinte et très particulière d'influence, et même dans un cadre circonscrit, n'est pas forcément la meilleure mesure envisageable (on pourrait préférer par exemple la mesure des reprises directes ET indirectes d'un article).

Dés lors que le terme d'influence soit un "terme consacré" ne devrait pas pousser wikio à l'utiliser, mais plutôt, compte tenu de la différence entre le sens réel du critère employé (très restreint) et le sens que l'on donne au mot influence (très large)... à l'éviter comme la peste.

Comme le classement wikio mesure une dimension spécifique, il lui faut un nom spécifique. Chacun comprendra que ce nom sera lié à l'influence - ce qui sera vrai- et chacun comprendra aussi que ce ne sera pas exactement l'influence -ce qui sera tout aussi vrai-.

Concrètement, cela évitera que wikio ne soit trop tenté par les formules commerciales faciles telles que -"les 3 blogs français les plus influents d'Europe" ou "le Xème blog le plus influent"- ces formules sont certes utiles auprès des journalistes, mais elles laissent le bloggueur perplexe à juste titre: il peut soupçonner wikio d'incompréhension, de mépris, de prétention,... Toutes choses qui ne seraient pas totalement injustifiées.

Pour conclure ce -peut-être trop- long commentaire, je voudrais proposer une image: supposons que le Festival de Cannes ne décerne pas des "Palmes d'Or" mais des "Prix du meilleur", et du "2ème meilleur " et du "Xème meilleur ", et quelle ne l'attribue pas seulement pour les films sélectionnés mais pour l'ensemble des auteurs, et cela indépendamment de leur volonté... Comment réagirait la communauté?

Après tout le terme de "palme d'or" est peut-être plus profond qu'il n'y parait...

03 octobre, 2008 11:42  
Anonymous Comme une image a écrit...

Le problème des blogrolls, c'est que certaines sont générées automatiquement sur les plateformes de blog pour mettre en avant du contenu récent.
Le problème du décompte des commentaires, c'est que certains blogueurs répondent à chaque interlocuteur dans un commentaire différent, d'autres regroupent. Le nombre n'est pas un indicateur précis. Le volume alors ? Le nombre de commentateurs différents ? (Je pense que le volume est un aspect intéressant : nombre d'articles, et leur densité...)

On voit bien que toute méthode de calcul a ses travers, c'est intéressant de voir « une tendance ». Mais je suis bien content de voir que Wikio rafraîchit un peu ses algorithmes parce que ça m'agaçait de voir mon ancien blog mort depuis des mois toujours mieux classé que le nouveau !!

03 octobre, 2008 11:56  
Anonymous Cratyle a écrit...

Narvic - Viens de lire ton commentaire auquel je souscris largement. L'idée de classement "absolu" tend toujours vers une forme de re-hiérarchisation du Web et s'oppose de ce fait à sa dynamique profonde. En revanche, lorsque le classement n'a pas de prétention "absolutiste" mais souhaite simplement exprimer un point de vue sur le Web, il devient une voix démocratique aussi légitime et utile que les autres voix qui s'y expriment.

C'est je crois la voie que devrait suivre wikio - celle que je développais un peu dans mon commentaire précédent-: ne pas prétendre établir "Le Classement", c'est à dire prétendre mesurer "L'Influence" mais donner "le classement wikio" tout court. C'est à dire le jugement subjectif de wikio sur l'activité des blogs.

Il ne s'agirait pas là d'un simple glissement sémantique mais plutôt d'un changement de rôle et de vision : ne pas être celui qui juge au dessus des autres mais celui qui apporte sa connaissance spécifique sur une dimension du Web.

Wikio ne ferait alors rien d'autre que ce donner pour ce qu'il est -sa "toxicité potentielle" comme son "influence" demeurant somme toute très modestes à ce stade- et ferait je crois tomber les arguments que tu lui opposes légitimement.

03 octobre, 2008 12:51  
Anonymous Christophe D. a écrit...

À Jean : pas de problème pour les non réponses, je me doutais bien que tu étais en plein boulot et puis il s'agissait plus d'idée jetées à la va vite, qui ne demandaient pas forcément de réponse.
En ce qui me concerne, même si la période de prise en compte augmente dans le nouvel algo, je trouve que le fait qu'il soit donné plus de valeur aux billets les plus récents va dans le bon sens.

Concernant les remarques de Cratyle sur le mot « influence », je pense que cela peut se résoudre facilement par un changement d'intitulé (comme cela s'est fait sur le « top 30 des billets les plus cités » publié mensuellement sur le blog Wikio). Au lieu d'intituler le classement Wikio « Classement des blogs », avec en baseline « Retrouvez ici tous les mois le classement des blogs les plus influents de la blogosphère. » on pourrait simplement modifier par « Classement des blogs les plus cités » (l'idéal serait « les plus liés » mais ce n'est pas forcément très parlant pour le grand public). Une modification possible à moindre frais et qui positionne d'emblée Wikio sur son parti pris ;-)

03 octobre, 2008 13:44  
Blogger Jean Véronis a écrit...

Narvic> Bonjour Narvic !

Comme souvent les commentaires sont plus intéressants que le billet ! Mais ce n'est pas comme ça que je vais pouvoir écrire la suite...

Je comprends ton argument. La discussion est importante, et elle mérite mieux que d'être enfouie en commentaires. Je réponds brièvement, et peut-être pourrons-nous développer sous forme de posts plus élaborés.

Tu dis toi même que ce n'est pas forcément simple. Ca ne l'est pas, en effet (mais la démocratie non plus...). Il y a sans doute deux types de problèmes : 1) de nature technique 2) de nature plus structurelle.

Sur le plan strictement technique, "l'égalité des voix" sur le Web donne un désastre. J'ai déjà évoqué les spammeurs... Ce n'est pas une mince affaire. Il y a eu des estimations (déjà anciennes) qui laissaient penser que cela concernait environ 20% des blogs. Le chiffre a sans doute augmenté. Comment faire une démocratie avec près d'un quart de "citoyens" qui ne jouent pas le jeu ? Il y a aussi les dizaines de milliers de blogs qui ont un intérêt local (cercle d'amis, etc. -- je pense aux ados sur Skyblog par exemple). Comment trier ? Et puis il y a tout simplement les égoblogueurs, nombreux, qui se font quelques petits liens amicaux, histoire de voir leur nom quelque part en haut d'une liste... Il faut donc réguler, sinon le Web devient illisible (car pour moi le principal intérêt d'un classement est le tri des billets par "pertinence" pour l'internaute).

Le système "PageRank" qui donne des voix à poids variable aux différentes sources permet de se prémunir assez bien contre ces inconvénients. C'est pour cela que Google n'en n'a jamais fondamentalement changé en 10 ans. Mauvaise raison, sans doute, car purement technique, mais pour l'instant je ne vois pas bien de substitut...

Autre type d'argument, plus structurel celui-là. La démocratie demande des processus parfois complexes. La démocratie directe totale fonctionne rarement. A dire vrai je n'en connais pas un seul exemple. Il y a toujours des niveaux, des représentants, des grands électeurs, un système ou un autre qui apporte des régulations. Je le regrette, personnellement, et je souhaiterais parfois vivre dans un futur lointain où l'Humanité s'est assagie... Mais bon, il faut faire avec l'existant.

Or, il me semble que c'est aller un peu vite en besogne que de qualifier les systèmes de type PageRank d'aristocratiques. C'est peut-être oublier que ceux qui sont au "top" et dont les voix comptent donc plus, ont été... élus. S'ils sont actuellement dans les sommets du classement, c'est parce que beaucoup de blogueurs ont "voté" pour eux, en leur mettant des liens (et qu'ils continuent à le faire).

Donc ces "top blogueurs" sont en quelque sorte les "grand électeurs" du système. Ils sont peut-être plus ou moins difficiles à déboulonner selon les formules employées pour le PageRank et, d'accord, ils pourraient se transformer en oligarques, mais ce ne sont pas des aristocrates car leur "caste" 1) n'est pas close 2) n'est nullement acquise par des propriétés externes (l'équivalent blogosphérique de la naissance, de l'hérédité ou autre).

Donc je ne suis pas aussi pessimiste que toi. Tu verras d'ailleurs que dans le prochain classement il y a beaucoup d'entrants dans le top 100 -- mais je ne suis pas là pour faire de la pub ou de la communication "corporate". Comme je l'ai dit, ce qui me passionne c'est l'aventure intellectuelle : comment fournir aux générations futures des outils et des clés pour naviguer dans l'océan d'information que notre planète est en train de devenir... Et il ne faut pas laisser ces clés à quelques monstres américano-centrés comme Google, à mon sens.

Débat extrêmement intéressant, donc. Merci à toi pour ton long commentaire : je suis sûr que nous aurons l'occasion de développer plus en détail !

03 octobre, 2008 19:24  
Blogger Jean Véronis a écrit...

Narvic (again)> Les blogrolls... Tu as raison, Wikio ne les prend pas en compte. Là aussi raison technique : c'est difficile, voire dans la pratique impossible à grande échelle. Wikio utilise les flux RSS dans lesquels les blogolistes ne figurent pas. Il y a bien eu quelques tentative de crawl des pages, ça pose plus de problèmes que ça n'en résoud. Identifier les blogolistes de façon fiable me paraît à l'heure actuelle un challenge insurmontable vu le nombre de plateformes, de templates, de cas idiosyncrasiques. D'ailleurs personne ne le fait. Technorati prend tout de façon indiférenciée. Ce n'est pas pour rien...

On pourrait rêver d'un format Web 3.0 où tous les éléments d'une page de blog sont correctement identifiés en XML (post, commentaires, blogoliste etc.), mais on en est loin (bizarrement d'ailleurs : pourquoi pas plus de recherches de ce côté-là ???)

Et puis il y a une discussion plus profonde, là aussi : les blogolistes reflètent les relations "stables" à long terme entre blogs (à supposer qu'elles soient à jour, ce qui ne me paraît pas si fréquent...). Mais tu auras remarqué que Christophe D. a exactement l'argument inverse : il attend des outils de lecture qui fasse émerger l'instantanéité. Comment faire ? Il faut sans doute plusieurs types d'indicateurs et de critères...

En pensant à tout ça, je me dis qu'on est un peu dans la préhistoire du Web. On essaie de gratter des silex pour faire du feu !

03 octobre, 2008 19:33  
Anonymous Acouphene a écrit...

"En pensant à tout ça, je me dis qu'on est un peu dans la préhistoire du Web. On essaie de gratter des silex pour faire du feu !" :
oh que oui... Et on en rira dans quelques années :D

03 octobre, 2008 20:10  
Anonymous le chafouin a écrit...

Juste un mot pour Narvic : prendre en compte les blogroll serait pire que tout car elles ne représentent que rarement une "recommandation" mais bien plus souvent un "échange de bons procédés"...

Sinon, eh bien je voudrais dire à l'auteur de cet excellent blog que le problème du classement wikio c'est l'effet meute : quoi qu'on en dise, quand on avance en groupe, avec deux trois annexes chacun, en se citant mutuellement très souvent(même sans parler de trucage) eh bien on avance beaucoup plus vite. Le classement du mois d'octobre le montre de façon amplifiée : c'est mathématique.

Que peut nous dire Jean Véronis là dessus? Après tout, cette idée n'est peut-être qu'un préjugé... mais je crois qu'en ce qui concerne le classement des blogs politiques c'était une des principales critiques.

04 octobre, 2008 17:55  
Blogger Jean Véronis a écrit...

Le Chafouin> Je suis du même avis sur les blogrolls. Elles sont difficiles à utiliser pour toutes sortes de raison. Il y a les échanges de liens, ou simplement le fait que le blogueur fait une liste quand il crée sont blog et puis oublie complètement de la mettre à jour... Et techniquement, on ne sait pas les récupérer de façon fiable. Donc, ce n'est pas la panacée.

Sur les effets de clique : évidemment, c'est un gros problème. J'explique dans le billet suivant qu'il y a quelques filtrages (par exemple quel que soit le nombre de liens envoyés de A vers B, on n'en compte qu'un par mois)... J'ai quelques autres idées en réserve pour limiter les effet de clique, voire de "meute" (jolie image), mais il est certain que c'est difficile !

04 octobre, 2008 18:06  
Blogger Jean Véronis a écrit...

Cratyle> Merci de tes encouragements !

Bien d'accord, ce terme d' "influence" n'est pas bon. RTGI a inventé le terme "linfkuence", mais c'est ®...

Parlons simplement de Classement Wikio !

04 octobre, 2008 20:56  
Blogger LOmiG a écrit...

salut
intéressante discussion...!
Pour revenir juste sur deux arguments lus ici :
1) vouloir calquer le classement des blogs sur la manière qu'ont les scientifiques d'évaluer l'influence est dangereux : les blogs ne produisent pas des connaissances, et la propagation de l'information ne peut y être totalement comparable
2) dire que le nombre d'abonnés (l'audience) n'a pas être prise en compte se défend, bien sûr. Mais, on peut retourner l'argument : que serait un classement des chaines française où TF1 n'apparaitrait pas , ou tout en queue de classement ?

à bientôt

05 octobre, 2008 10:07  
OpenID anham a écrit...

Jean, je vous remercie de partager ainsi les secrets de fabrique du classement wikio - sujet dont j'ai déjà eu souvent l'occasion de discuter avec Guilhem (rtgi).

Je souhaitais apporter une modeste contribution au débat, lancé dans les commentaires par Narvic, sur le caractère anti-démocratique de la surpondération des liens provenant de sites considérés comme influents dans le classement d'ensemble des sites.

Tout d'abord, mais ce propos mérite d'être développé plus amplement en d'autres lieux, il faut prendre garde à ne pas réduire la démocratie, de manière synchronique, au système démocratique moderne tel que nous le pratiquons dans les pays occidentaux depuis moins de deux siècles. La démocratie, ou pouvoir du peuple, a été exercée selon des modalités qui n'ont pas toujours reposées sur le principe "un homme, une voix". On conviendra certes que ces systèmes étaient moins parfaits eu égard à leur achèvement démocratique, il n'en reste pas moins qu'ils s'appelaient déjà démocraties. Il y a fort à parier que nos démocraties, reposant sur ce principe égalitaire et, en grande partie, sur le suffrage universel direct, connaitront de profonds bouleversements de structure dans les 50 ans à venir, à la faveur des évolutions technologiques et des nouveaux usages qui les accompagnent.

Quoi qu'il en soit, pour revenir à l'objet de cet intéressant débat, le classement Wikio n'est pas tant un mode d'exercice, ou de partage, du pouvoir qu'un mode de repérage (je dirais bien révélation, mais le terme est trop ésotériquement connoté) des personnes qui occupent une place particulière au sein d'un écosystème d'influence. Pour raisonner par analogie, ne trouve-t-on pas adéquat de donner plus de poids à 10 prix Nobel d'économie dans la désignation des 10 meilleurs essais ou mémoire sur la crise financière actuelle qu'à 10 étudiants en Licence d'économie ? Il ne s'agit pas de dire que ces derniers n'ont pas voix au chapitre, bien au contraire. Toutefois, l'autorité intellectuelle ou sociale acquise de manière légitime, dans un cercle donné, peut tout à fait conférer une position de "primus inter pares" qui n'est pas sans effets sur l'organisation dudit cercle.

Il en va de même au sein des différentes catégories (je parle souvent de communautés) du classement Wikio. Narvic, si vous deviez citer à plusieurs reprises certains de mes articles sur les médias [hypothèse d'école], il serait pertinent de considérer que vos citations donnent plus de poids à ma production que les citations d'une personne dont l'autorité en la matière est moins établie. Bien évidemment, si vous décidiez de m'ignorer et que des dizaines d'autres blogueurs citaient mes articles, cela me permettrait de grimper dans le classement.

On n'est moins ici dans un système démocratique moderne que dans différents réseaux sociaux (au sens de groupes sociaux) où certains sont plus en vue, plus au centre, que d'autres, ce qui leur donne plus de poids - mais pas tout le poids - dans le système de distribution de la visibilité ou de l'influence.

06 octobre, 2008 09:31  
Anonymous Nicolas Voisin a écrit...

(impossible de lire tous les commentaires - désolé si redondant)

> Penses-tu intégrer un jour d'autres composantes de cette "influence" que vous essayez de mesurer ? je pense à FB, à twitter, à friendfeed, à delicious, et à ces milles espaces numériques aussi essentiels ou futiles les uns que les autres, suivant le point de vue, mais fondamentaux pour quantifier (si c'est possible) ce que wikio essaie de mesurer..

nop ?
j'ai dit une bêtise prof ? :-)

03 décembre, 2008 17:26  
Blogger br1o a écrit...

Bonjour, tu dis qu'il est très difficile de comptabiliser les commentaires, alors qu'il "suffirait" d'aller chercher les flux RSS associés aux commentaires comme pour les billets, ainsi plus besoin de prendre en compte les templates, mais juste les plate-formes ;)

02 octobre, 2009 09:48  

Enregistrer un commentaire