Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

vendredi, mars 05, 2010

Twitter: Blogs et retweets, projet Twittio

Ca a filtré en réponse à un commentaire de See Mee sur mon dernier billet : oui, je suis en train de travailler à l'intégration de Twitter dans Wikio (je vous invite par ailleurs à aller lire l'interview qu'elle a eu la gentillesse de me demander récemment). Je vous ai promis la transparence la plus totale sur les activités du Wikio Labs, donc voici quelques détails sur ce projet dont le nom de code interne est Twittio ( = Twitter + Wikio). Et comme toujours, je suis à l'écoute attentive de vos réactions !


Cela fait plusieurs semaines que j'étudie l'écosystème que forment Twitter et les blogs. C'est devenu une évidence, les backlinks fondent comme neige au soleil... Comme je le dis à See Mee dans l'interview mentionnée plus haut, il faut reconnaître que les backlinks sont un mécanisme fastidieux. Il faut copier-coller une URL dans une interface plus ou moins ergonomique : il faut probablement jongler entre deux fenêtres, on se trompe facilement (qui n'a jamais fait un mauvais lien par inadvertance ?), c'est lent... et surtout il faut déjà soi-même avoir écrit un billet ! Twitter a apporté à cette lourdeur une réponse nouvelle (et inattendue je pense, comme beaucoup d'innovations, ce qui devrait nous rendre modestes...). Un clic et je "retweete" ce que j'ai lu. C'est simple, c'est rapide, c'est instantané. C'est du "temps réel". L'expression est devenue le nouveau buzzword à la mode, mais c'est vrai (vous avez remarqué qu'on ne parle plus de Web 3.0 ?). Si on me demandait (en fait on me l'a demandé récemment), quelle est la différence entre le Web 2.0 et le Web "temps réel", je dirais que l'aspect le plus flagrant c'est justement le passage d'un système de recommandation basé sur les backlinks à un système de recommandation basé sur les réseaux sociaux. Ce qui n'est pas sans poser de problème aux moteurs de recherche, dont toute la logique (le fameux Page Rank en particulier) depuis qu'ils existent est basée sur la topologie des "liens en dur". Ce n'est pas pour rien si Google et Microsoft ont passé des accords avec Twitter...

J'ai deux objectifs avec le projet Twittio. Je me doute que beaucoup d'entre vous ont le fameux classement en tête, et se demandent s'il va falloir qu'ils retweetent maintenant comme des bêtes après avoir linké comme des forcenés. Oui, l'intégration des retweets dans le calcul du classement est bien sûr une des pistes que je poursuis. Elle n'est pas simple. L'univers du retweetage est certainement aussi rempli de chausse-trapes que celui des backlinks... La première étape est donc l'observation de l'écosystème : mettre en place des outils, extraire des statistiques, comprendre les usages et la topologie du réseau. Voilà ce que je suis en train de faire.

Mais il y a une deuxième cible, plus importante pour moi dans un premier temps. Remplacer le service Blogs qui apparaît en home de Wikio et sur la page dédiée par un système plus performant. Le système actuel date de bien avant ma collaboration avec Wikio. En 2006-2007, il était raisonnable de baser un "memetracker" de ce type sur les seuls rétroliens entre billets. Etant donné l'évolution des usages, ce n'est plus possible en 2010. Ce service devrait être une fenêtre de l'actualité à travers les blogs. Twitter est certainement un élément important pour sa mise au point.

Encore faut-il comprendre comme Twitter est utilisé. Comme c'était le cas il y a quelques années pour les backlinks, le "retweetage" est très fortement "geek". On sait que pour les backlinks, les comportements ont changé. Les blogs techno s'en sont détournés (au profit de twitter en particulier), tandis que les blogs de loisirs se les sont appropriés au point de faire pâlir de honte les meilleurs experts SEO (vous vous souvenez de la "révolution des tricoteuses").

Je vous livre quelques résultats qui permettent de comprendre un peu mieux l'usage de Twitter dans les différentes communautés (du moins en France - il est probable comme j'y faisais allusion hier que les usages différent selon les pays, en particulier par rapport aux Etats-Unis.

J'ai suivi le taux de retweets de tous les billets du top 10000 FR depuis trois semaines. Cela fait une base de 107718 billets et 72334 retweets, soit un taux moyen de 0,67 RT par billet.

Mais cette moyenne cache de très grandes disparités entre communautés, comme le fait apparaître le tableau suivant (la première colonne correspond à la catégorie du classement Wikio, la deuxième au nombre moyen de retweets par billet dans cette catégorie) :



Categoriem
SEO9,83
Marketing4,25
High-Tech3,85
Science3,74
Logiciels Libres3,59
Emploi2,27
Entrepreneurs1,72
Environnement1,39
Jeux Vidéo1,37
Musique1,28
Cinéma1,15
BD1,06
Politique0,86
Auto0,85
Droit0,48
Economie0,45
Sport0,38
Divers0,36
Jeux d’argent0,25
Loisirs0,23
Chine0,21
Gastronomie0,16
Santé0,16
Littérature0,14
Animaux0,05
Scrapbooking0,01


On constate la très grande disproportion, d'un facteur 1000 entre les champions du RT (les blogs SEO) et les blogs scrapbooking qui figurent au bas de la liste. Les blogs politiques se situent à peine un peu au-dessus de la moyenne.

Il est intéressant de constater que les blogs SEO et Marketing ont été les premiers à comprendre l'intérêt du retweetage, qu'ils pratiquent encore plus que les blogs techno.

La conclusion à laquelle m'amènent ces résultats, c'est que bien entendu, on ne peut intégrer Twitter directement, ni dans le classement (où les blogs SEO, marketing et High-tech viendraient truster toutes les premières places), ni dans le nouveau service Blogs, dont la page d'accueil serait phacogytée de la même manière.

Vous imaginez donc la difficulté de la tâche. Mais vous doutez aussi sans doute que j'ai quelques pistes ;-)

Libellés : , ,


16 Commentaires:

Blogger gill d'elia a écrit...

merci pour ces précieuses informations, dommage que tu ne nous donnes pas tes "quelques pistes" :).
à suivre de près donc.

05 mars, 2010 14:25  
Blogger Jean Véronis a écrit...

Ca viendra mais pas tout de suite, pas trop vite...

Sachez me convoiter, me désirer -eh -eh ;-)

05 mars, 2010 14:29  
Blogger A.N. O'Nyme a écrit...

Une question un peu naïve, quel est l'intérêt de se baser sur une moyenne pour discuter des "taux de RT par article" ? Si on regarde votre tableau de données, il me semble évident que la distribution n'est pas du tout gaussienne (ou vaguement telle), mais plutôt log-normale ou en loi de puissance. Dans ce cas, il me semble qu'une moyenne n'a aucun sens... ou en tout cas, qu'elle ne donne aucune information intéressante sur la population étudiée.

05 mars, 2010 15:09  
Anonymous [Enikao] a écrit...

Pas facile de mesurer et pondérer l'infosphère... Surtout qu'il faudrait y inclure aussi, pour bien faire, les statuts Facebook, en dédoublonnant les comptes qui ont jumelé Facebook et Twitter...

05 mars, 2010 15:11  
Blogger Jean Véronis a écrit...

La moyenne st quand même l'indicateur de tendance centrale le plus commun. J'en fais moi-même la critique dans mes cours sur les données fortement asymétriques, lui préférant souvent la médiane. Mais de là à dire que cela n'a aucun sens c'est un peu rapide...

05 mars, 2010 15:13  
Blogger Jean Véronis a écrit...

Enikao> Quand je parle de chausse-trapes... C'est bien pour ça qu'il faut étudier, prendre son temps, et faire les choses proprement (ou aussi proprement que possible !).

05 mars, 2010 15:14  
Anonymous skagangamanikoye a écrit...

surtout qu'il vous faudra peut-être intégrer dans vos comptages Google Buzz dans quelques mois... :-)

05 mars, 2010 15:38  
Blogger Jean Véronis a écrit...

Ce n'est pas impossible ! Mais pas certain non plus. L'accueil initial a été un peu mitigé et ce n'est pas la première fois où Google ferait marche arrière sur un projet (exemple, le SearchWiki qui devait être la panacée du search et qu'ils viennent de saquer). Nous verrons bien !

La leçon qu'on peut tirer des RT c'est que ce qui émerge, finalement, c'est ce que personne n'a prévu...

05 mars, 2010 15:49  
Anonymous seoman a écrit...

En fait les SEO ne se sont pas appropriés le RT mais c'est la nature même du thème qui fait que tout le monde s'y intéresse et retweet les analyses ou autres news du monde SEO au même titre que le marketing (web) alors que le tricot reste confiné aux seul(e)s personnes intéressées par ce domaine.


@+

05 mars, 2010 16:42  
Blogger Jean Véronis a écrit...

Seoman> Il y a sans doute un peu de vrai. En même temps, le SEO n'intéresse probablement pas les tricoteuses (qui sont pourtant nombreuses)...

05 mars, 2010 18:32  
Anonymous Asse42 a écrit...

Franchement ça m'intéresse personnellement puisque je pense que le seul système du comptage des liens entraîne un comportement spécifique des blogueurs qui n'est pas forcément sain.
Si tu ne te fais pas une place dans le microcosme on t'ignore, on ne te linke pas et donc tu croupis dans les profondeurs de Wikio. C'est mon cas. Cela ne m'empêche pas de faire tourner mon blog mais je suis persuadé que cela ne reflète pas la vérité du classement notamment en politique.

Il ne faut pas hésiter à intégrer d'autres nouveautés plus réalistes sur l'intérêt porté à un blog que le seul linkage.
Donc peut-être que twittos apportera une vraie révolution mais devra pour cela bousculer l'ordre établi. En aura-t-il le courage? C'est aussi la question...

06 mars, 2010 10:07  
Anonymous Annie a écrit...

les backlinks sont une aberration pour plusieurs raisons :
1- cela suppose que tous les amateurs/lecteurs/apréciateurs des blogs ont des blogs et lient leurs préférés sur leur blog : c'est une abération, tous les lecteurs de blogs n'ont pas de blog eux-mêmes, et quand ils en ont ils ne disposent pas forcément de temps pour lier tous les bons moment qu'ils ont passé à lire des blogs, parce qu'ils parlent d'autres choses, et parce qu'ils n'ont que qq hres par jour
2- gg l'a résolu depuis longtemps en tenant compte de ses propres liens dans ses recherches par mots clés et/ou images, ou sur les autres moteurs c'est une bonne chose, c'est la meilleure
3- wikio je reste inscrite mais n'en tient aucun compte car il est comme tous les référenceurs français : à la masse, il ne prend en compte que l'instant, pas la capitalisation d'information sur un blog, avec souvent des infos non obsolètes sur une longue période qui redeviennent ou reste chaud
4- ça donne pour mon blog une montée en flèche (vers le haut) de ma fréquentation et une descente en flèche dans ma réf wikio

06 mars, 2010 15:54  
Anonymous DF a écrit...

Exercice complexe, je vois! De mon côté, faudra-t-il que je m'inscrive sur Twitter, alors que je n'ai pas encore compris l'utilité de cette machine à gazouiller?... En tout cas, merci d'annoncer ces tendances.

06 mars, 2010 19:45  
Anonymous Quitwitte.fr a écrit...

Etude très intéressante. Hâte de voir la suite et de voir se construire votre projet.

L'équipe Quitwitte.fr

07 mars, 2010 23:39  
Anonymous Ferocias a écrit...

Vu le taux de RT dans la catégorie Littérature et ma pratique régulière de Twitter, je vais être le maître du monde niark niark niark!

Comment valider la pertinence des RT?
Il suffit d'écrire un tweet annonçant la disparition d'un people (que ce soit rai ou pas d'ailleurs) ou bien d'annoncer une nouvelle révolution dans le domaine du référencement tout en pointant vers un billet de scrapbooking pour être RTwitté (certains retweeters ne lisent pas les billets).

09 mars, 2010 08:55  
Blogger Jean Véronis a écrit...

Férocias> Effectivmeent, évaluer la pertinence des tweets est impossible (d'ailleurs, peut-être pas seulement pour les algos !). Mais c'est déjà unpeu vrai pour les backlinks...

Le raisonnement ne peut donc qu'être statistique. Si beaucoup de gens retwittent une information au même moment, c'est que d'une manière ou d'une autre elle se dégage du bruit ambiant.

09 mars, 2010 09:12  

Enregistrer un commentaire