Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

jeudi, septembre 02, 2010

Wikio: La sagesse des fou(le)s

Si vous lisez régulièrement ces modestes pages, vous avez sans doute constaté que je cherche depuis plusieurs années de nouveaux modes de visualisation et de structuration de l'actualité. Vous m'avez sans doute vu expérimenter plus ou moins laborieusement au fil du temps des outils de toutes sortes, des nuages, des arbres, des courbes... Parfois j'en rêve la nuit. L'un des sujets qui me fascine le plus c'est l'auto-émergence de l'information. Le Web, vous en conviendrez sans doute, est de plus en plus illisible, par sa simple masse. Je ne vais pas vous sortir la tarte à la crème de l'océan d'information, mais vous vous êtes probablement senti au bord de la noyade les jours où votre reader RSS déborde, où votre client Twitter explose, sans parler bien sûr de vos centaines de mails qui vous piquent toutes les minutes comme des hordes de moustiques insatiables, des Skype, GTalk et autres fenêtres démoniaques qui bippent sans relâche dans tous les coins de votre écran. Si ce n'est pas l'enfer 2.0, ça y ressemble : ça blogue, ça commente, ça piaille, ça twitte en tous sens, et celui qui veut suivre toute cette diablerie déchaînée est condamné à un zapping infernal, dont on peut se demander ce qu'il retire. Trop d'info tue l'info. Faire émerger de ce magma les signaux intéressants, voilà le Graal algorithmique que je poursuis, et depuis que Wikio a bien voulu me confier le pilotage de ses Labs, je consacre à cette quête une bonne partie de mon temps et de mon énergie.

Je vous ai parlé il y a quelques mois d'un projet du nom de code Twikio, en beta sur Wikio Labs. Après pas mal de recherches, d'expérimentations et de réglages (et pas mal de sueur), le projet a fait son chemin sur la page d'accueil de Wikio, qui présente désormais une sélection d'infos sur des principes radicalement nouveaux.


Les infos sont sélectionnées automatiquement sur la base de critères multiples. Tout d'abord les backlinks, ou rétroliens si vous préférez du bon français. Mais comme j'ai eu l'occasion de le dire à plusieurs reprises, ils ont tendance à se tarir (plus le temps ?), et de toute façon ils ont un inconvénient notable, leur manque de fraîcheur. Le temps de lire un article, d'écrire un billet qui en parle, d'y coller péniblement un lien (bordel !), de le publier, puis d'attendre que Wikio le capture et le passe dans sa moulinette, plusieurs heures se sont certainement écoulées. L'élément nouveau est donc la prise en compte de Twitter, dont l'immédiateté est proprement stupéfiante. Il faut croire que les gens ne sont pas au boulot : même en pleine journée, dans la minute où un article est publié, les premiers twits arrivent... Et ils sont pléthore. Là où on attrape péniblement un maigre backlink ou deux, ce sont souvent des filets pleins de dizaines de twits bien gras que l'on récupère — en France, car aux Etats-Unis, ils se chiffrent par centaines, voire par milliers. Sagesse des foules, ou sagesse des fous, je ne sais pas, mais les internautes nous indiquent collectivement ce qui est important pour eux dans l'overdose d'information quotidienne. En prime, les internautes peuvent aussi voter sur le site, et j'ai souhaité que ces votes aient une forte influence. Les lecteurs eux-mêmes doivent pouvoir compléter la recommandation des réseaux sociaux, et la "communauté Wikio" doit pouvoir influer collectivement sur ce qu'elle a envie de lire.

L'idée est simple, je crois d'ailleurs que d'autres l'ont essayée. La réalisation est terriblement difficile. Si vous avez regardé quelques services qui ont tenté d'organiser l'actu en utilisant la "recommandation sociale", vous avez sans doute constaté leur caractère quelque peu décevant (et encore la plupart du temps ne s'attaquent-ils qu'à l'anglais). Les difficultés techniques sont immenses. Le Web 2.0 n'est pas du tout un long fleuve tranquille, et les foules ne sont pas aussi parfaites et disciplinées qu'on l'aimerait. J'ai eu l'occasion de décrire (ici) l'hétérogénéité extrême des comportements face aux outils sociaux, avec en particulier un taux de retwittage variant de 1 à 1000 selon les communautés. Si l'on classait simplement les infos par nombre de retwits (retweets?), la home ne contiendrait que de la high-tech... Autre difficulté, certains médias (et quelques blogs) publient des dizaines, voire des centaines, d'articles par jour. Même si on règle le problème de la high-tech, on n'aura en home que du Monde et du Figaro. Le blogueur normal, avec ses deux ou trois billets hebdos a bien peu de chance d'émerger de la masse. Et pourtant, il a souvent quelque chose à dire qui mérite d'être au moins autant mis en avant que les innombrables et fastidieux copier-coller des dépêches AFP que nous servent hélas copieusement les médias.

Le cœur de la mécanique que j'ai mise au point consiste à déterminer automatiquement quelles pondérations il faut appliquer à tout cet écosystème. La force de la machine Wikio c'est la connaissance fine des sources, que vous avez pu voir construire étape par étape sur les Labs (en particulier dans les Pages Sources) : catégorisation, métriques diverses, réseaux de voisinage, etc. Toutes ces informations peuvent être utilisées pour pondérer les différentes composantes de la recommandation (backlinks, retwits, votes). Bien entendu, pas question de fixer des valeurs à la main, ce serait infaisable et impossible à maintenir. Le système auto-apprend, et s'améliore en fonction de son historique (on appelle ça "machine learning" dans les soirées chic). Le Wikio nouveau est donc comme le dit Pierre, d'une certaine façon un Digg, mais un Digg bien plus complexe (et espérons-le moins bruité) — un "Digg social", qui prend en compte d'autres sources de recommandation que les simples votes (la prochaine étape sera Facebook), et surtout qui exploite le trésor de connaissances que Wikio a engrangé sur ses 1,2 M de sources au fil des années.

Le but était de faire émerger le signal faible, l'actualité insolite, décalée, polémique. Si vous voulez l'actu classique, plus factuelle, façon AFP, elle est toujours disponible ici, avec un flux RSS correspondant. Le parti pris était aussi de mélanger médias et blogs, parce que chacun apporte sa lumière à sa façon, mais des filtres seront bientôt ajoutés pour ne lire par exemple que la partie blog pour ceux qui le souhaitent. Enfin, si vous pratiquez quelque peu la xénophilie (non ce n'est pas un gros mot), vous serez sans doute intéressés par les versions www.wikio.co.uk, www.wikio.de, www.wikio.es, www.wikio.it, www.wikio.com.

J'ai entendu dire que c'était la plus grosse évolution depuis le lancement de Wikio, je vous en laisse juges. En tout cas, pour moi c'était certainement l'aventure la plus fascinante, même si elle m'a pourri l'été. Et elle est loin d'être terminée ! Cette version n'est pour moi encore qu'une pâle approximation de ce que j'ai en tête. Ne croyez pas à travers mon enthousiasme un peu enfantin que je n'en connaisse pas les défauts et les limites. Il y a encore bien des scories. Mais chaque chose en son temps... Chaque jour montre les imperfections de la veille, et chaque jour est une recherche. Vos remarques et vos commentaires seront comme toujours les plus précieux.

J'adresse enfin un immense merci à l'équipe de R&D qui m'a fait confiance dans ce projet un peu fou, notamment Thomas dont c'est littéralement le bébé (en plus d'un vrai qui vient de naître, ce qui lui a sans doute doublement détruit le sommeil), Alexis, Sébastien, et tous ceux qui ont mouillé leur chemise cet été pour glisser ce nouvel outil dans votre cartable avant la rentrée.

Et maintenant, à vos votes, que l'Actu commence !

8 Commentaires:

Blogger Curare a écrit...

J'ai cliqué sur le lien ''bordel'' prise de tête mais qui donc viendra à son bord'elle pour lui donner des z'ailes ..
Eté pourri pour ça ? z'êtes zêlé de dire ça ..je pensais que je battais tous les records ..queue nennie .

02 septembre, 2010 20:58  
Blogger Jean Véronis a écrit...

Je me devais d'un petit lien bordélique ;-)

02 septembre, 2010 21:02  
Blogger Nicolas Jégou a écrit...

Le lien "bordel" est parfait, n'en déplaise à Lloyb.

03 septembre, 2010 09:47  
Blogger Loran a écrit...

Bonjour Jean,

l'inclusion de Twitter est une évolution nécessaire.

Le vote me pose (un peu) problème. Pour avoir été un utilisateur assidu du digg-like scoopeo, je crains de retrouver dans wikio (ce qui est d'ailleurs signalé dans le post) des écueils rédhibitoires inhérent à ce genre de mécanismes (surtout si le nombre de votants est faibles).
Sur Scoopeo, des groupes se sont constitués, et les membres des ces communautés promouvaient (je ne sais pas si c'est toujours le cas) systématiquement les articles de leurs amis, notamment à des fins de référencements. Sans parler des robots ...

L'argument lié à la sélection automatisée (qui s'oppose au harvesting des membres) ne me parait pertinent que dans une certaine mesure, je crains que le mécanisme ne permette de n'écarter que les petits malins, les pros n'en seraient que plus à l'aise!
En dehors de la fraude, je comprends bien que la question est un peu de savoir qui on préfère comme prescripteur, l'"élite" qui produit du contenu et qui se BL (<1%), les twitteurs/facebookeurs qui a terme devraient représenter (à vue de nez) 10%, ceux qui vont plusser ( la ca devient dur, 10 % de la communauté wikio ?) ...

Ne risque t'on pas de retomber dans les mêmes travers que la télé (entre soi des élites qui produisent du top down riche mais uniformisé, façon france culture ou arte VS Audimat TF1, avec au milieu le panel d'émissions qui fait que les signaux faibles disparaissent au profit du ... profit - la rentabilité assurée de sujets confortables qui tuent la créativité).

Je me demande si un moyen de lutter contre ca, ne serait pas de mettre un peu de hasard :o),
un petit random bien placé qui forcerait le user à voir dans son flux un article incongru de temps en temps?

Bon tout ca est un peu confus, mais l'impression générale que m'a laissée Twikio (qui est un excellent outil) ne va pas vraiment dans le sens du signal faible, le random de wikipédia marche mieux, à mon sens!

Bonne journée

03 septembre, 2010 10:12  
Blogger Jean Véronis a écrit...

Loran> Nous verrons bien comment cela évolue. Je t'avoue que je suis en pleine phase d'observation sur la question des votes. C'est le seul paramètres que je n'ai pas pu tester à l'avance, sur le Labs, puisqu'il faut être en vraie conditions pour savoir ce qui ce passe. Pour l'instant, je ne vois pas de "triche" (il y a quand même pas mal de sécurités de notre côté pour éviter les votes répétitifs), et les votes semblent plutôt judicieux... Donc à surveiller, et à régler au fur et à mesure. Et on pourra toujours blacklister les tricheurs s'il y en a.

La comparaison avec TF1 ne me paraît pas tout à fait adéquate: il n'y a pas de notion de profit sur cette nouvelle home. Qu'un article passe ou un autre ne change rien au revenu. Le seul but des algos et des réglages successifs est l'amélioration de l'expérience utilisateur. Et justement éviter de tomber dans les travers que tu décris. On verra à l'usage !

03 septembre, 2010 10:25  
Anonymous FrédéricLN a écrit...

Tout à fait d'accord avec l'auto-analyse de la force de wikio : la connaissance des sources.

03 septembre, 2010 12:11  
Blogger Jean Véronis a écrit...

FrédéricLN> Et je n'exploite que le sommet de l'iceberg !

03 septembre, 2010 18:43  
Anonymous La blogatière a écrit...

le problème avec ces réseaux sociaux notamment wikio c'est que l'on retrouve toujours les mêmes devant les projecteurs un peu comme une caste, avec la même info pour tous, alors qu'en farfouillant (beaucoup) on trouve de petites perles sous forme de billet.

et si vous ne limitez pas votre flux, hop, tout votre travail est pompé et sans visite en retour, privé de chocolat.

Non! décidément je ne suis pas fan.

09 octobre, 2010 19:46  

Enregistrer un commentaire