Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

vendredi, mars 14, 2008

Actu: Carla Bruni est toujours chanteuse

Mais moins... L'immense majorité des articles (médias ou blogs) qui lui sont consacrés parlent plus de ses (més)aventures de première dame que de sa carrière de chanteuse. Alors comment faire si je suis un fan qui veut suivre son actualité musicale ? Cette information-là est typiquement noyée dans le bruit "people" si vous cherchez sur un moteur classique comme Google News, et il est extrêmement difficile d'avoir votre information. Je me suis amusé avec l'équipe de Wikio (merci Agnès) à voir si l'on pouvait extraire uniquement l'actu musicale de Carla Bruni. Voilà le résultat. Il y a maintenant sur Wikio une catégorie générale

Actu > People > Carla Bruni-Sarkozy

et une catégorie "Carla chanteuse" :

Actu > Culture > Musique > Variété française > Carla Bruni-Sarkozy


Il "suffisait" d'extraire automatiquement les termes les plus fréquents de l'ensemble de la catégorie "Variété française" (musique, chanson, chanteuse, CD, etc.) et de les injecter dans le moteur "sémantique" qui catégorise les news...

Et l'on peut voir que si l'on parle de plus en plus de la belle Carla, on en parle de moins en moins à propos de ses talents musicaux...




Carla Bruni chanteuse
[màj 07/04: eh bien oui, on en reparle !]

A quoi ça sert ? A rien. J'ai juste trouvé un nouveau terrain de jeu.

8 Commentaires:

Blogger Jérôme Charron a écrit...

Salut Jean, je vois en effet que tu délaisses dir.com en faveur de wikio.fr ;-)

A l'image de ton billet sur les comptes bidonnés de Google, tu pourrais alors également en faire un sur les comptes bidonnés de Wikio...

Je m'explique:
1. Aller sur wikio.
2. Choisir une catégorie (people au hasard)
3. Regarder le nombre de résultats annoncés (28104 au moment où j'écris ce commentaire sur mon EeePC)
4. Se rendre sur le 10000ème résultat (wikio rame)
5. Et là surprise, il n'y a rien sur la page!!! Pourtant sur la "pager" en base, wikio nous annonce 1874 pages et nous n'en sommes qu'à la 667ème!!!

Alors je me questionne:
- Bidonnage ?
- Bug ?
- Optimisation (les pagers sont gourmands en ressources) ?

Si tu as une idée...

14 mars, 2008 19:50  
Anonymous Dominique a écrit...

Je me suis amusé il y deux jours à faire une plaisanterie au sujet du nom d'une variété de pommes de terre avec un titre de billet très racoleur et puis j'ai trouve beaucoup de gens venant de
http://www.wikio.fr/people/stars_nues/carla_bruni_nue
ou d'autres catégories de Wikio que je pourrai détailler lorsque les choses seront un peu décantées. Je précise que je n'ai pas abusé des étiquettes (tags) pour être classé ainsi et qu'en fait il n'y avait qu'un lien.

14 mars, 2008 21:31  
Blogger Jean Véronis a écrit...

Jérôme> Bonjour Jérôme! Ravi que nos chemins se croisent de temps à autre, à nouveau ;-)

Oui, j'en sais plus sur le nombre de résultats. C'est un bug. Ou plutôt, c'est difficile pour les ingénieurs de Wikio d'avoir le bon chiffre en temps réel, pour des raisons que les spécialistes en bases de données peuvent facilement imaginer. Mais bon, ils sont au courant. Je ne sais pas si ça va se corriger tout de suite dans la nouvelle version (Europa) qui sort mercredi : ça n'est pas exactement la priorité ! Il n'y a que des experts comme toi pour voir ça (oeil de lynx ;-)

Ptit'e bière un de ces 4 ?

14 mars, 2008 22:15  
Blogger Jean Véronis a écrit...

PS: Dir.com est mort, hélas. Effectivement, je trouve en Wikio les moyens de faire les choses qui me trottent dans la tête, et qui sont restées en plan chez Free. Dommage. ils ont raté une occasion. Mais, bon, c'est ça la vie, comme dirait Darwin...

14 mars, 2008 22:25  
Blogger Pierre Chappaz a écrit...

> Jerome Charron

A propos de "compte bidonnés" essayez donc de retrouver le 10000è résultat sur Google...

http://www.google.fr/search?q=people&hl=fr&start=10&sa=N

Google ne renvoie pas plus de 1000 résultats par requête (vous avez demandé l'affichage des résultats à partir du numéro 10000.)

Cela dit, vous avez raison de le signaler, nous devons réparer ce bug :-)

15 mars, 2008 12:25  
Blogger Jérôme Charron a écrit...

Jean> Oui, il est difficile d'avoir le bon chiffre en temps réel, j'en suis conscient. Mais ce qui est marrant, c'est qu'à chaque fois qu'une nouvelle news apparaît dans une catégorie, le compteur est incrémenté => il ne s'agit donc pas d'un problème d'approximation comme sur les grands moteurs.

Oeil de Lynx? Oui, il est vrai que j'adore aller voir comment se comporte un moteur dans les profondeurs de ses résultats, c'est comme ça que j'avais par exemple remarqué qu'Exalead après la page 1000 continuait à paginer, mais en fait cyclait sur les premiers résultats => à la page 1000 on avait les résultats de la page 1, à la page 1001 les résultats de la page 2, etc... mais ce n'est plus la cas maintenant.

Concernant la bière, avec plaisir. Je suis maintenant à Rambuteau dans le 3ème donc si tu passes dans le coin fais moi signe, je te ferais visiter le centre de R&D de shopreflex et staragora... ;-)

Pierre> Oui, mais google n'affiche plus de pager et n'annonce pas qu'il y a encore des pages de résultats.
Quoi qu'il en soit, j'ai hâte de découvrir Europa, tout en espérant que vous n'avyez pas trop travaillé sur la partie shopping ;-)
En tout cas, vous avez trouvé en Jean un ambassadeur de choix!

15 mars, 2008 12:43  
Blogger Jean Véronis a écrit...

Pierre> Les comptes étranges de Google ont été un sujet de prédilection de ce blog il y a quelque temps (par exemple ici, et ici) ;-)

Dans le cas de Google c'était plus gênant que dans celui de Wikio : Google faisait de son nombre de pages (x milliards) un argument marketing, du genre c'est nous qui avons la plus grosse (base de données, bien sûr). Il était donc logique d'aller vérifier...

Je ne crois pas que Wikio ait fait du nombre de news un argument marketing (et c'est tant mieux !).

15 mars, 2008 13:13  
Anonymous Thibault a écrit...

A quand un duo avec Sarko!?

08 mai, 2008 22:43  

Enregistrer un commentaire