Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

lundi, décembre 10, 2007

Actu: Une Ferrari dans un arbre

Vous aurez compris que je ne vous parle pas d'un accident de la route... Je me suis intéressé à la folle rumeur qui parcourt le Web ces jours-ci, et je me suis demandé si, en appliquant mes petits outils, on pouvait en donner une image. J'ai analysé les résultats de Wikio (un superbe moteur, d'ailleurs, même si ce n'est peut-être pas immédiatement apparent — j'y reviendrai certainement dans les prochains jours parce que j'ai été littéralement bluffé par la technicité qui s'y cache). J'ai passé à la moulinette tous les résultats retournés par Wikio sur Laurence Ferrari depuis le 25/11, et je les ai transformés en arbre à l'aide des techniques dont j'ai déjà parlé sur ce blog (par exemple ici ou ici).

Voici ce que ça donne (la taille reflète l'importance du mot-clé, et la proximité dans l'arbre correspond à la proximité dans les articles) :



Ca nous raconte une histoire, non ?

Si vous examinez l'arbre en détail, il y a trois grandes branches, qui correspondent à la propagation de la rumeur. A gauche vous reconnaissez le point de départ : les "révélations" du tabloïd britannique Daily Mail, puis, en haut, le Web qui reprend en boucle... le Web lui-même, et enfin, en bas, les développements judiciaires récents concernant l'atteinte à la vie privée (Laurence Ferrari assigne Métro en justice, etc.).

Je rêve de rendre l'arbre cliquable ! On pourrait alors, en cliquant par exemple sur Metro, avoir les news qui concernent cette partie de l'affaire dans Wikio... Un nouveau mode de navigation en quelque sorte. Mais il faudrait pour cela programmer un peu de Flash, et je n'ai pas le temps pour l'instant (un jour peut-être...).


Réactions


42 Commentaires:

Blogger Loran Bernardi a écrit...

Bonjour,
j'attends avec impatience vos articles sur Wikio :)
bonne journée
Loran

10 décembre, 2007 11:10  
Blogger Jean Véronis a écrit...

Je suis en train d'y travailler à fond. C'est assez étonnant. Je ne voudrais pas avoir l'air trop exalté, mais c'est à mon sens l'outil web qui recèle à l'heure actuelle les technologies du langage les plus avancées. Rien à voir avec Google News ! Mais il cache bien son jeu. Ca ne se voit guère si on n'y jette qu'un oeil distrait.

10 décembre, 2007 11:16  
Anonymous Anonyme a écrit...

Ah non, pas de flash s'il vous plait...

Faisons attention à utiliser des standards ouverts et à les respecter...

La connaissance appartient à tous, non ?

10 décembre, 2007 11:24  
Blogger Jean Véronis a écrit...

Cher anonyme, je respecte votre opinion et la partage jusqu'à un certain point, mais je n'en ferai pas un dogme absolu. Il faudrait sinon appliquer le même raisonnement à tout notre environnement, n'accepter de ne toucher qu'un ordinateur sous Linux, mais aussi ne pas se balader avec un iPod, refuser les téléphones "fermés" (tous?), etc... Dur.

Sur Flash, de plus, on peut discuter du caractère "fermé". Le lecteur Flash est vérouillé et propriétaire, c'est vrai, mais le format est "ouvert". En ce qui me concerne je programme Flash (ActionScript plus exactement) à travers de l' "Open Flash", les outils MTAsc, swfmill en particulier (très beaux outils libres, ouverts et gratuits).

10 décembre, 2007 11:35  
Anonymous Sirey a écrit...

@ Jean : j'ai hâte de lire vos articles sur Wikio aussi car j'en ai découvert l'existence en vous lisant (déjà) et je confesse que son efficacité ne m'est pas (enc)re "immédiatement apparent(e)" !

10 décembre, 2007 13:06  
Blogger Jean Véronis a écrit...

Sirey> Oui, on ne voit pas bien la différence avec un "bête" aggrégateur, mais c'est dommage. Moi, je parle de la techno sous-jacente. J'y reviendrai en détail, mais comparez simplement les requêtes

Ferrari sur Google News

Ferrari sur Wikio

Dans le premier cas, on a un méli-mélo de formule 1 et de people. Dans le deuxième cas, des résultats propres sur les voitures.

Evidemment, et c'est là que Wikio est perfectible, on aimerait avoir une page d'"ambiguïté" disant

Voir aussi Actu > Culture > Télévision > Animateurs TV > Laurence Ferrari

C'est si facile !

(C'était la rubrique les petits-conseils-gratuits-pour-l'instant du professeur Aixtal ;-)

10 décembre, 2007 13:26  
Blogger Jean-Marie Le Ray a écrit...

Wikio est un excellent outil, indispensable.
La fonction que je préfère : celle qui permet de créer un flux à la volée sur n'importe quel sujet.
Une flexibilité puissante, si je puis m'exprimer ainsi.
Jean-Marie

P.S. L'arbre me fait plutôt penser aux nervures d'une feuille

10 décembre, 2007 15:09  
Anonymous Anonyme a écrit...

Pourquoi ne pas générer les images au format svg ? Sans compter les bénéfices apportés par un passage au vectoriel, c'est un format ouvert et les liens seraient cliquables !

10 décembre, 2007 15:15  
Blogger Jean Véronis a écrit...

Jean-Marie> Oui, très belle fonction, d'autant que les résultats sont très propres.

10 décembre, 2007 17:12  
Blogger Jean Véronis a écrit...

Anonyme> format svg -- oui, c'est une alternative à Flash (dnas les deux cas il y a de la programmation à faire, néanmoins), mais combien de gens ont le plugin ? Mais bon, on ne va pas entamer une guerre de religion sur les formats ? D'ailleurs comme j'ai dit plus haut, c'est une erreur de dire que Flash n'est pas ouvert...

10 décembre, 2007 17:18  
Blogger jm a écrit...

Pour faire une image avec liens, il existe d'autres solutions que le flash et le svg.
Wikipédia utilise cette technique très pratique pour afficher une carte de chaque lieu.
Ainsi, en se rendant sur la page de Clermont-Ferrand, on voit sur le panneau de droite, à l'entrée « coordonnées géographiques » une petite terre. Cliquez dessus, et appréciez le html avec liens cliquables à l'intérieur de wikipédia :)

10 décembre, 2007 17:49  
Blogger Jean Véronis a écrit...

Suite à mon commentaire de 13:26 @Sirey> Après farfouillage additionnel, je m'aperçois que ce message de suggestions apparaît parfois. Exemple avec Sarkozi:

D'autres résultats ont été trouvés dans ces catégories People - Jean Sarkozy
People - Louis Sarkozy
People - Pierre Sarkozy
Politique - Gouvernement - Présidence de la République - Nicolas Sarkozy

Très bon, non?

Mais ça ne marche pas sur Ferrari. Réglages et problèmes de jeunesse, je suppose.

10 décembre, 2007 18:41  
Blogger FreeCorp a écrit...

Pour rendre une image cliquable en simple HTML, on peut utiliser la balise MAP. Le problème est alors de récupérer les coordonnées des feuilles ou de leurs labels, mais celles-ci doivent être présentes (moyennant une petite homothétie) dans le fichier source de l'arbre (par exemple dans le fichier Nexus d'export de l'arbre depuis SplitsTree).

10 décembre, 2007 19:36  
Blogger Jean Véronis a écrit...

Freecorp> Map -- oui, c'est ce qu'avais fait par exemple ici. Mais c'est quand même un peu galère...

10 décembre, 2007 19:43  
Anonymous Florian a écrit...

Je ne connaissais pas encore cette rumeur, mais je savais que Sarkozy est un célibataire très convoité! ;)

Félicitations pour le blog! Comme les autres lecteurs, j'attends impatiemment un prochain billet sur Wikio.

10 décembre, 2007 20:57  
Blogger Jean Véronis a écrit...

Vous me mettez la pression, là ! Mais c'est ma faute, je n'aurais pas dû faire du teasing ;-)

10 décembre, 2007 21:01  
Blogger Jean Véronis a écrit...

Dans la série "Wikio, si tu nous écoutes" ;-)...

Ferrari

D'autres résultats ont été trouvés dans ces catégories Culture - Acteurs - Lolo Ferrari
Culture - Télévision - Animateurs TV - Laurence Ferrari
Loisirs - Auto - Ferrari


Génial. Bravo pour la réactivité !

11 décembre, 2007 09:42  
Anonymous Anonyme a écrit...

J'ai appris cette nouvelle il y a 2 semaine dans la presse papier locale indienne (Bangalore) !

11 décembre, 2007 15:01  
Blogger Jean Véronis a écrit...

"nouvelle"... n'exagérons rien ! Pour l'instant c'est un "scoop" lancé par un tabloïd anglais qui vole généralement au ras du caniveau...

11 décembre, 2007 17:16  
Anonymous Anonyme a écrit...

Tout le monde sait que sa muse s'appelle Rachida Dati; c'est quoi cette rumeur stupide sur Mme Ferrari ?

11 décembre, 2007 21:45  
Anonymous Ouverture d'esprit ? a écrit...

Bravo pour votre adoption de Flash, ça ne semblait pas gagné à l'époque... Vous avez décidément tous les talents ! MTASC est un magifique compilateur, même plus rapide que celui d'Adobe. Dommage qu'il ne supporte pas l'AS3 !

Et merci de rappeler à certains intégristes bornés (si ce n'est pas un pléonasme !) que c'est un format ouvert (et une machine virtuelle dont le code source a été donné à la fondation Mozilla). Toujours condamner sans connaître... Sans doute un accro d'Iceweasel ! ;-)

Cependant, en l'espèce je ne vois pas bien l'intérêt d'utiliser Flash simplement pour rendre les liens cliquables. Ce n'est ni plus simple ni vraiment plus efficace qu'un bon vieux MAP il me semble... Il y aurait en revanche un intérêt en réorganisant un arbre autour du terme cliqué, un peu comme vous le proposiez pour les nuages de mots, même si en pratique vous êtiez restés dans le statique. À quand une version flashée du nébuloscope ? (j'ai l'impression que ce dernier a actuellement un petit problème d'URLDecode : pas lourd de résultats avec des %20...)

12 décembre, 2007 01:37  
Blogger Vicnent a écrit...

:-) pour le sujet

Jean, balise MAP, automatisation : suis étonné que tu nous racontes ici que c'est galère...

Rien à voir : pourquoi n'affiches tu qu'un billet ? (je te joints déjà dans google Reader dans lequel tu ne fournis qu'un Rss court : exemple)

Et ne prends pas la grosse tête à propos de ma balise Google de classement : c'est la première balise qui m'est venue à l'esprit pour me rappeler que je dois lire ces blogs "à tête reposée". Parce qu'ils le valent bien... ;-)

12 décembre, 2007 10:30  
Blogger Jean Véronis a écrit...

Vicnent> MAP : bof... Je n'aime pas trop, parce que ça génère un immense machin HTML, qu'il faut ensuite coller dans ton post, etc. L'intérêt d'un swf c'est qu'un lien suffit, et que les données sont gentiment placées sur ton serveur en XML. Quand même plus propre. Sans compter que Flash permet des affichages bien plus élaborés (modif dynamique de l'image). Mais bon, je ne suis pas du genre à faire des guerres de religion. MAP c'est bien aussi.

Un billet. tu veux dire sur la page d'accueil? J'en avais 10 auparavant, mais comme mes billets sont très souvent longs avec beaucoup d'images, ça fait un chargement très lourd (beaucoup de gens accèent par la home, et non pas par les billets individuels). Je ne pouvais pas changer avant parce que le fil RSS de Blogger était (bêtement!) lié au nombre de billets postés sur la home. Mais un jour ils ont eu l'intelligence de découpler ça. Normalement mon flux RSS affiche 25 billets. Y a-t-il un problème? Je ne suis pas sûr de comprendre pourquoi ça paraît gênant.

Pour le flux RSS court, c'est un choix. Je trouve que je m'emmerde la vie à faire un mise en page élaborée, à mettre des petits gadgets javascript et autres sur ma page, et je trouve dommage que les gens fassent du fast-read et du zapping dans des readers. Les gens n'en sont quand même pas à un clic près, non? (ou alors, finalement, s'ils sont vraiment dans la culture du vite-lu-vite-commenté-vite-oublié, en ai-je besoin/envie comme lecteur?)

Balise Google de classement? J'ai raté un truc...

12 décembre, 2007 10:49  
Anonymous C. Goutte a écrit...

À propos d'integrateurs de nouvelles, connaissez vous le EMM (Europe Media Monitor) News explorer?
EMM News Explorer
C'est non commercial et développé au JRC à Ispra.
La couverture en terme de langues ou d'entités nommées est impressionante.
Malheureusement l'interface reste partiellement en anglais...

12 décembre, 2007 11:00  
Blogger Jean Véronis a écrit...

Ouverture d'esprit> Sur Flash : vous faites référence à un billet de 2005. Mais si vous le lisez bien, vous verrez que je n'étais pas anti-Flash. Je m'interrogeais, justement. Mais réserves antérieures provenaient des temps anciens où Flash posait pas mal de problèmes, mal supporté par certains navigateurs, problèmes de plugins et de versions, lourdeur des swf (ADSL est passé par là, mais ça peyt rester un souci sur des trucs très graphiques et/ou sonores). Je ne posais pas la chose en termes de guerre de religion sur les formats. D'ailleurs, le rachat de Macromedia par Adobe a bien changé les choses. Je suis d'accord avec vous: Flash est ouvert (et je ne vois pas pourquoi une compagnie ne ferait pas du business avec un lecteur et un IDE... ne mélange-t-on pas un peu tout?).

Dommage pour MTAsc, qui effectivement ne supporte pas AS3. Et je ne suis pas complètement convaincu par HaXe (qui est son successeur). A suivre, néanmoins...

Pour l'intérêt de Flash par rapport à MAP, j'ai déjà partiellement répondu à Vicnent. MAP est très limité. Regardez ceci (cliquez sur la démo) -- java, déjà très ancien, mais ça vous donnera une idée de ce que je ferai bientôt, et ne peux faire qu'en Flash.

En ce qui concerne le Nébuloscope, il y a eu récemment des changements de configs sur mon serveur, et il faut que j'y travaille. Mais ça ne vaut pas la peine, sans doute, parce que le moteur Dir est à peu près mort, et le Nébuloscope va mourir avec...

12 décembre, 2007 11:06  
Blogger Jean Véronis a écrit...

C. Goutte> EMM News Explorer: oui, très bel outil. Je partage votre point de vue. La différence avec Wikio (entre autres) et que celui-ci regroupe les news dans un thésaurus (ex: Royal -> PS -> Politique)

12 décembre, 2007 11:10  
Anonymous Ouverture d'esprit a écrit...

sur Flash : c'est l'impression que vous aviez laissé dans mon esprit sur le sujet (ça fait un sacré bail que je vous lis !). J'ai aussi été surpris en retrouvant votre article qui balance davantage vers le pour. Sans doute l'effet des commentaires où vous penchez beaucoup plus nettement vers SVG...

HyperLex : Oui, tout à fait le genre d'outils où je proposais l'utilisation de Flash. Et comme d'habitude chez vous, le contenu est encore plus intéressant : j'ai parcouru votre papier avec grand intérêt.

Balise Google : je pense que Vicnent faisait allusion à sa capture d'écran ou on voit que vous êtes classés à la rubrique "intellos" dans l'arbre à gauche ;-)

12 décembre, 2007 21:38  
Blogger Jean Véronis a écrit...

Deux ans après, l'évolution n'est pas illégitime ;-) D'autant que des choses majeures se sont passées, maintenant, Flash est bien supporté par tous les navigateurs (il est devenu quasi standard en fait), Macromedia a été racheté par Adobe, etc.

Intello. Quelle horreur !

12 décembre, 2007 21:46  
Blogger Jadlat a écrit...

En terme de pertinence, je trouve wasalive encore meilleur que wikio, mais c'est en tant qu'utilsateur que je parle et non en terme de spécialiste du langage

12 décembre, 2007 22:14  
Blogger Vicnent a écrit...

@Ouvverture d'Esprit : oui pour intello !

@Jean : une balise doit être courte : je ne pouvais pas mettre "Ici sont les blogs super intéressants dont je dois prendre garde d'avoir du temps car il me faut les lire à tête reposée" :-)))

13 décembre, 2007 10:44  
Blogger Emmanuel a écrit...

Cher Jean,

merci pour vos chroniques et analyses tellement stimulantes. Je me pose la question suivante à la vue de votre "arbre". Pour l'instant (et j'en comprends la raison), il semble permettre avant tout de vérifier ce qui est déja connu. Les connections établies racontent certes une histoire, mais une histoire qui a déja été écrite peu ou prou, même si les auteurs en sont mutiples. Voici ma question: pensez vous qu'une méthodologie de cette sorte (ou avoisinante, je ne suis pas spécialiste), appliquée à un corpus beaucoup plus vaste et informel (incluant bien sûr l'ensemble de la blogosphère et au delà si possible), dans la prochaine version du web (dit "sémantique" si je ne me trompe) pourrait révéler des histoires EN TRAIN DE S'ECRIRE et non plus ce que l'on connait déja? Vaste question probablement mais au combien excitante...

13 décembre, 2007 17:02  
Blogger Jean Véronis a écrit...

Emmanuel> Oui, bien sûr. Il serait assez simple, quand on a une base de données importante (comme celle de Wikio), de repérer automatiquement les mots-clés qui ont des changement de fréquence soudains, et de calculer automatiquement de telles cartographies...

13 décembre, 2007 17:09  
Blogger epommate a écrit...

"Le lecteur Flash est vérouillé et propriétaire, c'est vrai, mais le format est "ouvert"."

Sans vouloir entrer dans le troll, pouriez-vous m'indiquez où vous avez trouvé que le format était "ouvert". J'ai beau chercher, mais je ne trouve rien là dessus, à part des preuves du contraire (http://en.wikipedia.org/wiki/SWF#Licensing)

15 décembre, 2007 09:32  
Blogger Jean Véronis a écrit...

En tout cas, SWF n'est pas fermé, si l'on prend la définition de Wikipedia, justement :

Le format fermé désigne un format de données qui n'a pas de libre utilisation, c'est-à-dire qu'on ne sait pas de quelle manière est construite le fichier et donc, on ne peut pas créé un logiciel qui sache lire ou écrire ce type de format.

Or 1) les spécifications de SWF sont publiques 2) la licence donne le droit de générer du SWF.

Il reste, je vous l'accorde, qu'Adobe se réserve le droit exclusif de "jouer" le format SWF à travers son player (détails de la licence ici). Donc, de ce point de vue, SWF n'est pas non plus ouvert, toujours selon la définition de Wikipedia :

Un format ouvert (on parle aussi parfois de spécification ouverte qui est un anglicisme) est un format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en œuvre

(j'admire au passage le ridicule achevé du commentaire sur l'anglicisme -- il y a décidément des gens étranges et à l'esprit pas nécessairement "ouvert" parmi les rédacteurs de Wikipedia... ;-)

Pour revenir au format SWF, il n'est donc ni totalement ouvert, ni totalement fermé. Ces catégories binaires ne sont pas suffisantes. En ce qui me concerne, je trouve que ce modèle est un compromis acceptable. Je n'ai pas d'objection à ce qu'Adobe ou d'autres fassent du business !

Ceci étant, il y a des tentatives pour contourner la restriction sur le lecteur : voir Gnash

Je ne me suis pas penché sur les aspects légaux de la question, mais elle m'intrigue. A première vue, Gnash semble en infraction, mais il y a peut-être des failles dans les kilomètres de "fine print" de la licence Adobe... Si quelqu'un en sait plus je suis preneur.

15 décembre, 2007 10:22  
Blogger epommate a écrit...

A mon avis, la définition de format fermé est erronée sur Wikipédia fr.

D'ailleurs en prenant la seconde phrase :Son auteur essaie, soit par la non-divulgation de son mode de représentation, soit par des entraves légales (à travers une licence d'utilisation), d'en restreindre l'utilisation., SWF entre bien dans cette définition.

Le format SWF est à mon avis comme un brevet : je sais parfaitement comment ca marche, mais il faudras passer à la caisse pour pouvoir l'utiliser.

C'est d'ailleur ce que dit la wikipédia anglaise :A proprietary format is a file format which is covered by a patent or copyright. (ref)

En ce qui me concerne, je pense que SWF est un format propriétaire public et donc, son utilisation est aussi dangereuse que n'importe quel format propriétaire plus traditionnel.

15 décembre, 2007 10:54  
Blogger Jean Véronis a écrit...

La définition de format fermé est erronée sur Wikipédia fr -- C'est bien possible. En tout cas elle est très mauvaise :

Le format fermé désigne un format de données qui n'a pas de libre utilisation, c'est-à-dire qu'on ne sait pas de quelle manière est construite le fichier et donc, on ne peut pas créé [sic] un logiciel qui sache lire ou écrire ce type de format.

Je ne parle pas du style et de la faute d'orthographe, mais de l'incohérence logique. Le fait de ne pas être libre d'utilisation n'entraîne pas, contrairement à ce que laisse entendre le c'est-à-dire qu'on puisse pas avoir des spécifications publiques du format. De plus, le donc n'est pas correct non plus. On peut très bien savoir comment le fichier et construit et ne pas avoir le droit de créé ;-) des logiciels qui le lisent ou l'écrivent...

Mais malgré, tout, même avec une correction de la définition, le caractère binaire ouvert/fermé est insuffisant. Il faudrait 3 catégories : ouvert en lecture et écriture / ouvert en lecture ou écriture seule / fermé. SWF serait dans la catégorie du milieu.

15 décembre, 2007 11:16  
Blogger epommate a écrit...

Ca y est j'ai compris, c'est encore le débat libre/open source !

Les formats peuvent être soit ouverts (on peut lire leur spec) soit fermés (on ne sait pas comment ça marche) d'une part. Et d'autre part, ils peuvent être soit libres (on fait ce qu'on veut avec) soit propriétaires (il y a des limitations à l'utilisation).

C'est plus clair pour les formats vidéo :
=>WMA format fermé et propriétaire
=>MP3 fomat ouvert et propriétaire
=>Ogg format ouvert et libre

(évidemment, il n'y a pas de format fermé et libre, ca ne veut rien dire)

Donc SWF est comme MP3, ouvert et propriétaire.

Si j'ai le temps, j'irai corriger Wikipédia ;-)

(désolé d'avoir dévier de Laurence Ferrari, Ô combien plus importante)

15 décembre, 2007 12:08  
Blogger Jean Véronis a écrit...

Cette catégorisation me paraît tout à fait pertinente. Et on pourrait ajouter une dimension : gratuit/payant. On confond souvent ouvert, libre et gratuit...

Pas de problème pour Ferrari. C'était déjà de ma part un prétexte pour parler d'autre chose ;-)

15 décembre, 2007 13:20  
Anonymous Anonyme a écrit...

Vous parlez d'un style comme celui de Kartoo.com (qui bien que très perfectible, se révèle parfois extrêmement perspicace) ?

15 décembre, 2007 16:04  
Blogger Jean Véronis a écrit...

Le problème de Kartoo c'est sa pertinence, qui est exécrable. Et je n'ai pas vu d'évolution notable au fil des années... Difficile donc de juger. Le fond est difficile à dissocier de la forme.

16 décembre, 2007 08:10  
Blogger Aranno a écrit...

Pour en revenir à Laurence Ferrari, j'aime beaucoup les résultats de la requête aujourd'hui : Carla Bruni, Carla Bruni, Carla Bruni ! :-)

17 décembre, 2007 15:23  
Blogger Galixte a écrit...

Salut,

intéressant mais ce n'est pas/plus (?) Bruni qui est si convoitée, un lien intéressant sur la relation Sarko-Bruni : http://parti-pirate.fr/

@+.

18 décembre, 2007 14:05  

Enregistrer un commentaire