Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

jeudi, avril 20, 2006

Web: Tremblements de mots

La poussière du CPE commence à retomber. Comme après un séisme, le monde politique un peu hébété soigne ses blessés, compte ses morts, essaie d'évaluer l'ampleur des dommages collatéraux... Le Chronologue a gardé un enregistrement de la secousse:



L'aiguille a failli casser. Jamais le Chronologue n'avait observé une telle explosion. La crise des banlieues, en comparaison, avait été un simple chahut. En superposant les deux courbes, on voit que le pic produit par le mot banlieues au plus fort de la crise a atteint à peine un tiers de celui récemment produit par le mot CPE.



Le niveau d'intensité telique (de tela, la toile) de CPE a atteint celui de banlieues lors de la grande manifestation du 7 mars. On voit d'ailleurs que la première phase a été un peu poussive, lente à démarrer. Si l'on en juge par le petit creux de la fin février, le mouvement a même commencé à s'essouffler quelque peu. Cela a peut-être trompé les politiques, qui ont pu croire la fin du mouvement proche. Manque de chance, comme en sismologie, les mouvements tectoniques ne sont guère prévisibles: la deuxième secousse est arrivée, dévastatrice. Cette forme de courbe contraste avec le pic des banlieues: ça avait pété d'un coup après la triste affaire du transformateur, et le bord gauche du pic est abrupt.

D'autres expressions ont des formes plus complexes, comme grippe aviaire, pour laquelle on a connu plusieurs secousses successives, et surtout, les intensités peuvent être très différentes. Le pic de Segolène Royal par exemple, qui nous paraît très médiatisée ces temps-ci, est à peine visible à l'échelle du CPE...



Il faut un bon coup de zoom pour l'apercevoir:



On distingue son voyage au Chili en janvier, son véritable "blitz" médiatique en Une des magazines et sur les plateaux télés fin mars... et un grand silence courageux pendant la crise du CPE.

On pourrait filer la métaphore et proposer une véritable échelle de Richter (une échelle de Véronis?) des séismes linguistiques: de 0 à 9 selon le bruit sur la Toile, et les dégâts éventuels (en fait l'échelle de Richter est ouverte vers le haut, mais à mon avis il vaut mieux ne rien observer de supérieur à 9!). La première étape est de mesurer l'amplitude du pic, sachant qu'il peut y avoir une présence constante et habituelle de l'expression sur le Web, qu'il faut retrancher. Par exemple, la présence habituelle de Clémenceau est de l'ordre de 300, tandis que lors de l'affaire du minable aller-retour en Inde, le pic est monté à près de 2100. On pourrait faire plus compliqué, mais en gros, en prenant le maximum moins le minimum on obtient déjà une mesure utilisable (ici 2100 - 300 = 1800, à la louche).



Il faut ensuite étalonner la chose pour se retrouver sur une échelle de 0 à 9. La description de l'échelle de Richter nous dit 9 et au-delà: "exceptionnel, de l'ordre de deux fois par siècle" (voir ici). Nous n'en étions quand même pas là avec le CPE. Je mettrais plutôt le CPE dans le genre de crise qui peut "engendrer des dommages sérieux" dans des zones à l'échelle d'un pays, c'est à dire entre 8 et 9. Il faut garder de la marge. L'amplitude du pic du CPE est de l'ordre de 10500. Faisons un essai en attribuant le degré 9 à une fréquence de 20000. Quelques logarithmes (je n'entre pas dans les détails pour ne pas plomber l'audimat; les initiés comprendront...) et on trouve les correspondances suivantes:

MagnitudeAmplitude Pic
13
29
327
482
5245
6737
72214
86655
920000

Voici ce que ça donne pour quelques expressions choisies:

ExpressionAmplitudeMagnitude
cpe104698,4
grippe aviaire59227,9
banlieues33187,4
suez31637,3
dominique de villepin19986,9
chikungunya18416,8
clemenceau18126,8
cne10606,3
nicolas sarkozy9966,3
segolene royal5455,7
florence baverel-robert2294,9
alexandra rosenfeld1124,3
jean veronis703,9
cecile duflot192,7

Ou sous forme graphique:



Pas trop mal, non? Le CPE (8,4) est évidemment en haut du classement... Villepin (6,9) et Sarkozy (6,3) peuvent "être destructeurs dans des zones jusqu'à 180 kilomètres à la ronde dans les zones peuplées", Ségolène Royal (5,7) entre dans la catégorie des tremblements de mots qui peuvent "causer des dommages majeurs à des édifices mal conçus". J'espère que le PS a des fondations solides... Je suis assez fier: je me paie quand même un petit 3,9 (qui correspond à mon étude comparative des moteurs, citée un peu partout), et j'entre donc dans la catégorie des secousses "souvent ressenties mais causant rarement des dommages". Sympa: ça m'embêterait de faire trop de casse quand même. Quant à la pauvre Cécile Duflot, toute jeune candidate à l'investiture des Verts pour la présidentielle, elle fait partie des phénomènes "généralement non ressentis mais détectés/enregistrés". Si j'ai bien compris, on devrait savoir aujourd'hui si elle a quand même été un peu ressentie par les militants, ou pas du tout...

A prendre au second degré sur l'échelle de l'humour, tout de même. On pourrait en faire quelque chose de sérieux, mais ça demanderait du vrai travail qui fatigue...

34 Commentaires:

Anonymous Jean Meyran a écrit...

Deux petits commentaires :

Le battage fait en préalable à la sortie des "brigades du Tigre" (et donc Clemenceau) ne biaise-t-il pas le score Clémenceau ?

Vu le tableau, n'avez-vous pas pensé à vous présenter à la candidature des verts ? ;-)

Bonjour chez vous

20 avril, 2006 17:29  
Blogger Jean Véronis a écrit...

Jean> brigades du tigre -- Sur ce cas précis, je ne crois pas qu'il y ait trop intéreférence, parce que le buzz sur "brigades du tigre" est pour l'instant faible par rapport à "clémenceau" et que le pic n'est pas au même endroit (Chronologue). Mais on n'est évidemment pas à l'abri de phénomènes de ce type (c'est pour ça que je dis que ça demanderait du vrai travail...).

20 avril, 2006 17:41  
Blogger Vicnent 31415 a écrit...

G É N I A L !!!!!!!!!!

l'étape suivante consiste-t-elle à prédire ce dont les journeaux vont parler ?

20 avril, 2006 17:42  
Anonymous Anonyme a écrit...

Excellent!!!
Remarquez que vous pourriez une autre échelle logarithmique pour votre analogie, comme celle de l'intenisté sonore qui permet une plus grande "largeur" d'interprétation de tous ces phénomènes "teliques" ;)

20 avril, 2006 17:47  
Blogger Jean Véronis a écrit...

Vicnent> Pourquoi pas? On essaie bien de prédire les tremblements de terre (enfin, pour l'instant ça ne marche pas trop...).

20 avril, 2006 17:48  
Anonymous Anonyme a écrit...

Vous observez :
l'échelle de Richter est ouverte vers le haut, mais à mon avis il vaut mieux ne rien observer de supérieur à 9!

Deux évènements récents (entre autres...) pourraient se "qualifier" :
- le 11 septembre
- le tsunami

Mais je suppose que vous ne disposez pas des données

20 avril, 2006 18:41  
Blogger Jean Véronis a écrit...

Anonymous> 11 sept, tsunami -- oui, vous avez raison... il vaut mieux qu'il n'y en ait pas trop dans le même genre. (effectivement, je ne peux pas remonter aussi loin).

20 avril, 2006 18:46  
Anonymous Agnès a écrit...

Dommage que contrairement à la secousse télurique cela ne permette pas de travailler avec la propagation spatiale des ondes de choc. Heureusement d'autres chercheurs profitent de leurs "temps libres" pour se pencher sur cette question:
http://www.espacestemps.net/document1925.html
Ainsi il semble bien exister un déplacement spatio-temporel de l'épicentre de la secousse.

Les étudiants de la faculté de lettres et sciences humaines de l'Université d'Aix-Marseille I se sont eux aussi prononcés (mercredi 13 avril) en faveur de la poursuite du blocage jusqu'au 2 mai, date de fin des vacances universitaires.
Vous devriez sérieusement commencer à vous poser la question de tirer un profit économique de votre très médiatique blog, afin de dégager des bénéfices qui vous permettront de payer les sérieux dommages sur votre outil de travail principal!

20 avril, 2006 19:12  
Blogger TOMHTML a écrit...

je vote pour "Echelle de Véronis" :)

20 avril, 2006 19:17  
Anonymous Tristram a écrit...

Attention aux sudoku!
Ils sont déjà à 4000 et ça pourrait encore augmenter :)

20 avril, 2006 19:47  
Blogger The Jedi a écrit...

Heu, concernant le bâteau, on dit bien "Clemenceau" et non "Clémeanceau" ? (jamais compris pourquoi d'ailleurs).

20 avril, 2006 21:08  
Blogger Timuche a écrit...

Belle démonstration !

Je voulais savoir, telique est enregistré ? Le TLFi ne semble pas le connaitre.

^_^

Télaire ne vous semble pas un bon candidat ? La paronymie avec stellaire est séduisante, ne trouvez-vous pas ?

20 avril, 2006 22:57  
Blogger Jean Véronis a écrit...

Tristram> sudoku -- un beau 7,5 de magnitude. L'allure de la courbe est très étonnante. Ici on n'a pas un pic, mais une progression constante depuis septembre. Je n'ai pas vu d'autre exemple de progression régulière de cette ampleur.

21 avril, 2006 09:03  
Blogger Jean Véronis a écrit...

Timuche> Télique -- Le mot télique existe en philosophie, il veut dire "dirigé vers un but, une fin" (télos en grec). Je m'amuse ici avec tela le latin pour la toile (WWW -> TTT : Tela Totius Terrae). Il est vrai que tellaire sonnerait peut-être mieux, mais je faisais un petit clin d'oeil à tellurique (latin tellus, la Terre).

21 avril, 2006 09:16  
Anonymous Anonyme a écrit...

Je vote pour l'excellent échelle de Véronis. Excellent «post», encore une fois! -- Cédric

21 avril, 2006 09:24  
Anonymous Chandon a écrit...

Encore une fois, félicitations Jean pour cette idée et cette démonstration.
Je vote aussi pour l'échelle de Véronis :) Attention les chevilles !!!

Même si j'émets quelques réserves sur l'intérêt réel de ces courbes (puisque finalement elles ne sont que le reflet d'une frange de l'iceberg internet), je suis TRES séduit par ce second degré :)
J'en redemande sur d'autres sujets de comparaison !!!

21 avril, 2006 10:26  
Anonymous Quentin a écrit...

Très bonne idée cette échelle !
En revanche Jean, je pense que l'étalonnement de l'échelle n'est pas encore idéale. Si la crise du CPE est déjà entre 8 et 9, comment sera donc classée une vraie guerre civile (qui en viendrait aux armes), un attentat multiple, une déclaration de guerre à notre pays, une catastrophe nucléaire... ?

Il est bien prétentieux peut-être de classer déjà si haut les évènements connus.
Si l'échelle de Richter indique que 9 correspond à un évènement qui ne se produit qu'une à deux fois par siècle, alors classer le CPE entre 8 et 9 est trop fort ! Combien y-a-t-il eu de manifestations de cette ampleur le siècle dernier ? Beaucoup ! Et des plus grosses... 1968, Algérie, école libre, etc...

Qu'en pensez-vous ?

21 avril, 2006 11:58  
Blogger Jean Véronis a écrit...

Quentin> Oui, on peut discuter sur l'étalonnage! La vraie échelle de Richter donne "une fois par an" pour les séismes entre 8 et 9. Des crises comme celle du CPE il n'y en a quand même pas des masses (heureusement!)...

21 avril, 2006 12:20  
Anonymous Merome a écrit...

A surveiller, dans les mois qui viennent, les courbes de "pétrole", "pic pétrolier", "réchauffement de la planète", puisque c'est ce qui nous pend au nez... J'espère personnellement que "décroissance" connaîtra également un pic à cette occasion. (Ou : comment diffusez une idéologie politique dans un commentaire d'apparence anodin sur un outil empirique mais rigolo :) ).

21 avril, 2006 14:12  
Anonymous Nicolas Voisin a écrit...

CPE cela s'écrit sans faute possible... as-tu tenté d'intégrer les milles et unes écritures de banlieu(e)(s) ; j'avais beaucoup de visites en provenance de google pour "banlieux" personnellement, un positionnement comme un autre ;)

[post relayé]

21 avril, 2006 16:25  
Blogger Jean Véronis a écrit...

Nicolas> Oui, c'est vrai, il faudrait affiner (mais comme je disais, ça demande du vrai travail, ça n'est plus pareil, là ;-)

21 avril, 2006 16:37  
Anonymous Anonyme a écrit...

J'apporte mon bulletin à l'adoption de Véronis pour l'échelle ad'hoc.
Cette étude en profondeur des infuences comparées de la statique verbale avec la dynamique des remous est superbe. Il n'est pas, à mon sens utile de compliquer le modele.
Encore félicitation pour cette avancée des sciences de l'impact.
PlumCake

22 avril, 2006 20:29  
Blogger Loran Bernardi a écrit...

Bonsoir,
moi aussi j'aime beaucoup!

Je vois quand meme un petit probleme de norme, si le web (dont la blogosphere) continue a s'accroitre et surtout si le
moteur de dir.com crawle plus de page tous les jours on risque d'avoir une augmentation nette du nombre de toutes les occurences et donc une croissance dans l'echelle... non?

23 avril, 2006 22:35  
Blogger Jean Véronis a écrit...

Loran> Oui, il faudrait réétalonner dans le temps...

24 avril, 2006 11:30  
Anonymous bijou contemporain a écrit...

pourquoi reetalonner alors qu'il suffirait d'utiliser une echelle relative (max-min)/min ?

24 avril, 2006 13:44  
Anonymous koz a écrit...

Intéressant ! Surtout le fait de comparer le bruit de divers "scandales". Il est notamment frappant de mesure l'impact relatif des émeutes et du CPE...

24 avril, 2006 19:51  
Anonymous Eric C. a écrit...

Billet intéressant (comme d'habitude :)), mais je crains que l'étalonnage choisi ne provoque un biais favorisant les évènements "habituellement rares" (i.e pour lesquels le signal moyen sur la toile est faible).
Pour un terme nouveau, si j'ai bien compris comment fonctionne le chronologue l'intensité du pic dépendra au premier ordre de la période sur laquelle la moyenne s'effectue, et donc de l'échelle de temps choisie.
C'est un peu dommage ... ou à retravailler :)

25 avril, 2006 11:21  
Anonymous Fred Bird a écrit...

excellent idée, et j'aime beaucoup l'humour de la conclusion...

04 mai, 2006 13:52  
Anonymous Anonyme a écrit...

c'est un blog absolument passionant!

toc, je m'abonne! Serai t'il possible d'utiliser vos outils pour s'amuser chez soit? les mettre en GPL? ;)

Et quel langage de programmation utilisez vous?

Continuez ainsi!

08 mai, 2006 17:01  
Blogger Jean Véronis a écrit...

Anonymous> Pour l'instant je ne diffuse pas. Trop bricolé. Et de toutes façons certains outils ne peuvent fonctionner qu'en interaction avec des fonctions spéciales côté moteur de recherche (qui ne sont pas publiques). Langages: Perl, Php et C++ côté moteur.

08 mai, 2006 17:13  
Anonymous wawa a écrit...

Je propose une autre formule pour donner plus d'ampleur aux créations de mots du type "Villepingate"
ln[(max+1)/(min+1)]

17 mai, 2006 20:04  
Anonymous wawa a écrit...

D'autant que des amplitudes de 20000 entre min et max pour des mots apparaissant des millions de fois sur le WEB, on en voit tous les jours...

17 mai, 2006 20:07  
Anonymous Timuche a écrit...

Merci pour votre réponse ^_^

Pour ma part, je faisais résonner "télaire" avec stélaire... je trouvais la connotation poétique.

Entre temps, je suis tombé sur la version latine de wikipédia (en cherchent TTT, je vous remercie de l'avoir porté à ma connaissance). Et j'y ai vu qu'ils utilisaient RETE pour traduire Net. Or l'adjectif "réticulaire" existe déjà en français.
Ne serait-il donc pas envisageable de donner à "réticulaire" une acception dans le domaine informatique ? Ou de repartir de RETE, -IS, -IUM ?


_____________________________
PS : j'ai effectivement changer de plateforme de blogue ^^

10 juin, 2006 08:28  
Anonymous Timuche a écrit...

Oups ! "changer" -É, naturellement -_-

10 juin, 2006 08:44  

Enregistrer un commentaire