Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

vendredi, mars 30, 2007

Discours 2007: Des voisins bruyants

Les mots ont des voisins, qui font parfois entendre une petite musique intéressante à décrypter. Ainsi, si je vous dis climatique, il y a de bonnes chances que vous pensiez réchauffement, et que ce soit justement un mot qu'on trouve de façon statistiquement significative à proximité du mot climatique dans les discours. Je viens de mettre en ligne un outil qui permet de chercher les voisins d'un mot donné — en termes savants on dirait ses co-occurrents. Le résultat apparaît sous forme de nuage.

Essayons climatique. On obtient :


En cliquant sur un mot du nuage on obtient l'affichage de tous les contextes où ce mot apparaît dans le voisinage de climatique. Exemple :



Ceci n'est qu'une copie d'écran, mais dans la version originale, en cliquant sur les extraits on accède au texte intégral avec les mots colorisés.

On peut également, et c'est là que ça devient intéressant, à mon avis, comparer les voisins d'un même mot chez les différents candidats. Prenons par exemple le mot travail, que tout le monde utilise, même si c'est dans des proportions différentes. Pour Nicolas Sarkozy, la valeur travail est en crise, il faut restaurer le mérite et l'effort.


Ségolène Royal, est, elle aussi, attachée à la valeur travail, mais elle s'intéresse aux conditions de travail, et aux salariés :


François Bayrou, lui, insiste sur les charges sociales qui pèsent exagérément sur le travail, sur la pénibilité qui doit être prise en compte pour le droit à la retraite :


Quant à Jean-Marie Le Pen, il défend la liberté du travail, qu'il relie au sens de l'effort, comme Sarkozy, et à l'amour de la patrie.


Assez fidèle, non ?

Mais c'est plus intéressant quand on joue soi-même. A vos souris !

Libellés :


26 Commentaires:

Blogger Gabrouze a écrit...

Pensez-vous que Arlette veuille trouver un Logement pour Ségolène :o)

30 mars, 2007 11:16  
Blogger Jean Véronis a écrit...

Hôtel particulier rue du Faubourg Saint-Honoré ?

30 mars, 2007 11:20  
Blogger Gabrouze a écrit...

En tout cas, joli boulot !
j'ai essayé ceci
et il n'y a pas de voisins. Faut il plus d'une occurrence dans votre algorithme ?

30 mars, 2007 11:24  
Blogger Gabrouze a écrit...

Désolé encore moi : j'ai essayé cela aussi.
à première vue c'est plutôt négatif mais si on regarde les phrases il y a le verbe exonérer qui renverse totalement le sens du nuage.
Peut être qu'en ajoutant les verbes en nuances de bleu par exemple, cela donnerai une idée plus juste des co-occurrences.

30 mars, 2007 11:31  
Blogger Jean Véronis a écrit...

Pas de voisins : oui, j'ai imposé qu'un voisin apparaisse au moinsn 3 fois pour être pris en compte. mais c'est peut-être un peu violent, je viens de ramener à 2.

30 mars, 2007 11:34  
Blogger Jean Véronis a écrit...

Sur impôts+exonérer, c'est peut-être mieux avec la nouvelle version (nb voisins >= 2) : ici

Non?

30 mars, 2007 11:36  
Blogger Gabrouze a écrit...

tout à fait, l'effet de bord est positif :o)

30 mars, 2007 11:39  
Anonymous Hélène a écrit...

Très intéressant comme outil...

Je viens d'essayer amour

C'est vraiment très intéressant !

30 mars, 2007 12:03  
Anonymous wawa a écrit...

Assez drôle oui. Finance par exemple, n'a aucun voisin pour la plupart des candidats pris 1 à 1, à l'exception de Sarkozy (ha bon ?).

Mais si on les prend en bloc, d'étranges (quoique) similitudes apparaissent.

30 mars, 2007 13:40  
Blogger Jean Véronis a écrit...

Oui, finance n'a pas beaucoup de voisins, parce que c'est un mot assez peu utilisé. Ca m'a étonné, d'ailleurs !

30 mars, 2007 13:57  
Anonymous Armor a écrit...

Epatant !
On peut jouer entre amis :
Quel est le candidat pour lequel "femme" a polygamie comme mot voisin : Le Pen, Sarkozy, De Villiers ?
Quels sont les candidats dont les discours ne comportet pas le "femme" ?

30 mars, 2007 14:16  
Anonymous LB a écrit...

Jean !! Tu es dans le nuage des voisins de l'Education de LePen... avec la nomenklatura !!

Beaucoup de candidats restent muets au sujet de l'Education...

Pour les autres, c'est assez intéressant... on a coeur, budget, quartier populaire, nationale... et on a même un ministre.

30 mars, 2007 16:41  
Anonymous Rouget de Lisle a écrit...

Salut à tous,

Excusez-moi pour ce HS, mais j'ai une question qui me trotte dans la tête.
A propos de La Marseillaise dont il a été fait mention récemment sur ce blog, que ce signifie exactement "Contre nous de la tyrannie".
C'est un passage du 1er couplet.
Est-ce qu'il s'agit d'une structure archaïque? Est-elle encore valable de nos jours?
Une p'tite explication SVP.


Merci d'avance
PS. Jean, j'ai 27 ans et je connaissais le nom du 1er Pdt.
Pas de quoi s'allarmer, on est pas tous incultes ;-)

30 mars, 2007 18:22  
Blogger Jean Véronis a écrit...

LB> Ouais, JMLP m'a à la bonne depuis que je dis du bien de lui, tu ne savais pas ?

30 mars, 2007 19:14  
Blogger Jean Véronis a écrit...

Cher Capitaine (Rouget, je veux dire : déjà, Rouget, c'est un peu bizarre, comme prénom...),
Je crois qu'il faut lier ce vers au suivant :

Contre nous de la tyrannie,
L'étendard sanglant est levé !


Et comme au XVIIIe siècle, comme Maître Yoda, à l'envers tendance à parler ils avaient, j'ai de penser la faiblesse que cela vouloir dire :

Contre nous l'étendard sanglant de la tyrannie est levé !

Au fait, que veut dire ce mot fabuleux ?

Quunsangimpurabreuvenossillons

On dirait du Queneau !

PS: je ne m'alarme pas : tout le monde n'est pas étudiant ;-)

30 mars, 2007 19:18  
Anonymous Jean-Christophe a écrit...

Toujours aussi inventif et intéressant…!
À suivre…!

30 mars, 2007 20:56  
Blogger Jean Véronis a écrit...

Merci Jean-Christophe (et un gros bisou à la "Musicienne de Sol") !

30 mars, 2007 21:05  
Anonymous Benoit a écrit...

C'est formidable cet outils :-)

Il permet de définire des ontologies sur n'importe quel thème, avec un champ sémantique très très large!

Merci.

30 mars, 2007 21:46  
Anonymous Dominique a écrit...

Je m'insurge, il faut prononcer kunsankimpur, exactement comme lorsque le contrôleur de train vous annonce Bourkenbress.

30 mars, 2007 23:53  
Anonymous Rouget de Lisle a écrit...

Merci pour la réponse rapide.
Incollable le Jean.

31 mars, 2007 12:44  
Blogger Kaa a écrit...

Ce qui serait intéressant, maintenant, c'est d'ajouter des Voisins par relation, comme ceux de LeMonde de Bourigault, tu ne crois pas ?

02 avril, 2007 14:44  
Blogger Robin a écrit...

Bonjour,

je trouve intéressant ce travail, surtout parce qu'il s'inscrit dans la société. Je veux dire que souvent les scientifiques font des trucs un peu sans rapport avec des choses (que j'estime) importantes et notamment la politique.

Ceci dit, il me semble que c'est un outil qu'il faut manipuler avec précaution. Par ce que finalement, on peut justifier des idéologies en prenant la science comme argument, et donc l'illusion de l'objectivité. On peut faire tout dire aux résultats des co-occurences...

02 avril, 2007 23:38  
Anonymous mmontaigne@hotmail.fr a écrit...

Alors ca c'est formidable comme outil : je prépare un mémoire sur la vision de l'entreprise (création d'entreprise) à l'UDF, l'UMP et le PS, et je viens de gagner je ne sais pas combien d'heure !
Le résultat est marrant, d'ailleurs

Pour Sarko, entreprise, c'est chef et responsabilité
Pour Bayrou, c'est petite entreprise et esprit
Et pour Ségo, c'est jeunesse et créativité

Et au passage, c'est Arlette Laguiller qui utilise le plus le mot, et de loin !

Merci beaucoup, (et vive le hasard qui m'a amené ici)


Emmanuel

03 avril, 2007 01:28  
Blogger Sophia a écrit...

Ce commentaire a été supprimé par l'auteur.

03 avril, 2007 19:35  
Anonymous Thy a écrit...

Bonjour,

C'est bien d'avoir mis ce petit outil en ligne.

Pour un terme (ou une RE) donné(e), cela pourrait-être intéressant d'effectuer par exemple une analyse factorielle ou une classification avec comme variables principales l'union des voisins de chaque candidat, afin de pouvoir constituer des cartes thématiques pour situer graphiquement les candidats les uns par rapport aux autres. Je vais essayer de le faire manuellement pour voir.

04 avril, 2007 08:20  
Anonymous Anonyme a écrit...

dans votre joli outil discours, il manque ceux de pétain... en cherchant un peu sur le web, on parvient à de "jolis" résultats en rapprochant le maréchal et sarkozy

08 avril, 2007 17:08  

Enregistrer un commentaire