Orange: Présidentielle et requêtes des internautes
Les moteurs de recherche constituent un observatoire sociologique tout à fait fascinant, j'ai déjà eu l'occasion d'en parler sur ce blog, pour le meilleur et pour le pire. Sagesse (ou folie) des foules : la masse des requêtes permet par exemple de déclencher des alertes épidémiologiques de façon aussi réactive que les autorités sanitaires (voir par exemple "Google Grippe"). J'ai eu l'opportunité de me pencher sur les logs de requêtes du Moteur d'Orange (que je remercie au passage pour m’avoir autorisé à publier cette étude). Certes, le volume est moins important que sur Google, mais avec plusieurs millions de requêtes par jour (une représentation de près de 15% des internautes français d’après Médiamétrie), il est néanmoins suffisamment grand pour permettre des observations intéressantes.
Je me suis demandé ce que les logs disaient sur la campagne présidentielle en cours. J'ai observé pour cela le volume des requêtes mentionnant les cinq principaux candidats (par ordre alphabétique, Bayrou, Hollande, Le Pen, Mélenchon, Sarkozy) depuis le 1er janvier. Voici les résultats (j'ai bien entendu filtré certaines requêtes hors sujet comme celles concernant Carla ou Guilia Sarkozy).
Comparons d'abord les courbes des deux principaux candidats (cliquez pour agrandir) :
L'entrée en campagne proprement dite de François Hollande (plus la présentation de ses propositions que le meeting du Bourget, d'ailleurs) et celle, officielle, de Nicolas Sarkozy, ont déclenché des pis d'intérêt importants. Néanmoins, à part ces pics initiaux, et quelques répliques par-ci par-là au gré des meetings, la dynamique est assez morose : les volumes de requêtes confirment le désintérêt (voire l'agacement) assez marqué des français que révèlent les sondages pour la campagne en cours. On notera cependant que Nicolas Sarkozy fait un peu mieux que François Hollande. Même si le niveau moyen reste bas, chacune de ses interventions déclenche plus de passions que celles de François Hollande, qui visiblement est à la peine, dans les sondages comme sur le moteur.
En ce qui concerne les troisièmes hommes (ou femmes) potentiels, les requêtes semblent aussi confirmer ce que nous disent les sondages : tassement de Marine Le Pen, stagnation de François Bayrou — et essor de Jean-Luc Mélenchon. Marine Le Pen était bien partie, mais visiblement après le débat avec Jean-Luc Mélenchon, la tendance s'est inversée : la dynamique est désormais favorable à ce dernier.
On voit d'ailleurs, en agrandissant la partie correspondant au mois de mars, qu'à partir du meeting à la Bastille, Mélenchon a rattrapé Hollande. Si les requêtes reflètent l'intérêt, ou en tout cas la curiosité, des internautes, le candidat socialiste a peut-être quelques questions à se poser — d'autant que la période égalitaire des temps de parole va compliquer la donne !
Les sondages ne font pas l'élection. Les moteurs de recherche non plus. Mais ils nous disent manifestement des choses, et je vais suivre tout cela avec beaucoup d'intérêt dans le mois qui vient !
14 Commentaires:
Bonjour !
Vos outils sont toujours très intéressants ; merci !
Je souhaiterais savoir si vous étudiez aussi les mots utilisés dans des requêtes, par exemple le nom d'un candidat éventuellement associé à des mots informatifs, péjoratifs ou autre ("X. économie", "Y. propagande", "Z. démagogue", etc.).
Est-ce un axe de recherche intéressant ?
Eh oui, bien entendu, je regarde ça de près, et c'est extrêmement intéressant. Beaucoup de recherches pratiques (par exemple "site officiel francois hollande" ou "video débat le pen mélenchon"), mais aussi pas mal de requêtes du type de celles que vous dites (parfois assez affligeantes, comme celles liées à la religion des gens, ou aux potins du moment...).
Bonjour,
Parmi les 5 candidats, il me semble que Hollande a une caractéristique particulière: son nom est ambigü avec un nom de pays. Comment filtrez-vous les logs de requêtes pour lever cette ambiguïté ? Je pose la question mais je ne suis pas sûr qu'on puisse toujours le faire dans les cas où la requête n'inclut pas le prénom parce qu'on ne sait pas forcément ce qu'avait en tête la personne qui a posé la question (à moins d'utiliser les informations de sessions et de voir sur quels résultats elle a cliqué).
Petite expérience: il est amusant de voir que, sur Google, avec une requête "Hollande" simple, les sept premières réponses correspondent à François Hollande, avant plusieurs réponses sur le pays. Avec une requête "Hollande économie", les deux premières réponses concernent l'économie des Pays-Bas, avant d'avoir des résultats sur la position du candidat sur l'économie.
Bonjour,
Oui, j'ai contrôlé ça. Comme pour 'Carla Sarkozy'.
Les requêtes concernant la Hollande sont extrêmement rares, fort heureusement. Je les ai filtrées en enlevant tout ce qui contient "en hollande", "de la hollande", et une série classique se rapportant aux pays : "voyage", "chambre d'hote", "camping car", etc.
Mais vu les proportions cela ne change que quelques pouillèmes.
Et je suppose que l'équivoque sur «Poutou» n'a pas non plus une influence trop marquante.
Non, là, on est dans l'homéopathique de toute façon...
Méprisance,
Méprisance,
Quelle aisance, notre président pour sa présidence ..
Selon vous, Jean
Néologisme ou lapsus ?
Le mot existait en Moyen-Français... Peut-être que Nicolas Sarkozy souhaite montrer qu'il a lu avec bravitude Montaigne ou Rabelais.
Les mots de Nabot :
http://www.lherbentrelespaves.fr/nabot.html
Cordialement
MV
AU SUJET DU COMMENTAIRE TRES SUCCINT DE MAX VINCENT SUR LE NABOT. LA LONGUEUR DES MOTS N'EN FAIT PAS L'INTELLIGENCE ?
Des fois oui, des fois non.
L'usage répété du mot "compatriote" ou de l'expression "mes chers compatriotes" par Sarkozy est-il, à votre avis, spontané ou réfléchi. N'est-ce pas un regard jeté en direction des populations des D.O.M et des T.O.M?
Bonjour,
comment gérez vous les fautes d'orthographe (une fréquente: Mélanchon) ?
Je ne l'ai pas géré (honte à moi). Mais votre remarque est très pertinente. Les résultats concernant Mélenchon sont donc sous-évalués.
Enregistrer un commentaire