Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

dimanche, juin 23, 2013

PRISM: Orwell en a rêvé, les US l'ont fait


2 Commentaires:

Anonymous Anonyme a écrit...

Notons que la France n'est pas en retard dans l'orwellisme, elle vient de changer le sens des mots par la loi, ce qui est le principe de la novlangue.

23 juin, 2013 13:31  
Anonymous Mathieu a écrit...

Très interessant, ça me rappelle un bouquin que j'ai lu récemment, "Châtelet-Les Halles" d'Alex Gaspard. Un petit chef-d'oeuvre à mon goût. Il brosse un tableau à la fois romanesque et hyper-réaliste de la société parisienne d'aujourd'hui. Les scénarios sont très bien ficelés, avec des références historiques et culturelles fidèles. Un peu philosophique parfois. Chaque histoire est un univers. Une vraie plume. Y'a quelques extraits sur http://gaspardmetskaia.blogspot.com
Si vous avez d'autres bons bouquins récent à me conseiller, idéalment sur Kindle ou Kobo, je suis preneur ;-) Mathieu


16 juillet, 2013 22:01  

Enregistrer un commentaire

mercredi, janvier 23, 2013

Podcast: Qu'est-ce que le traitement automatique des langues ?

Vous me lisez beaucoup (enfin, moins ces temps-ci, mea culpa !), mais si vous voulez aussi entendre ma superbe voix, voici un podcast d'une interview réalisée il y a quelques jours pour Science alors !, l'émission scientifique de Radio Campus Clermont :


L'émission s'appelait L'homme et la machine, avec pour invités Bertrand Nouailles, philosophe, et Hélène Chanal, enseignante-chercheuse en robotique de production à l'IFMA. On peut la retrouver ici.

4 Commentaires:

Anonymous Cochonfucius a écrit...

Merci pour cet intéressant document.

23 janvier, 2013 11:08  
Anonymous Anonyme a écrit...

Bonjour,

Je viens de m'amuser à lire la controverse sur Qwant et je me demandais si vous comptiez en parler sur aixtal ?

Quand on voit comment le pauvre bloggeur anonyme se fait lyncher pour avoir enoncé des faits qu'on peut tous vérifier, je me dis qu'au moins ici, ils n'oseront pas.


Bonne soirée,
Djamé

19 février, 2013 00:11  
Anonymous Jessica a écrit...

Alala le scandale QWANT, on en entend plus parler 3 semaines après (déja)

08 mars, 2013 14:57  
Anonymous techmed a écrit...

Sujet passionnant comme tout ce qui nous fait réfléchir sur notre avenir anthropologique.

04 juin, 2013 10:57  

Enregistrer un commentaire

mercredi, janvier 16, 2013

e-Reputation: Droit à l'oubli et autres réflexions

Marie Jung de 01 Business & Technologies m'a demandé ce que je pensais de l'e-reputation, les questions de droit à l'oubli, les logiciels de veille, etc. L'interview est dans la version papier, et aussi sur le site de 01net :

Une page c'est déjà pas mal, mais j'ai l'impression qu'on n'a fait qu'effleurer la surface, tellement il y aurait de choses à dire !


7 Commentaires:

Anonymous Cochonfucius a écrit...

Quelques beaux sujets de stage (et de doctorat).

17 janvier, 2013 13:39  
Anonymous Thierry a écrit...

Merci !

Mais vous vous faites bien rare depuis quelques temps...

A quand de nouveaux outils rigolos comme le "Pourrissez votre texte" ou d'analyses de corpus linguistiques ou de discours divers ?

Une idée, au hasard : un générateur de promesses électorales (tenues ou non)... :-)

18 janvier, 2013 02:56  
Anonymous e réputation a écrit...

ce sont des outils de gestion e-réputation?

18 janvier, 2013 13:19  
Anonymous Anonyme a écrit...

Oui, les limites à donner au droit à l'oubli pour les entreprises n'est pas facile à déterminer. mais il faut au minimum lui donner la possibilité de faire oublier les faux avis de consommateurs, malveillances et autres diffamations qui circulent sur Internet dans certains métiers comme le tourisme... La législation actuelle permet des actions, mais c'est souvent trop tard...
Par ailleurs même si c'est bien vrai que l'analyse de sentiments n'est pas chose simple, çà fait quand même des choses déjà utilisables, ... et même utiles...

18 janvier, 2013 17:45  
Blogger Jean Véronis a écrit...

Bonjour Bernard ! Une interview, même un peu longue comme celle-là, ça force toujours le trait. C'est un raccourci de deux heures de conversation avec la journaliste (qui a fait un très bon travail de résumé d'ailleurs). Le droit à l'oubli est extrêmement difficile à cerner et pas que pour les entreprises. Pour les individus aussi. Affaires privées qui touchent quelqu'un de connu, par exemple. Sans parler de cas aussi énormes que DSK, dans quelle mesure le public a-t-il de droit à l'information -- qui s'oppose en quelque sorte au droit à l'oubli ?

Le cas que tu mentionnes est emblématique. Il y avait eu des études montrant que la proportion de commentaires frauduleux (à charge ou à décharge) est extrêmement important : casser un concurrent, ou jouer les trompettes de sa propre renommée, tous les moyens sont bons, y compris des "fermes à avis" dans des pays émergents...

Ce n'est même pas du droit à l'oubli à mon avis : dans un internet civilisé cela ne devrait pas exister. Mais l'espace de "liberté" qu'est censé être internet est aussi, hélas, souvent une jungle hors lois. Comment le restaurant lambda peut-il lutter contre une attaque d'avis malveillants ? Porter plainte ? Prouver quoi ? Bonjour la galère...

Ce qui me frappe c'est le manque de débat dans la société face à ces sujets gravissimes pour les libertés...

18 janvier, 2013 19:38  
Blogger Jean Véronis a écrit...

Thierry> Oui, je me fais rare. J'ai un gros projet en préparation, et ça me prend toute mon énergie, et même un peu plus. J'aurai sans doute l'occasion d'en parler ;-)

Pour le générateur, vous connaissez sans doute l'hilarant :
Pipotron

18 janvier, 2013 19:40  
Anonymous Pilou a écrit...

Au bout de combien de temps Socrate a-t-il le droit que l'on oublie la cause et les circonstances de sa mort ?

23 janvier, 2013 21:32  

Enregistrer un commentaire

jeudi, décembre 06, 2012

Expertises vocales: Lettre à Jérôme Cahuzac

Monsieur le Ministre,

Je me permets de vous faire parvenir cette information qui peut vous être utile dans les circonstances actuelles.

La plupart des chercheurs en technologies du langage considèrent que les expertises vocales manquent totalement de fiabilité en l'état actuel de la technique, et qu'elles peuvent difficilement aboutir à l'identification des individus — a fortiori quand les enregistrements sont de mauvaise qualité.

Une pétition a même circulé il y a quelques années, lancée par la Société Française d'Acoustique et le Groupe Francophone de la Communication Parlée :
Vous trouverez un exposé grand public de ce point de vue ici:
et un article par mes collègues Louis-Jean Boë et Jean-François Bonastre dans le Journal du Syndicat de la Magistrature :
Ce sont, à mon sens, les meilleurs spécialistes français sur la question.

Bien cordialement,

Jean Véronis, Professeur (Aix-Marseille Université)
Ex-président de l'association pour le Traitement Automatique des LAngues (ATALA)

6 Commentaires:

Anonymous Anonyme a écrit...

Vous laissez "bien cordialement" si les faits sont avérés ? (et probablement sous la forme d'un compte numéroté anonyme, faudrait il qu'il soit aussi débile, surtout pour cacher si peu - 400k ?)

06 décembre, 2012 19:52  
Anonymous Cochonfucius a écrit...

Quoiqu'il en soit, une telle mise au point est bienvenue.

08 décembre, 2012 15:55  
Anonymous fran6t a écrit...

Y-a-t-il pas confusion entre reconnaissance vocale (pour faire reconnaitre un ordre ou une dictée) et empreinte vocale ? Dans le cas qui nous interesse il y aurait tout de même des éléments à comparer soit nous sommes avec une empreinte vocale proche auquel cas on ne peut rien en déduire soit nous sommes dans une empreinte vocale complètement éloigné dudit ministre et auquel cas c'est un usurpateur (je vois mal le ministre avoir changé son timbre non ?).

12 décembre, 2012 21:36  
Blogger Jean Véronis a écrit...

Non, non, il s'agit bien d'identification, pas de reconnaissance. Ce que les articles ci-dessus disent, et avec eux toute la communauté scientifique, c'est que les "empreintes" vocales n'existent pas, contrairement aux empreintes digitales.

13 décembre, 2012 21:21  
Anonymous Luc a écrit...

S'il y a une pétition contre les méfaits de la graphologie dans les services RH des entreprises qui ont la pensée magiques, je suis aussi preneur...

30 décembre, 2012 15:19  
Anonymous RH a écrit...

Puisque c'est l'actu du week-end, pensez vous traiter du fameux "mariage pour tous", débat riche en sens et contresens divers et multiples.

C'est à ma connaissance la première fois qu'un gouvernement veut changer le sens d'un mot. Quelles sont les conséquences prévisibles et imprévisibles de ce fait inédit ? Peut-on envisager que ce fait se reproduise jusqu'à devenir courant ? L'Etat pourrait-il devenir l'éditeur officiel du dictionnaire français (un peu comme dans le roman d'Orwell) ? Pourquoi personne n'en parle ? Bref, quantité de questions là dessus...

11 janvier, 2013 17:33  

Enregistrer un commentaire

mercredi, octobre 17, 2012

Conf: Big Data et Technologies du Langage

Je fais une présentation demain matin dans le cadre des Assises du Big Data, du Stockage et des Bases de données organisée pas le CRIP. Pour ceux que cela intéresse et qui ne pourraient pas y être (et même pour les autres), voici un petit résumé :

Big data et technologies du langage
Jean Véronis

Les données massivement accumulées par des sociétés comme Google ont permis des avancées considérables dans le traitement du langage humain par des machines (recherche d'information, traduction automatique, etc.). En quelques années, plus de progrès ont été accomplis que dans le demi-siècle qui a précédé, au risque d'une certaine frustration pour le chercheur qui peut avoir à juste titre l'impression que la compréhension des phénomènes lui échappe. L'exposé décrira ces progrès, ainsi que les défis qui restent à relever et qui peuvent changer la face de l'accès à l'information au cours des décennies à venir.
Voici également les slides. Je ne sais pas si elles sont totalement compréhensibles sans le discours, mais je suis tout à fait prêt à en discuter en commentaires !



12 Commentaires:

Anonymous olivier ertzscheid a écrit...

salut Jean.
Belle présentation. Dans les problèmes (tu en parleras surement), celui qui me semble essentiel est celui de la maîtrise des corpus (voir par exemple ici : http://affordance.typepad.com/mon_weblog/2012/02/far-web-near-me.html)
Amitiés
Olivier.

17 octobre, 2012 15:39  
Blogger J2J2 a écrit...

J'aime beaucoup cette question : "Les Big Data ne nous mettent-elles pas dans le même inconfort intellectuel que la physique quantique ?".
Je pense effectivement que la réponse est oui !!!

17 octobre, 2012 16:11  
Anonymous Jacques Bolo a écrit...

Pour les antécédents lire plutôt de Umberto Eco, La recherche de la langue parfaite.

17 octobre, 2012 16:20  
Blogger Jean Véronis a écrit...

Olivier> Merci pour ton lien (que je remets ici cliquable). J'avais vu passer ton billet, sans avoir hélas le temps de commenter. Une de tes remarques m'avait frappé. En substance tu dis que dans l'histoire des sciences d'ordinaire on établit des corpus de données après avoir mis au point des outils d'observation, alors qu'avec le Web c'est l'inverse. C'est tout à fait juste, et du coup, on en fait quoi de toutes ces données ?

J'ai moi-même coordonné de gros projets de collecte de corpus linguistiques dans les années 90, et j'ai finalement cessé, en constatant que nous avions finalement une "Data Overdose". Des tas de corpus, et nous n'avions ni outils, ni méthodes, ni personnel pour s'en servir...



17 octobre, 2012 21:14  
Blogger Jean Véronis a écrit...

Jérôme> C'est comme si on avait une bonne carte et une bonne boussole, mais qu'on soit totalement dans le brouillard. Navigation aux instruments...

17 octobre, 2012 21:16  
Blogger Jean Véronis a écrit...

Jacques> C'est mon livre de chevet -- la première lecture que je conseille à mes étudiants.

17 octobre, 2012 21:17  
Anonymous Cochonfucius a écrit...

Je retiens "Il ne suffit pas d'avoir des données" (d'ailleurs, je m'en doutais un peu...)

18 octobre, 2012 13:10  
Anonymous Anonyme a écrit...

En abordant les choses naïvement, on a cette série : données (= observations) -> confirmation/infirmation de modèles existants -> construction de nouveaux modèles dont la valeur prédictive est meilleure relativement aux "données".

Sauf que ce serait plutôt une boucle : modèles/outils -> observations (les données sont les "produits indirects" de ces modèles/outils) -> confirmation/infirmation -> construction de nouveaux modèles.

Voilà pour la démarche scientifique. Et la construction de nouveaux modèles suppose qu'on maîtrise bien les modèles en amont de l'agrégation de données... sans quoi on ne peut pas bâtir de modèles meilleurs, plus "intégrateurs". D'où, avec les big data, une difficulté nouvelle : la masse de données risque de faire oublier le fait qu'elles sont produites, que ces données sont déjà structurées par les outils de collecte. Imaginons par exemple que Google ait accès au nombre de visiteurs sur tous les sites du web... sans savoir combien de temps chaque visiteur passe sur chaque page : quelle fiabilité pour les prédictions relatives au fait de lire une page, de cliquer sur une publicité, etc.?

Ce qui me frappe, c'est plutôt ceci : le mot (paradoxal, donc) de "données/data" incite à invoquer tout de suite les modèles scientifiques (cf. la possibilité de construire des modèles épidémiologiques via des données web) alors que ce qui progresse le plus vite, ce sont des outils web (cf. Google Translate), construits empiriquement. Google Translate ne fait pas avancer la "science" de la traduction, seulement les outils mis à disposition des internautes.

En un mot: j'ai l'impression que le mouvement « Big Data » se nourrit de lui-même en se donnant de plus en plus de moyens empiriques pour récolter des données de plus en plus utiles (à quelques uns.) Et il y a sûrement des problèmes scientifiques nouveaux (notamment statistiques) liés à la gestion de ces quantités énormes de données, mais je ne comprends pas comment ces problèmes pourraient être propres aux données collectées -- je parierais plutôt sur le fait qu'ils surgissent de façon contingente. Moralité : je ne crois pas que ce soit comme si nous avions découvert un champ nouveau de la physique -- comme ce fut le cas pour la physique quantique !

Voilà pour quelques rêveries. En tous cas merci pour la présentation !

18 octobre, 2012 17:23  
Blogger Jean Véronis a écrit...

Cochonfucius> Oui, je crois qu'on est sur la même longueur d'onde !

18 octobre, 2012 21:48  
Blogger Quentin a écrit...

L'annonce des "ngrams 2.0" de Google tombe à pic (ou alors, un jour trop tard pour la présentation) ! Je trouve intéressant que ces outils dépassent le TAL pour intéresser le grand public.

19 octobre, 2012 12:11  
Anonymous Michel G. a écrit...

Bonjour Monsieur Véronis,

Excusez ma question de béotien. De quels logiciels dispose-t-on aujourd’hui pour résumer des documents (académiques, administratifs, techniques, financiers) de manière succincte et néanmoins pertinente et user-friendly? Il y a quelques mois, les média se faisaient l’écho d’un jeune britannique qui avait mis au point un logiciel du nom de summly. Je n’en trouve plus la moindre trace. Probablement encore une étoile filante de l’Internet. Y en a-t-il d’autres ?

Merci d’avance.

19 octobre, 2012 14:08  
Anonymous Lisa a écrit...

je tiens à vous féliciter pour le travail formidable que vous effectuer à travers ce blog.

30 janvier, 2013 11:30  

Enregistrer un commentaire

mardi, octobre 09, 2012

Trendsboard: L'app mobile #PepsiBuzz est sortie

Comment créer un magazine automatique sur smartphone qui fasse remonter le meilleur (ou le pire ;-) des buzz pour les ados (13-17 ans) sur des sujets déterminés (musique, sports, LOL, ciné, people) ? Et en plus, comment mélanger de façon pertinente les news (médias, blogs), les tweets des célébrités, les vidéos Youtube ?


Lorsque Pepsi a confié cette mission à Trendsboard, la plateforme que nous avons imaginée avec Benoît Raphaël il y a quelques mois, j'ai eu un moment de méditation profonde... accompagné aussitôt de quelques sueurs froides. Bien entendu, j'ai quelque expérience de la chose, et les cinq années passées auprès de Wikio m'ont un peu aguerri à la problématique de l'agrégation de contenus ! Mais cibler une tranche d'âge, voilà qui était un challenge nouveau.

Catégoriser les contenus en se basant sur les entités nommées, les termes et autres astuces, je crois savoir faire : 30 ans de recherches dans le domaine du traitement du langage, ça doit aider un peu ou alors il n'y a plus qu'à aller ramasser des champignons. En revanche, ramener Rihanna et Shy'm mais pas Johnny Hallyday ou Sheila (qui font aussi le buzz ces temps-ci...), c'est plus compliqué. Et comme je suis paresseux, je n'ai pas envie de créer à la main des bases de données avec des milliers de personnalités et termes "certifiés 13-17" ! Accessoirement, attraper les meilleurs tweets, les bonnes vidéos, touiller tout ça dans un bon équilibre... ceux parmi vous qui connaissent la jungle du Web 2.0 (tiens le compteur est bloqué), le merdier (pas d'autre mot) que constitue Youtube, et le foutoir (désolé) qu'est Twitter — ceux-là conviendront que l'affaire avait de quoi susciter quelques craintes (et comme toujours la cerise c'était les délais ;-)

Eh bien, le challenge a été relevé, avec l'ami Thomas (mon bras droit des regrettés Wikio Labs) pour la techno, le talentueux Julien pour le design, Fuzu Media pour le client mobile... et je suis très fier du bébé (pour télécharger: iOs, Android) !

J'entends bien sûr déjà dans le cénacle des fidèles lecteurs, qui préfèreraient me voir disserter — comme j'ai aussi plaisir à le faire — sur les étymologies grecques et latines, quelques voix qui murmurent en tournant discrètement l'index sur le front : le pauvre Professeur @Aixtal s'égare. Pfff... des trucs pour les djeunzs. Savent ni lire ni écrire : LOL, MDR, etc.

Je ne vous livrerai pas mes recettes (ou alors pas avec les bonnes proportions de farine et de sucre !), mais je dois avouer qu'en plus de zinzin, je suis probablement pervers, car j'y ai pris énormément de plaisir. Contrairement à ce qu'un regard trop rapide pourrait laisser penser, il y a de gros défis derrière cette petite app que nos ados vont mater sous les bancs des collèges ! Si vous me suivez depuis quelque temps, vous le savez : j'adore prendre les choses futiles très au sérieux [Citation nécessaire] — sans me prendre trop au sérieux, du moins je l'espère.

Ou alors c'est peut-être sérieux, en fait : imaginez la même chose dans le domaine de l'économie, de l'environnement, de la santé... Ah oui, vous comprenez mieux où on va avec Trendsboard ? ;-)


3 Commentaires:

Anonymous Cochonfucius a écrit...

Cela me semble prometteur !

10 octobre, 2012 11:21  
Anonymous ofnik a écrit...

OK, on peut faire l'impasse sur les proportions, mais on peut avoir deux-trois ingrédients quand même ?
Parce que là, c'est du vice de mettre l'eau à la bouche comme ça, sans filer même une petite bouchée ;-)

10 octobre, 2012 11:25  
Anonymous Anonyme a écrit...

Je parie que le nombre de fautes d'orthographe est un critère déterminant :-) OK, je sors.

10 octobre, 2012 12:06  

Enregistrer un commentaire

mercredi, octobre 03, 2012

Trendsboard: Analyse d'un buzz cochon

Lorsque j'ai écrit mon billet sur le fermier qui se fait manger par ses cochons (hier), j'ai eu le sentiment qu'il contenait tous les ingrédients pour un bon buzz en France. Insolite, décalé, un peu gore, les internautes (et donc les médias) adorent.

Je ne m'étais pas trompé. Hier soir, l'histoire était en une de Trendboard FR (c'est-à-dire que c'est elle qui a été le plus partagée sur les réseaux sociaux), avec pas moins de 10 médias qui l'ont reprise : 20 Minutes, BigBrowser (Le Monde), LeProgrès, Le Figaro, etc.. C'est 20 Minutes et BigBrowser qui raflent de très loin la mise (le nombre à gauche de la news indique le volume de partage sur une échelle de 0 à 10) :



La génèse de ce buzz est un cas d'école intéressant. L'événement s'est produit lundi dans la matinée dans l'Oregon, heure locale, c'est-à-dire en fin de journée pour nous. La première news (en tous cas, que j'aie pu repérer) est apparue sur le site d'une télé locale, KMTR, (et évidemment relayée sur les ondes) vers 1h de l'après-midi (c'est-à-dire en soirée heure française). Elle a commencé à être reprise au niveau national en soirée (par exemple ici à New York), c'est-à-dire en pleine nuit pour nous.

Comme je l'expliquais hier, la toute nouvelle plateforme Trendsboard US a repéré le buzz pendant mon sommeil, et il est apparu gentiment sur notre dashboard au p'tit déj. J'ai publié mon billet en fin de matinée, et j'ai attendu tranquillement la suite, en observant les pigeons.

Le suspect habituel sur ce genre d'histoire, BigBrowser, le collectif de journalistes du Monde qui surveille "le meilleur d'Internet" pour nous, publie un article à 15h24. Ils lisent peut-être mon blog, mais de toute façon c'est le genre d'histoire qu'ils repèrent quotidiennement. Je présume que la détection est faite à la main, avec Google News, un Google Reader truffé de sources insolite US, etc. (aparté: les amis, ce serait intéressant d'en discuter ;-) Ca marche d'ailleurs très fort. BigBrowser, spécialisé dans ce genre de buzz insolite (l'orang-outan qui fume, etc.) est régulièrement en tête des news les plus partagées dans nos outils, et en tout cas, enterre littéralement les articles classiques du Monde. Le coup des cochons a rapporté plus de 5200 likes au Monde.fr au moment où j'écris, l'article bien plus sérieux sur les entrepreneurs pigeons à peine 600. En termes de nombre moyen de partages par article publié, c'est le média (ou assimilé) qui se tient régulièrement en pôle position sur nos outils. Sur les sept derniers jours, par exemple, seule Najat Vallaud-Belkacem a fait mieux (mais ce n'est pas un média, n'est-ce pas ?).


Les autres médias (qui lisent aussi mon blog et surtout BigBrowser...), s'engouffrent dans l'appel d'air et publient eux aussi sur la fable triste du fermier et des cochons. Le plus réactif a été 7sur7.be vers 16h, mais tous les autres ont publié en fin de journée à partir de 19h. Les succès ont été divers. 20Minutes s'en tire très bien, mais pour les autres c'est mitigé, voire même parfois complètement raté.

Il y a de nombreux facteurs qui font qu'un article va être repris sur les réseaux sociaux, cela tient au site, à sa stratégie, à son image, à son ergonomie, etc. Ce serait trop long d'en discuter ici. Un facteur très important, néanmoins, c'est la rapidité. Le premier qui se place inonde ses amis et followers et c'est plus difficile pour ceux qui arrivent après. Une partie du public potentiel a déjà vu, et ne partage plus. Le Like est un fusil à un coup. BigBrowser a réagi assez vite, en milieu d'après-midi, mais avec de bon outils, l'article aurait pu être publié dès le matin.

Les Britanniques l'ont compris. Le DailyMail a carrément publié l'histoire à 4h du matin. Douze heures avant les plus rapides des médias français, 16h avant les autres.

L'information moderne est devenue une compétition féroce. Google News ne fait pas tout. La part des réseaux sociaux dans l'audience est de plus en plus critique. Réussiront ceux qui savent prendre ce virage, et... s'outiller.




5 Commentaires:

Anonymous Jacques Bolo a écrit...

Sur la citation du jour: Chomsky peut dire que je ne crois pas à la liberté d'expression, quand il défend la liberté des gens qu'il méprise. Mais il y a toujours des conséquences. Le mépris en est une. Une sanction administrative une autre (dans le cas de Faurisson). Chomsky confond les principes abstraits et la réalité (c'est son problème épistémologique notoire)

http://www.exergue.com/h/2010-10/tt/chomsky-negationnisme.html

03 octobre, 2012 11:00  
Anonymous Olivier a écrit...

J'ai l'impression très subjective que la qualité de l'information a nettement baissé sur le site du Monde avec l'irruption de Facebook. En effet, le site tend à maximiser le nombre de Likes et le résultat est assez terrible. Les internautes mettent surtout des "I Like" pour des anecdotes rapides, insolites et amusantes et pas tellement pour des articles longs et documentés sur la vie politique et diplomatique intérieure ou extérieure, surtout quand il s'agit de nouvelles peu réjouissantes (guerres civiles, attentats, etc.). Résultat, le site du monde, en particulier ses blogs style bigbrowser, tend à relayer les informations les plus anecdotiques et les plus mal documentées (il faut aller vite) au détriment des articles de fond. En outre, les titres deviennent de plus en plus sensationnalistes, réducteurs et trompeurs...

03 octobre, 2012 15:59  
Anonymous Anonyme a écrit...

Aujourd'hui en tête des plus partagés : "Le premier bar dédié à la masturbation féminine a ouvert au Japon".
"L'information moderne est devenue une compétition féroce" : est ce encore de l'information ? Ou du divertissement. Où conduisent la course de vitesse et la recherche de l'anecdotique ?

03 octobre, 2012 20:25  
Anonymous Cochonfucius a écrit...

Rétrospectivement, les recueils de "Brèves de Comptoir" de l'ami Gourio sembleront des puits de sagesse.

04 octobre, 2012 15:29  
Blogger Monde en Question a écrit...

Vous écrivez "Le coup des cochons a rapporté plus de 5200 likes au Monde.fr". On se sait rien du nombre de likes des autres médias, mais même pour Le Monde c'est peu.
Beaucoup de bruits pour pas grand chose...

10 octobre, 2012 16:15  

Enregistrer un commentaire

mardi, octobre 02, 2012

Trendsboard: Analyse du buzz #geonpi

Vous avez sans doute croisé ce mouvement né dimanche, qui s'est autobaptisé Les Pigeons: mouvement de défense des entrepreneurs français. Un hashtag sur Twitter (#geonpi) avec plus de 6100 tweets au moment où j'écris, une page Facebook avec plus de 24 000 likes, des articles dans tous les grands quotidiens... Plus d'une agence de com en rêverait.


Tout est parti d'un papier de Jean-David Chamboredon (patron d'un fond d'entrepreneurs internet) dans La Tribune : Une loi de finances anti-start-up? qui expliquait grosso modo que la loi de finances en préparation allait tuer les startups. L'argument est frappant (je résume) : en taxant les revenus du capital comme ceux du travail, un actionnaire de startup verrait son bénéfice amputé de 60% à la revente (impôt sur le revenu + CSG/RDS). Ce chiffre s'est avéré faux (voir ici) mais il reste néanmoins élevé, et même les plus modérés (par exemple Benoit Raphaël dans ce billet) se demandent s'il ne s'agit pas purement et simplement d'un "bug" dans le projet de loi, qui va être aussitôt rectifié. L'inquiétude est réelle : qui voudra alors, dans ces conditions, encore investir dans des startups en France ? La mesure serait contradictoire avec l'orientation même qu'affiche le Président de la République : favoriser l'innovation, la recherche, les petites entreprises...

Aussitôt Twitter s'enflamme sur le hashtag #geonpi, les patrons de startup en tête, et bien entendu je branche mes outils, c'est-à-dire désormais la plateforme Trendsboard dont je vous ai déjà parlé ici et ici. L'argument est simple :

Et le feu d'artifice est lancé :


Pour l'instant, le mouvement ne semble pas faiblir. La courbe montre les deux journées d'hier et d'aujourd'hui, avec le repos nocturne inévitable. Un pigeon ça dort aussi.

Je suis évidemment le hashtag #geonpi, mais la plateforme Trendboard de repérer les autres hashtags, les mots-clés qui gravitent autour du thème, les users influents, pour les tracer (traquer ?) au fur et à mesure. Voici par exemple les principaux hashtags qui se sont développés autour de ce "meme" (tiens, il tombe en désuétude ce mot?) :

J'ai un peu de perte, parce que je n'ai lancé l'outil que lundi matin... La v2 permettra de remonter le temps (si), mais il nous reste un peu de travail (on finit d'astiquer la Deloreane).

Voici les URLs les plus retweetées (Le Figaro: peut mieux faire !) :
http://www.lemonde.fr/economie/article/2012/10/01/pigeons-la-grogne-des-entre... (539)
http://www.lefigaro.fr/hightech/2012/10/01/01007-20121001ARTFIG00594-les-crea... (332)
http://www.liberation.fr/economie/2012/10/02/entrepreneurs-des-pigeons-pas-si... (264)
http://www.lemonde.fr/politique/article/2012/10/01/auto-entrepreneurs-des-cra...  (206)
http://www.lesechos.fr/economie-politique/france/actu/0202299715898-la-france... (187)
http://www.rue89.com/rue89-eco/2012/10/01/le-gouvernement-va-tuer-les-start-u... (165)
https://www.facebook.com:443/lespigeonsentrepreneurs (164)
http://www.facebook.com/lespigeonsentrepreneurs (162)
http://lentreprise.lexpress.fr/creation-entreprise/les-pigeons-les-entreprene... (151)
http://www.youtube.com/watch?v=LNFgRFSWjsQ (148)
http://tempsreel.nouvelobs.com/economie/20121001.OBS4174/exclusif-fleur-pelle... (137)
http://defensepigeons.org/ (133)
http://www.latribune.fr/opinions/tribunes/20121001trib000722180/une-loi-de-fi... (130)
http://www.latribune.fr/opinions/tribunes/20120927trib000721685/une-loi-de-fi... (123)
http://lentreprise.lexpress.fr/ (119)
http://www.henriverdier.com/2012/10/pourquoi-je-veux-pas-etre-un-pigeon.html (115)
http://www.tudisquoichinois.com/2012/10/cest-qui-les-pigeons-mouvement-de.html (99)
http://korben.info/les-pigeons.html (95)
http://lexpansion.lexpress.fr/entreprise/les-entrepreneurs-pigeons-volent-dan... (92)
http://www.youtube.com/watch?v=FttYnLBzIdU (91)
http://www.federation-auto-entrepreneur.fr/petition.php (90) ...
Comme toujours mes outils retournent l'analyse sémantique, et l'image est assez instructive... On voit en particulier que le débat s'est vite entremêlé avec celui des autoentrepreneurs qui se sentent également lésés dans la nouvelle loi de finances. Les intérêts des uns et des autres divergent pourtant largement par le nombre de 0 qu'ils peuvent aligner devant le symbole €... Il y a de gros pigeons et des petits, mais finalement une certaine solidarité aviaire semble s'être créée :


Les influenceurs sont assez intéressants à observer également. Je regrette de ne pouvoir vous inclure une version cliquable (saleté de plateforme de blogs archaïque). @DefensePigeons est le compte "de la marque" en quelque sorte (à qui j'ai volé l'image du pigeon incluse en tête d'article), on y reconnaît aussi les comptes des medias qui ont relayé l'info, et les principaux "activistes" — d'un bord comme de l'autre, car des communautés et contre-communautés se sont formées au fil du temps.


Le paysage est beaucoup plus amusant à regarder de façon dynamique. Pour l'instant je ne suis pas en mesure de vous générer une animation, je dois donc vous décrire avec des mots. On peut dire que globalement, la journée d'hier a été dominée par les "pigeons", avec quelques très timides soutiens à droite (Valérie Pécresse et NKM) à part les activistes habituels (@MadameMichu par exemple) — peut-être pour ne pas donner le sentiment d'un mouvement manipulé ou récupéré ? ou bien l'UMP s'est-elle endormie jusqu'aux élections? Puis Fleur Pellerin réagit, et la réaction se fait entendre de façon progressive et de plus en plus soutenue. Le #pigeon bashing se met en place. Ténors : @rosselin, @sebmusset, etc.

Et cet après-midi, à 14h11 très exactement, Florent Latrive (@latrive) lance un petit tweet ironique qui n'a l'air de rien :


Le tweet en lui-même n'est retweeté qu'une fois, mais un contre-hashtag est né: #geonpistyle, sur le monde Gangnam style, je suppose. Florent ne se décourage pas, et récidive :


Cette fois c'est le jackpot (à quoi cela tient-il le succès d'un tweet... à l'heure du café ou pas!). Le #geonpistyle est lancé et les twittos se déchaînent. Extraits :


De méchants twittos disent que c'est #gauchostyle. En tout cas, j'espère qu'on peut être entrepreneur et avoir le sens de l'humour !

Je suis quant à moi comme @LaPeste, je ne m'en lasse pas:


2 Commentaires:

Anonymous Fabrice Epelboin a écrit...

"à quoi cela tient-il le succès d'un tweet... à l'heure du café ou pas!"

...ou a une mailing list :D

03 octobre, 2012 11:54  
Anonymous Cochonfucius a écrit...

Lien publicitaire offert par Google:


Système Anti Pigeons
Fini les désagréments causés par les Pigeons. Contactez les Pro.
www.br3d.fr

03 octobre, 2012 17:37  

Enregistrer un commentaire

Trendsboard: La version US c'est parti !

Grande excitation chez Trendsboard ce matin. Un nouveau bébé est né...! La version US commence à tourner. Déjà plusieurs milliers de sources, et les buzz commencent à arriver sur nos écrans. On peut dire que c'est une version 0.0.0.1 : il y a encore énormément de travail, mais d'ores et déjà, je sens que c'est un outil qui va devenir le compagnon indispensable des salles de rédac. Prenons par exemple cette histoire, qui buzze depuis quelques heures aux US :



N'y a-t-il pas un bon article à faire pour la rubrique Insolite de quelques journaux en ligne ? Personne ne l'a encore fait en français, si j'en crois Google News... 
On vous tient au courant. Et pour en savoir plus, suivez-nous sur Facebook !



2 Commentaires:

Blogger Sammy a écrit...

Si, il y a un article sur le blog du Monde "Big browser" toujours à la pointe pour les infos décalées : http://bigbrowser.blog.lemonde.fr/2012/10/02/delicatessen-un-fermier-de-loregon-mange-par-ses-cochons/#xtor=RSS-3208

Sinon, c'est quoi trendsboard ? Le nouveau Wikio ?

02 octobre, 2012 17:31  
Blogger Jean Véronis a écrit...

Publié à 15h24, donc bien après mon billet. Je ne sais pas s'ils l'ont lu, mais effectivement BigBrowser fait a la mano (je suppose) ce que TrendsBoard fait de façon industrielle!

Wikio, non, et certainement pas dans le modèle économique.

02 octobre, 2012 17:38  

Enregistrer un commentaire

mercredi, septembre 19, 2012

Twitter: Analyse du buzz Charlie Hebdo

Je suis l'évolution de l'affaire des caricatures de Charlie Hebdo sur Twitter depuis hier après-midi, grâce à la plateforme Trendsboard que nous sommes en train de lancer avec mon ami Benoit Raphaël, et j'ai envie de vous livrer quelques observations...

Le buzz a commencé sur Twitter en début d'après midi, avant la publication des premiers articles de presse quelques heures après, et c'est seulement dans la soirée que Google News a mis l'affaire en Une. Contrairement à ce qui se passe souvent, où Twitter est une caisse de résonance pour les dépêches d'agences et les médias classiques, le réseau a bien été ici la source première d'information. A condition bien entendu d'avoir les bonnes connexions, ce qui est un peu le problème de Twitter. L'info y est, mais l'utilisateur lambda n'y est pas forcément exposé... Charlie n'est remonté dans les #TT (trending topics) que dans la soirée. Globalement, Google News ou les pages d'accueil des médias restent donc encore la source principale d'information pour une majorité d'internautes.

La courbe ci-dessous montre l'évolution du buzz sur 24 heures.

On voit qu'après la pause nocturne, le buzz s'est amplifié aujourd'hui jusqu'en milieu d'après-midi, mais qu'il est en fort déclin. Chacun y est allé de sa réaction, on tourne la page. En France du moins, car l'affaire va se propager dans le monde, et vendredi, jour de prière, les braises encore chaudes risquent de déclencher un incendie (les ambassades et écoles françaises à l'étranger seront d'ailleurs fermées...).

Ce qui est frappant dans les tweets que j'ai pu suivre (des centaines, ce que ne peut pas faire l'utilisateur moyen du réseau faute d'outils), c'est que les réactions de pure indignation vis à vis des caricatures sont finalement assez peu nombreuses. Il y a peut-être une sociologie de Twitter qui explique la chose en partie. Peut-être aussi que la majorité des musulmans souffre en silence et ne souhaite pas ajouter d'huile sur le feu. Un certain nombre de tweets, quant à eux, défendent la liberté d'expression, c'était attendu, mais il est intéressant de constater que la majorité d'entre eux accusent finalement Charlie de mercantilisme : faire parler de lui à n'importe quel prix au nom d'une pseudo liberté d'expression. Beaucoup soulignent une certaine médiocrité de l'hedbo ("Du temps de Choron, les caricatures auraient été en Une !", etc.).  L'article de presse le plus retweeté depuis hier est d'ailleurs un article du Plus de l'Obs, qui a pour titre "Charlie Hebdo" caricature Mahomet : pas du courage, mais du pur opportunisme, titre qui résume un grand nombre de réactions.

Voici par exemple les tweets les plus RT des 24 heures :


Et en bonus les principaux hashtags :


Les principaux users (les plus mentionnés, les plus retweetés, les plus prolixes — attention, Big Brother vous a repérés) :


Et voici enfin les principales entités nommées et termes détectés par ma technologie :


Intéressant de constater que les sujets d'entremêlent : Véronique Genest, Dieudonné, Jean-Luc Delarue... Ne vous demandez pas si Jamal Al-Hestomah est une erreur de mes algos. Ce n'en est pas une. C'est juste une blague de mauvais goût (mais je suis fier de l'avoir détectée, tous mes concurrents ne savent pas faire ça !).

L'outil continue de  tourner. A suivre, donc. En espérant que non : si je n'étais pas un mécréant je prierais pour que les choses se calment...

1 Commentaires:

Anonymous Cochonfucius a écrit...

Un outil productif !

03 octobre, 2012 17:30  

Enregistrer un commentaire

mercredi, juillet 04, 2012

Ayrault: Un discours sans surprise


[Tribune publiée sur lexpress.fr]

Pas de lyrisme dans le discours de politique générale de Jean-Marc Ayrault (voir le discours sur ma base des discours de politique générale de la Ve République). Le personnage ne nous a pas habitués aux grands élans d'enthousiasme et de grandiloquence, et il a été égal à lui-même: sérieux, sobre, technique. Bien que vieux routier des prises de parole à l'Assemblée (mais de l'autre côté des bancs), il ne se révèle pas non plus excellent orateur : il suit ses notes au plus près, bafouille à diverses reprises, donne du "Chers collègues" aux députés avant de se reprendre. La force de l'habitude sans doute !

Ce discours est donc sans surprise sur la forme. Sur le fond, il ne l'est sans doute pas plus: on est dans la continuité de la campagne de François Hollande, dont il reprend, fidèlement, un à un, les engagements. Bien entendu, la marge de manoeuvre est étroite pour le discours inaugural du Premier ministre dans le nouveau calendrier lié au quinquennat : comment pourrait-il annoncer des mesures contradictoires avec celles du candidat à la présidentielle ?

Mais la constance est ici frappante. Elle est d'ailleurs en droite ligne avec celle de la campagne du candidat Hollande, et de sa propre posture de Premier ministre depuis l'élection. Si elles ne nourrissent guère l'appétit médiatique (on cherchera en vain la "phrase choc"!), sobriété et constance ont peut-être comme vertu (et comme but) de rassurer l'opinion et les marchés en des temps mouvementés.

"Redressement", utilisé 22 fois

Rassurer est d'ailleurs clairement le filigrane du texte. Les mots qui fâchent, austérité et rigueur, n'y figurent que ponctuellement, et pour les récuser. Le mot le plus employé du discours (à part quelques mots obligatoires comme France ou gouvernement) est redressement (prononcé 22 fois). Peut-on faire un redressement sans rigueur demanderont quelques mauvaises langues?

Mais le mot rigueur est devenu inutilisable en politique depuis le fameux tournant de Mauroy: les mots s'usent... Le mot redressement a l'avantage d'être neuf. Il a aussi un avantage indéniable par rapport au mot rigueur. Il reporte le problème sur les prédécesseurs: on redresse quelque chose qui a été tordu, dégradé, abîmé. Comprenons au choix: cinq ans de sarkozysme ou dix ans de droite au pouvoir...

Le deuxième mot le plus important est celui de justice (prononcé 20 fois). L'association répétitive de ces deux mots (qui n'est pas sans rappeler l'ordre juste de Ségolène Royal) contient toute la stratégie Hollande/Ayrault. La rigueur (pardon, le redressement) passera si l'on a l'impression que les efforts sont justement répartis.

Un discours catalogue

Mais là non plus, il n'y a pas de surprise. Cette dualité était bien déjà le leitmotiv de la campagne. La fidélité au programme et aux thèmes présidentiels n'excluait pas forcément un discours qui prenne quelque hauteur propre. La Ve République a connu des discours visionnaires. Ceux de Chaban ou Rocard ont par exemple livré une analyse de la société française qui a fait date.

Il y aurait sans doute eu matière à une analyse en profondeur de la période de crise que nous traversons. Nous nous contenterons d'un discours-catalogue. Mais si l'on y songe, la vision et l'éloquence de Chaban et Rocard n'ont guère servi leur carrière politique ultérieure... Quant à la "nouvelle société", on l'attend toujours: les Français jugeront sans doute plutôt les résultats que les discours!

7 Commentaires:

Anonymous Merome a écrit...

Et un titre "dans" faute, c'est possible :)

04 juillet, 2012 11:29  
Blogger Jean Véronis a écrit...

pfff ! m... alors, mon doigt a fourché -- je corrige (un grand merci)

04 juillet, 2012 11:31  
Blogger lejournaldepersonne a écrit...

Les héros sont fatigués!

L'artiste : On dirait que tu t'emmêles les pinceaux?
L'artisan : Aucun risque... de pinceau, je n'en ai qu'un... et j'y tiens
L'artiste : Accroche-toi à ton pinceau dans ce cas... j'enlève l'échelle
L'artisan : tu es complètement marteau... pourquoi tu enlèverais l'échelle?
L'artiste : Pour décrocher la lune, t'as pas besoin de te raccrocher à la muraille de Chine
L'artisan : de quoi tu parles ? Tu peux décrypter s'il te plaît ?
L'artiste : tu es un artiste, non ? Pour que tu brilles, je ne crois pas que tu aies besoin de béquilles
L'artisan : tu es drôle, si tu enlèves l'échelle, j'ai toutes les chances de partir en vrille
L'artiste : tu n'as pas besoin d'échelle... accroche-toi à ton pinceau
L'artisan : je ne suis pas artiste peintre... mais tout au plus un peintre en bâtiment. Ce qu'on appelle : un artisan ... un artisan qui peint ... un artisan peintre.
L'artiste : et qu'est-ce que tu peins ?
L'artisan : je peins les choses comme elles sont
L'artiste : tu n'es pas un artiste alors... je ne te dis pas ma déception.
L'artisan : qu'est-ce que tu as contre les artisans ?
L'artiste : ça arrange bien les choses, je le sais... mais ça ne les change pas.
L'artisan : quoi que tu dises, quoi que tu fasses, un mur reste un mur
L'artiste : on peut toujours le détruire
L'artisan : pour quoi faire... pour le reconstruire le jour d'après?
L'artiste : non pour inciter les autres à ne plus en construire
L'artisan : 4 murs et un toit... nous en avons tous besoin
L'artiste : oui... je ne dis pas non... une maison... une prison... une raison
L'artisan : tu m'as l'air un peu dérangé... est-ce que je me trompe ?
L'artiste : je viens de bruler l'école d'où je suis issue
L'artisan : quelle école ?
L'artiste : l'école des arts et métiers
L'artisan : tu es complètement givré... tu vas te retrouver entre quatre murs
L'artiste : je voulais séparer les arts et les sots métiers.
L'artisan : il n'y a pas de sot métier
L'artiste : c'est ce qu'on dit quand on est sot!
L'artisan : selon toi, il n'y a que de sots métiers
L'artiste : ne me fais pas dire ce que je n'ai pas dit
L'artisan : tu as dit quoi?
L'artiste : qu'il n'y a que des sots pour exercer un métier
L'artisan : comment faire sinon pour vivre
L'artiste : on s'accroche au pinceau et on enlève l'échelle!
L'artisan : quelle belle chute
L'artiste : autrement, tu n'apprendras jamais
L'artisan : apprendre quoi?
L'artiste : que tu ne perds rien pour apprendre
L'artisan : je ne comprends même pas ce que tu dis
L'artiste : dans ce cas, il faut apprendre à peindre les choses telles qu'elles doivent être.
L'artisan : et elles doivent être comment ?
L'artiste : comme tu les as rêvées
L'artisan : je n'ai pas le temps de rêver... je ne veux pas crever.
L'artiste : tout est là... tu ne vis pas... tu crèves déjà.
L'artisan : dans ce cas, je ne suis pas seul, nous sommes plusieurs dans ce cas
L'artiste : j'enlève l'échelle ... accroche-toi au pinceau
L'artisan : merde, tu t'appelles comment... Jean-Marc Ayrault ?
http://www.lejournaldepersonne.com/2012/07/les-heros-sont-fatigues/

04 juillet, 2012 11:32  
Anonymous Cochonfucius a écrit...

Excellent.

07 juillet, 2012 16:50  
Anonymous Anonyme a écrit...

je chipote, mais comme vous êtes linguiste:
- "ne nous a pas habitué" : un petit s en plus? (accord du PP)
- "il ne s'avère pas excellent orateur": "s’avérer" = se vérifier, il vaudrait mieux "se révèle, se montre".

08 juillet, 2012 16:43  
Blogger Jean Véronis a écrit...

Merci de votre chipotage ;-)

Sur le 1er point : bien sûr !

Sue le 2e, l'emploi de s'avérer avec attribut du sujet est parfaitement admis et utilisé par les meilleurs auteurs ; voir le TLF. Mais je corrige quand même, beaucoup de gens trouvent cela incorrect...

08 juillet, 2012 22:07  
Anonymous Xavier a écrit...

"l'emploi de s'avérer avec attribut du sujet est parfaitement admis"

Soit, alors restons équanime face à la catachrèse...
C'était ma tentative de contribution au redressement productif.

09 juillet, 2012 12:29  

Enregistrer un commentaire

mardi, juillet 03, 2012

Outil: Un demi-siècle de discours de politique générale

France Culture a eu la gentillesse de m'interroger sur les discours de politique générale des Premiers ministres sous la Vè République, pour l'émission Le choix de la rédaction (écouter podcast). Je me suis replongé à cette occasion dans l'intégralité des discours, que j'avais mise en ligne en 2007 avec un moteur permettant de chercher des mots et des expressions, des outils statistiques simples, et une visualisation sous forme de nuages :


C'est très intéressant, et même émouvant, de relire ces discours à quelques décennies de distance. Ils constituent une véritable fresque, où chaque discours est une photographie instantanée d'une époque. Si l'on prend les mots les plus caractéristiques de ces discours, on voit qu'Algérie est le mot prédominant pour Debré (1959). Pas très surprenant, bien sûr... la France essayait de sortir d'une guerre qui ne disait pas son nom (on parlait pudiquement d'opérations de maintien de l'ordre). Pour Pompidou, c'est le mot expansion (ah, les 30 glorieuses !). Pour Couve de Murville (1968), participation (magistralement enterrée par le référendum de 1969). Pour Chaban (1969), société (la fameuse "Nouvelle société"... enterrée elle aussi !). Pour Barre (1976), inflation... (les 30 piteuses se dessinent !).

Il va falloir un peu de temps pour que la société commence à souffrir vraiment. Le début des années Mitterand était peut-être encore bercé par l'illusion que tout irait bien. On voit que le pic du mot chômage arrive avec Bérégovoy (1992) et Balladur (1993), suivi d'une embellie relative, puis d'une rechute (Villepin, 2005).



Le chômage ne s'est guère amélioré, mais Fillon, en 2007, préfère, lui, parler du travail (on sortait de la fameuse campagne "Travailler plus pour gagner plus"). Les mots sont comme des clous: l'un chasse l'autre. En 2010, il commençait à être clair qu'on ne travaillait pas plus et qu'on gagnait plutôt moins ("Je serai le président du pouvoir d'achat" nous avait promis le boss)... Du coup, Fillon oublie un peu le travail, et axe son discours sur les réformes. Tiens, ça nous ramène à Couve de Murville (1968), ça :




On a dit souvent que l'histoire bégaie. Cette base de discours nous le rappelle durement. Chaban n'avait-il pas déjà résumé tout notre problème en 1969 ?
De cette société bloquée, je retiens trois éléments essentiels, au demeurant liés les uns aux autres de la façon la plus étroite: la fragilité de notre économie, le fonctionnement souvent défectueux de l'Etat, enfin l'archaïsme et le conservatisme de nos structures sociales.
Nous verrons ce que dira Jean-Marc Ayrault cet après-midi (les mots absents parlent autant que les autres : je vous parie que ce ne sont ni rigueur ni austérité qui auront la vedette !). Et surtout, au-delà des mots, aura-t-il le courage de s'attaquer aux maux que décrivaient si bien ses illustres prédécesseurs ?

PS

2 Commentaires:

Anonymous Vie-publique.fr a écrit...

Dans la Collection des discours publics, nous recensons quelques déclarations de politique générale supplémentaires : http://www.vie-publique.fr/recherche/afsrecherche.php?C=10033&CAT=cdp&THEME_KEYWORDS=declaration%20de%20politique%20generale&SORT_ORDER=afs:weight|ASC-afs:pathlen|ASC-datemaj|DESC-type|DESC-DATE|DESC-titre_length|ASC&X=6&N=2

03 juillet, 2012 15:45  
Blogger Jean Véronis a écrit...

Merci pour ce lien !

03 juillet, 2012 15:47  

Enregistrer un commentaire

mercredi, mai 23, 2012

Législatives: Philippe et Catherine, les prénoms des candidats

J'ai publié hier la carte de la non-parité dans les candidatures pour les législatives. Voici aujourd'hui une étude des prénoms des candidats. Les grands gagnants sont Philippe et Catherine :


Ces prénoms nous disent des choses. En croisant avec les données de l'INSEE, on voit que Philippe et Catherine ont eu leur pic de popularité en 1963. On peut faire de même avec les prénoms les plus fréquents, Michel, Alain, Isabelle, Anne et les autres, et on a à peu près la même image : le candidat-député français tourne autour de la cinquantaine...


Quant à l'origine culturelle des prénoms, le tableau ci-dessus parle tout seul... Il énumère gentiment les saints du calendrier. Il faut descendre à la 70ème position chez les hommes avec un Mohammed (14 candidats) et à la 110ème chez les femmes avec une Fatima (5 candidates).

8 Commentaires:

Blogger A.N. O'Nyme a écrit...

Surprenant, d'ailleurs, ce pic de "Philippe" dans les années 60. On aurait pu penser que le souvenir d'un autre Philippe (Pétain) était encore assez vif, juste 20 ans après, pour rendre le prénom "tabou" pour au moins cette génération.

23 mai, 2012 13:37  
Anonymous Cochonfucius a écrit...

Hommage au fils du Général ?

23 mai, 2012 13:54  
Blogger Jean Véronis a écrit...

Je chercherais plutôt du côté des stars. Ca explique assez bien les Brigitte par exemple...

Gérard Philipe ?

23 mai, 2012 14:07  
Blogger A.N. O'Nyme a écrit...

@Cochonfucius: Ah, mais le fils du Général est né en 1921 : dans son cas le Philippe est très possiblement un hommage (ou en tout cas une influence) au vainqueur de Verdun !

@Jean V.: La référence aux stars est évidente, mais les modes de prénoms résultent à la fois d'influences positives (plein de Brigitte dans les années 60) et négatives (pas tellement d'Adolphe dans la 2e moitié du XXe). Ma suprise était que en l'occurence le positif l'ai emporté.

23 mai, 2012 21:47  
Anonymous Anonyme a écrit...

Le prénom de Petain était maréchal. Maréchal Pétain!

28 mai, 2012 10:27  
Blogger Curare- a écrit...

Née en 1962, Et dieu créa la femme,
Je fus la énième à m'appeler Brigitte ___

28 mai, 2012 22:11  
Anonymous sebastien a écrit...

effectivement, ce couplage prénom et age a été une de mes découvertes étant jeunes … et à partir d'un prénom il existe un pourcentage de chance de connaître l'age dun'e personne …

je ne sais pas si la police utilise cela mais je l'avais constaté très tot puisque au sein des différentes classes successives dans lesquelles je suis passé il y avait au moins 3 Sebastien chaque année …

devinez ma date de naissance …

Sebastien

31 mai, 2012 09:58  
Anonymous Cochonfucius a écrit...

Voir aussi prénoms et bac par Baptiste Coulmont

09 juillet, 2012 13:45  

Enregistrer un commentaire

mardi, mai 22, 2012

Législatives: Carte de France de la (non)-parité

Je me suis amusé à analyser la liste des 6611 candidats aux législatives diffusée par le ministère de l'Intérieur. On a largement dit dans la presse que 2646 de ces candidats sont des candidates, soit 40,0%. En comptabilisant les civilités, M. ou Mme, j'ai réalisé une carte de la parité par département (cliquer pour agrandir) :


Douze départements sont particulièrement vertueux et atteignent ou dépassent la parité, la palme revenant à l'Ariège, avec 60,0% de femmes candidates :


A l'inverse, on trouve quelques cancres... L'Outremer ne brille pas par son féminisme. A Wallis-et-Futuna, aucune femme sur les 6 candidats. Les autres DOM ne sont guère mieux lotis. En France métropolitaine, 14 départements n'atteignent pas un tiers de candidates. Bonnet d'âne pour la Corse-du Sud :



14 Commentaires:

Blogger A.N. O'Nyme a écrit...

Jolie carte; mais si je puis me permettre un commentaire technique, le choix des couleurs n'est pas des plus heureux. Un petit coup d'oeil sur le "color Brewer" peut-être ?

23 mai, 2012 09:14  
Blogger Jean Véronis a écrit...

Mieux comme ça?

Merci du lien, l'outil est très utile !

23 mai, 2012 09:43  
Blogger A.N. O'Nyme a écrit...

Si vous utilisez R pour les stats etc., il y a une "library" (Rcolourbrewer) qui implémente les schémas directement dans R...

23 mai, 2012 10:07  
Blogger Jean Véronis a écrit...

Ah, super ! merci pour toutes ces infos.

23 mai, 2012 10:20  
Anonymous Cochonfucius a écrit...

Bel outillage, en effet.

23 mai, 2012 10:55  
Blogger florent a écrit...

Bonjour,

Un détail que je ne comprends pas: le département des Côtes d'Armor est dans la liste des douze. Pourtant il a une couleur plus claire que son voisin le Finistère...
Et les numéro dans la table sont ceux de département? dans ce cas, c'est peut etre le bug car les cotes d'armor c'est le 22... pas le 24

23 mai, 2012 19:59  
Blogger Jean Véronis a écrit...

Ouh là!!! merci Florent, ce sont les 2A et 2B des Corses qui m'ont mis le bazar (quelle drôle d'idée quand même de numéroter des départements comme ça... c'est la cauchemar de l'informaticien moyen ça !).

J'ai corrigé, c'est la Dordogne, le 24 !

23 mai, 2012 20:16  
Anonymous jp a écrit...

En quoi 60 % de femmes représentent-ils une meilleure parité que 40 % ?

25 mai, 2012 17:52  
Blogger Jean Véronis a écrit...

Dans un système profondément inégalitaire, celui qui lance un signal positif n'est-il pas digne d'être remarqué ?

25 mai, 2012 18:46  
Blogger Cuvelier Etienne a écrit...

Bonjour,
Merci pour cette intéressante cartographie.
Je cherche aussi le fichier des candidats pour une autre étude mais n'en n'ai encore trouvé nulle trace. Pourriez-vous m’aiguiller ?
Merci.

29 mai, 2012 11:36  
Anonymous Anonyme a écrit...

"dépassent la parité"
comment dépasse-t-on la parité? Soit on s'approche de la parité soit on s'éloigne de celle ci.

30 mai, 2012 22:48  
Blogger Jean Véronis a écrit...

Oui, enfin... vous voyez ce que je veux dire, pas vrai ?

31 mai, 2012 07:29  
Anonymous Anonyme a écrit...

Bonjour,

Analyse très intéressante. Avez-vous pu récupérer une liste globale au format xls par exemple des candidats ? Sur le site du Ministère de l'intérieur, je n'ai pas trouvé de liste globale.

Merci

03 juin, 2012 12:14  
Anonymous Jesse a écrit...

Pardon mais la palme revient plutôt à la Dordogne et aux Hautes Alpes. Le reste est soit mysoginie, soit misandrie. Mais pas la parité qui suppose égalité. Attention aux mots...

09 juin, 2012 19:07  

Enregistrer un commentaire

Appli: France 2012 - Législatives

Vous avez peut-être téléchargé l'application France 2012 pour iPad et smartphones, que nous avons réalisée pour Radio France et l'AFP avec mes amis Benoît Raphaël, le graphiste Julien Tauvel et l'équipe Revsquare à New York (Benoît l'avait décrite ici). Attention, Véronis inside® ;-) Ce sont mes algorithmes qui sont à l'oeuvre pour tout le "backoffice", c'est-à-dire la détection des termes et entités nommées (personnes, lieux, partis et autres), le "clustering" (groupage des news sur le même sujet) et la catégorisation, l'analyse du buzz sur les réseaux sociaux, etc. — un ensemble de technologies que nous appelons Trendsboard, et dont nous vous reparlerons bientôt avec Benoît !

Je suis très heureux de vous annoncer la nouvelle version, qui va suivre les législatives jusqu'à la fin juin. Vous pouvez la télécharger sur l'AppStore ou Google Play.

Voici une copie d'écran de la Une construite automatiquement :


Des carrousels latéraux inspirés des jeux vidéos permettent de filtrer les nouvelles, à gauche, en fonction des thèmes :


 et à droite, en fonction des partis :


Enfin, la géolocalisation permet de filtrer les articles qui concernent votre région grâce à la détection des noms de lieux (avec la désambiguïsation made in Véronis, pour les cas comme Orange ou Cher...)


J'espère que vous aurez plaisir à tester cette application, qui est une première pour Radio France et l'AFP. J'en profite pour remercier au passage Joël Ronez, directeur des nouveaux médias de Radio France, assisté d'Alexandre Albert-Stewart, ainsi que Bernard Pellegrin, directeur adjoint de l'information à l'AFP, qui ont mis tout leur enthousiasme dans ce projet. Je sens que cette collaboration naissante augure de grandes et belles choses !

6 Commentaires:

Anonymous JB Gabellieri a écrit...

Dispo sur Androïd ? Un lien vers Google Play ?

22 mai, 2012 11:35  
Blogger Jean Véronis a écrit...

Oui, bien vu ! Je rajoute le lien dans l'article, merci.

22 mai, 2012 11:45  
Blogger Antoine Dubuquoy a écrit...

Voila le lien vers Google Play pour télécharger l'appli: http://tinyurl.com/7zkueys

22 mai, 2012 11:52  
Blogger Jean Véronis a écrit...

yes, merci ! http://tinyurl.com/7zkueys

22 mai, 2012 11:58  
Blogger Frédérique a écrit...

J'ai eu un peu de mal à comprendre le fonctionnement au début, mais ensuite, cette appli est vite devenue indispensable pendant les Présidentielles. C'est très bien de l'avoir prolongée pour les législatives, d'autant que je vote dans la commune de ma résidence secondaire, en Ardèche, et que, pour obtenir des infos ardèchoises quand on travaille à Paris, ce n'est pas si facile...

22 mai, 2012 19:15  
Anonymous Cochonfucius a écrit...

merci pour ce bel instrument !

23 mai, 2012 10:47  

Enregistrer un commentaire

samedi, mai 05, 2012

Présidentielle: La présence des candidats sur le Web entre les deux tours

Juste avant le premier tour, j'avais montré (ici), grâce à ma plate forme qui analyse en temps réel plusieurs milliers de sources (médias et blogs), que les volumes de citations sur le Web reflétaient d'assez près les mouvements d'opinion. Il faut bien sûr prendre tout cela avec prudence, car nous manquons d'études et de recul, mais on y voyait en particulier juste avant le premier tour, les trois tendances que les instituts de sondage n'avaient pas très bien estimées : le tassement de Jean-Luc Mélenchon, la percée de Marine Le Pen et une remontée assez franche de François Hollande.

Voici ce que donne la plate forme pour les deux finalistes sur les dernières semaines :


On voit que lors du premier tour les courbes sont très serrées, ce qui correspond grosso modo au résultat du scrutin. Le nombre de citations de François Hollande se tasse ensuite pendant toute la durée de l'entre-deux tours (ce qui est conforme à ce qu'ont observé les instituts de sondage). Puis le candidat socialiste remonte à égalité pour le débat, et dépasse très légèrement Nicolas Sarkozy sur la journée d'hier. Les courbes sont en tout cas très proches dans la dernière ligne droite. Je ne sais pas s'il faut croire la sagesse des foules du Web, mais il se pourrait bien, comme le disent certains, que cette élection se fasse sur le fil du rasoir...


1 Commentaires:

Anonymous Cochonfucius a écrit...

Le débat n'a effectivement pas montré de supériorité évidente d'un prétendant sur son adversaire. Le choix est donc libre, ce qui donne en général du "cinquante plus epsilon" et pas un succès franc et massif.

Le "clinamen" évoqué jadis par Lucrèce.

05 mai, 2012 16:00  

Enregistrer un commentaire

vendredi, mai 04, 2012

Débat: Moi, François Hollande

Tous les commentateurs ont relevé la tirade finale de François Hollande lors du débat qui l'opposait à Nicolas Sarkozy : Moi, président de la République... Répétée 15 fois. Une belle anaphore, figure chère à la plume de Nicolas Sarkozy, Henri Guaino, dont elle a été en quelque sorte la marque de fabrique en 2007 (voir étude ici et ici). Au-delà de cet écho, dont on ne saura jamais s'il était un clin d'oeil ironique, l'affirmation du moi chez le candidat socialiste, présenté souvent comme consensuel et rassembleur, voire « mou », a pu surprendre.

Je me suis livré à une analyse quantitative rapide sur l'usage des pronoms dans le débat par les deux protagonistes. Les résultats sont assez étonnants. On sait que Nicolas Sarkozy était un fervent adepte du moi et du je — égotisme linguistique sur lequel Ségolène Royal n'était pas en reste (voir détail ici, ici et ici). Avant-hier soir, c'est François Hollande qui s'en est fait le champion. Sarkozy et Royal utilisaient le pronom je 17 à 18 fois pour 1000 mots (en 2007), Hollande monte le curseur jusqu'à 22,6. Il ne rattrape pas tout à fait son modèle (gestuel et linguistique), François Mitterrand, qui battait tous les records avec 24 je pour 1000 mots, mais il s'en approche (on se peut sans doute pas rejoindre complètement Dieu). Nicolas Sarkozy est resté fidèle à lui-même, avec presque 17 je pour 1000 mots, comme en 2007. Le moi n'est pas en reste, puisque Hollande l'utilise carrément deux fois plus que Sarkozy (3,4 contre 1,6 pour 1000 mots).


L'usage de la première personne en complément (c'est-à-dire me) est également assez éloquent, puisque là, les fronts se renversent :


Nicolas Sarkozy prend le dessus. Ce n'est pas anodin : c'est un peu plus compliqué, bien entendu, mais comme on l'a en gros appris à l'école, le sujet agit, le complément subit. Et Nicolas Sarkozy était largement dans une séquence de victimisation lors du débat : Madame Aubry me traite de Madoff..., Monsieur Hollande peut me reprocher bien des choses... on m'a reproché... on me dit... Vous me faites une critique... etc.

En opposition, le vous, globalement accusateur, était prépondérant chez Hollande, qui a manifestement réussi à placer Nicolas Sarkozy sur la défensive pendant une grande partie du débat :



Enfin, comme je l'avais fait remarquer en 2007, les pronoms ne valent qu'avec des verbes, et c'est sur la formule je veux que Nicolas Sarkozy était véritablement champion toutes catégories (voir ici). Mais avant hier soir le je veux sarkozien était manifestement en berne. François Hollande voulait deux fois plus.



Comme disait René Char, les mots savent de nous des choses que nous ignorons d'eux...


4 Commentaires:

Anonymous Cochonfucius a écrit...

La sémiologie du discours des grands personnages sur leur modeste personne a de beaux jours devant elle !

04 mai, 2012 11:34  
Anonymous Grégoire C. a écrit...

Bonjour Jean,

Vous ne pensez pas que le "Moi, président de la république..." se veut un rappel de l'ablatif absolu latin, sur le mode du fameux Cicerone consule ?

Une écriture anticipée de l'histoire, en quelque sorte.

Une vanité, comme on dit en peinture.

À dimanche soir, pour l'allocution officielle : Moi, désormais président de la république…

04 mai, 2012 13:14  
Anonymous Anonyme a écrit...

Sortons un moment de l''approche proposée ici pour un rappel nécessaire.
La domination de l'idéologie du travail est telle que peu de commentateurs (aucun ?) avaient relevé cette déclaration d'un N.S que l'on peut à bon droit il me semble qualifier de Vichyssois de Neuilly (toutes choses inégales par ailleurs, comme il se doit) :
"Le travail c'est la liberté"

04 mai, 2012 21:10  
Anonymous Nathalie a écrit...

"le travail c'est la liberté", vu par Prévert et Grimault dans "Le Roi et l'Oiseau" (1980)
http://www.youtube.com/watch?v=BjOoCDKhPMA

06 mai, 2012 10:44  

Enregistrer un commentaire

mardi, mai 01, 2012

Google: Fichier juif ?


Avant-hier, TF1 a perturbé ma sieste dominicale en m'envoyant une équipe pour recueillir quelques mots pour le JT de 20h sur l'affaire du « fichier juif » de Google... Une séquence de fin de JT n'est pas un format qui se prête beaucoup à l'élaboration, et je me suis dit que je pourrais essayer de rassembler ici mes réfléxions sur le sujet. Je pense que tout le monde a désormais entendu parler de l'affaire. Plusieurs associations, SOS Racisme, le MRAP, l'UEJF et l'AIPJ, ont assigné Google en référé demain 2 mai pour « trouble manifestement illicite », estimant que le moteur contrevient à la loi française, qui interdit tout fichage ethnique, en associant fréquemment le mot juif à des noms de personnalités dans son module de suggestion.






Je ne suis pas juriste et je laisse d'autres bien plus qualifiés s'exprimer sur le sujet. Je me contenterai d'apporter modestement quelques éléments de nature technique au débat.


1. Le problème est-il nouveau ?

Non. Au contraire, il ressort régulièrement. A ma connaissance c'est Colombe Schneck qui avait soulevé le lièvre en mai 2009 sur France Inter (écouter l'émission, voir également sur le blog de Renaud Revel). Il a été redécouvert par Emmanuele Anizon sur Telerama.fr début 2011, article qui avait été relayé par Le Monde (15 février, article de Stéphane Foucart uniquement en archives payantes), le Nouvel Obs, etc.

J'avais fait moi-même remarquer sur ce blog en 2010 que d'autres suggestions de Google reflétaient les stéréotypes les plus désagréables sur les juifs, les noirs, les femmes, les arabes...


(voir aussi de beaux exemples en écho sur Slate et une analyse intéressante d'Olivier Ertzscheid).

2. L'explication de Google

L'AFP avait relayé la chose et Google m'avait répondu par le même canal (voir ici), expliquant qu'il s'agissait d'une agrégation automatique, pur « reflet de l'activité de recherche de tous les utilisateurs du moteur ».

La ligne de défense de Google cette fois-ci est globalement la même. La firme affirme que les suggestions se sont « aucunement issues d'un choix éditorial de la part de Google », mais « générées de manière totalement algorithmique, sur la base de critères purement objectifs ».

Google Suggest « apprend » en effet ce que les internautes ont tapé, et le restitue ensuite en fonction des premières lettres tapées par l'utilisateur (cet algorithme existe depuis 2004, et avait fait l'objet d'un de mes premiers billets sur ce blog).


3. L'algorithme peut-il être leurré ?

Les suggestions reflètent-elles les vraies fréquences naturelles de requêtes ou bien peuvent-elles être « spammées » ? On m'a posé plusieurs fois la question et l'on peut en effet légitimement se demander si les décomptes sur lesquels sont basées les suggestions ne sont pas faussées par des individus ou groupes organisés. Je n'ai évidemment ni certitude ni preuve, mais on peut se poser la question en voyant par exemple un certain nombre de requêtes qui, comme par hasard, correspondent à des titres de posts sur des forums...

Diverses techniques existent qui pourraient permettre de contourner les limites de Google (campagnes coordonnées, utilisation de proxies, programmes malveillants divers implantés à l'insu d'utilisateurs sur de nombreuses machines, Amazon Mechanical Turk, etc.) et qui pourraient leurrer Google quant au nombre de requêtes de tel ou tel type. L'idée a certainement déjà traversé l'esprit de quelques spécialistes de SEO, et on peut imaginer que des groupes d'idéologies ou d'intérêts divers puissent mener des attaques ciblées sur des personnes ou entreprises. Google pourrait expliquer si le phénomène existe et si des mesures particulières sont prises pour le contrecarrer.

Dans le cas précis de la plainte qui sera étudiée demain, je crois plutôt que l'association de nombreux noms avec le mot juif résulte d'une ambiance délétère, et d'un souci malsain qui est de « débusquer les juifs » pour reprendre les termes de l'avocat de SOS Racisme.


4. Cela concerne-t-il seulement les juifs ?

Non. Toutes les religions y passent. On se demande visiblement si Obama ne serait pas musulman, Zidane chrétien ou Jospin protestant :




Dans certains cas l'association est vraie, dans d'autres non.... C'est sans doute la faiblesse de la plainte déposée contre Google. Il est difficile de voir dans ces associations un « fichier juif ». Parmi les requêtes les plus proposées, on a « Sarkozy juif » ou « Hollande juif », mais à ma connaissance ce n'est la religion ni de l'un ni de l'autre (pas plus qu'Obama n'est musulman). Nous verrons ce que dit la justice demain.

Remarquons au passage que les associations ne concernent pas que les religions. Un certain nombre de dénominations plus ou moins injurieuses sont récurrentes :



Sur ce point, notons que Google a déjà été attaqué en justice (et a perdu plusieurs fois). Dès 2009, Direct Energie avait condamné Google pour l'association du nom de cette société avec le mot arnaque. A ma connaissance c'était le premier cas en France et le jugement est extrêmement intéressant à lire (ici). En 2010, un particulier s'était plaint de voir son nom associé aux doux qualificatifs d'escroc, sataniste, arnaque ou violeur et avait obtenu gain de cause (voir ici). En février, la société de vente directe de produits diététiques Kriss Laure a fait condamner Google à supprimer la suggestion kriss laure secte sous une astreinte de 2 500 euros par jour (voir ici).

Nicolas Sarkozy serait donc fondé (comme d'autres) à attaquer Google et gagnerait probablement selon cette jurisprudence.

Dans le cas des religions, c'est peut-être un peu différent. A nouveau, je ne suis pas juriste, mais il me paraît difficile de voir dans les mots juif ou musulman des insultes (j'espère !). Le point de vue judiciaire sur ce cas serait intéressant (mais apparemment ce n'est pas la ligne d'attaque qu'ont choisie les associations, puisqu'elle ne se plaignent pas d'une insulte mais d'un fichage illégal).


5. Google intervient-il ?

Oui. Contrairement à ce que la firme déclare le processus n'est pas totalement algorithmique, et il y a bien intervention humaine (même en dehors des cas imposés par la justice comme ci-dessus). Certainement pas pour ajouter des suggestions mais pour en filtrer certaines. Par exemple, il est assez simple de vérifier que « les arabes... », « les nègres... » ou « les youpins... » ne ramènent aucune suggestion. Il y a donc bien une liste d'exclusion, mais elle semble assez rudimentaire, et le choix des termes filtrés paraît assez aléatoire.

On peut d'ailleurs, de façon assez intéressante, voir sous la surface de l'algorithme car la liste ne semble pas inclure les fautes d'orthographe...






6. Des solutions techniques existent-elles ?

Oui. Il serait assez trivial pour une firme qui a les moyens de Google d'opérer des filtrages sur un certain nombre de « patrons » de requêtes correspondant à ce qui choque le plus apparemment les sensibilités, à savoir l'association d'un patronyme avec une liste de mots tels que juif, musulman, escroc, etc.


7. Pourquoi Google ne réagit-il pas ?

Seule la firme a la réponse. Le phénomène est connu depuis plusieurs années et Google ne souhaite visiblement pas intervenir. Même dans les cas qui ont porté à condamnation (comme l'association avec le mot escroc) on voit qu'aucune action globale n'a été prise (exemple « Sarkozy escroc » ci-dessus).


8. Faut-il réagir ?

Je n'ai pas un penchant réglementeur et liberticide, mais visiblement des gens ou des groupes sont dérangés, voire choqués, par certaines suggestions. Mais jusqu'où faut-il aller ? Les correcteurs orthographiques n'osent plus proposer le mot arabe ou le mot juif... Est-ce bien raisonnable ?

Le débat est donc nécessaire, et même salutaire.

*

Finissons sur une note d'humour sur le mode de l'arroseur arrosé :


Peut-être que la dernière suggestion est la bonne. Cela expliquerait toutes ces questions qu'on lui pose sur les religions : Il doit savoir...


12 Commentaires:

Anonymous Anonyme a écrit...

article très instructif comme toujours,
je crois qu'il y a une erreur dans la date 5/1/12 pour 1/5/12
Emmanuel

01 mai, 2012 23:11  
Blogger Jean Véronis a écrit...

merci pour le compliment ! et merci de me signaler le coup de la date... Visiblement Blogger me la met au format américain. Je vais voir si ça se paramètre.

01 mai, 2012 23:15  
Anonymous Anonyme a écrit...

déjà en mars 2011...

01 mai, 2012 23:59  
Anonymous EtienneB a écrit...

Il y a bien moyen de leurrer Google Suggest assez facilement.

http://www.deliciouscadaver.com/comment-definitivement-pourrir-la-e-reputation-de-quelquun-pour-5e.html

02 mai, 2012 01:21  
Blogger Jean Véronis a écrit...

EtienneB> Un grand merci pour ce lien (je le remets en format cliquable).

02 mai, 2012 09:06  
Blogger Unknown a écrit...

Pour le point 3, la réponse est apparemment oui et cela a déjà été pratiqué à grande échelle. Ici par des roumains pour améliorer la perception de leurs concitoyens par les internautes: http://www.seomoz.org/blog/romanians-are-smart-or-how-to-change-the-google-autocomplete-suggestions

02 mai, 2012 09:18  
Blogger Jean Véronis a écrit...

Xaxier> Merci pour ce lien édifiant (cliquable ici).

Vous comprenez mon usage prudent du conditionnel, dans une affaire en cours de jugement. Mais on va dire qu'il ya des indices convergents...

02 mai, 2012 09:38  
Anonymous elifsu sabuncu a écrit...

Un détail, mais pas vraiment...Juif n'est pas que une religion, et donc se demander si quelqu'un est juif n'est pas tout à fait seulement une question sur sa religion...Quand on veut stigmatiser voire persécuter un juif, on ne s'intéresse pas tant à sa religion qu'à son orgine familale, ethnique, culturelle, géographique, etc. ou une combinaison de tout ça. Je sais que c'est difficile pour pas mal de personnes de comrpendre ça, et pourtant...c'est vrai.

02 mai, 2012 15:50  
Blogger Jean Véronis a écrit...

Oui. Cela vaut pour toutes les religions d'ailleurs...

02 mai, 2012 15:54  
Anonymous sebastien a écrit...

Et si on prenait du recul … et qu'on acceptait que Google ne soit pas un oracle ?

Ce ne sont que des algo. qui peuvent être manipulés (par du spam comment ou autre technique BH) … de plus ces réponses sont relatives (géoloc par ex. et temporaires) …

Encore une fois, ce n'est qu'un outil ! Google suggest est la manifestation statistique de ce que cherchent les utilisateurs … et de plus cela peut être manipulé …

Demander à Google de filtrer ? sur quelle base ? ou et la limite ?

si la réponse à Google serait un algo pour limiter ces réponses, il y aurait d'autres pb liés car de personnes mal intentionnées pourraient retourner ce filtrage à leur avantage (ou ceux de leur client).

bref, avant de voir le mal chez les autres, regardons en nous !


Sebastien

10 juin, 2012 11:28  
Anonymous grugru a écrit...

Pour le dernier point, oui, google est bien Dieu , voici l'argumentaire :
http://www.thechurchofgoogle.org/

26 octobre, 2012 23:48  
Anonymous Anonyme a écrit...

Au états unis, l'origine ou la "culture", la religion d'une personne n'est pas un tabou, il suffit de chercher des célébrités sur wikipedia us, pour être renseigné quand la personne est juive, ou arabe ou autre.

D'ailleurs l'affaire de l'application iphone ou on pouvait chercher qui est juif et qui ne l'est pas était crée par un juif (sic)
Je crois que bcp de gens cherchent à savoir si quelqu'un est juif mais sans arrière pensé antisémite.
Moi qui suit d'origine arabe, je faisais une recherche sur isabelle adjani par hasard, et il y était fais mention qu'elle était d'origine maghrébine, je le savais mais j'ai eu plus de détails, ce n’était pas le but de ma recherche, mais cela m'a intéressé
, pas par communautarisme, ça je m'en fous, mais cela vous donne une vision différente de la personne que vous pouvez recouper avec vote histoire dans mon cas.

Et c'est la la vrai difficulté, comment savoir qu'une recherche est antisémite?

Si on enlève toute les recherches dites antisemites, finalement il doit rester que des suggestions racistes et elle doivent être minime.

Et puis finalement aussi, je me rappelle être tombé sur une recherche sur le suicide (par hasard hein) le premier lien invitait a savoir comment se donner la mort le plus facilement, mais apres avoir cliqué dessus, on avait un long texte rassurant avec bcp d'espoir et bien ecrit qui tenter de rassurer le suicidaire et lui donner les moyens d'en sortir.

Bref, toute cette affaire est grossi et porté par des gens qui ne sont pas sur internet, les mêmes personnes qui disait que twitter ne servait exclusivement qu'a la délation.

L’hypocrisie de google qui me gène, c'est que la censure existe, celle des termes "porno" par exemple, qui est arbitraire, parce qu’on peut faire des recherches avec des mot crues, mais pas avec le but de tomber sur des sites purement pornos
Mais ils le font surement pour lutter contre le spam.

Le seul consensus sur la censure dans le web reste toujours la lutte contre le spam.

28 juin, 2013 09:45  

Enregistrer un commentaire