Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, mai 23, 2012

Législatives: Philippe et Catherine, les prénoms des candidats

J'ai publié hier la carte de la non-parité dans les candidatures pour les législatives. Voici aujourd'hui une étude des prénoms des candidats. Les grands gagnants sont Philippe et Catherine :


Ces prénoms nous disent des choses. En croisant avec les données de l'INSEE, on voit que Philippe et Catherine ont eu leur pic de popularité en 1963. On peut faire de même avec les prénoms les plus fréquents, Michel, Alain, Isabelle, Anne et les autres, et on a à peu près la même image : le candidat-député français tourne autour de la cinquantaine...


Quant à l'origine culturelle des prénoms, le tableau ci-dessus parle tout seul... Il énumère gentiment les saints du calendrier. Il faut descendre à la 70ème position chez les hommes avec un Mohammed (14 candidats) et à la 110ème chez les femmes avec une Fatima (5 candidates).

8 Commentaires:

Blogger JF a écrit...

Surprenant, d'ailleurs, ce pic de "Philippe" dans les années 60. On aurait pu penser que le souvenir d'un autre Philippe (Pétain) était encore assez vif, juste 20 ans après, pour rendre le prénom "tabou" pour au moins cette génération.

23 mai, 2012 13:37  
Anonymous Cochonfucius a écrit...

Hommage au fils du Général ?

23 mai, 2012 13:54  
Blogger Jean Véronis a écrit...

Je chercherais plutôt du côté des stars. Ca explique assez bien les Brigitte par exemple...

Gérard Philipe ?

23 mai, 2012 14:07  
Blogger JF a écrit...

@Cochonfucius: Ah, mais le fils du Général est né en 1921 : dans son cas le Philippe est très possiblement un hommage (ou en tout cas une influence) au vainqueur de Verdun !

@Jean V.: La référence aux stars est évidente, mais les modes de prénoms résultent à la fois d'influences positives (plein de Brigitte dans les années 60) et négatives (pas tellement d'Adolphe dans la 2e moitié du XXe). Ma suprise était que en l'occurence le positif l'ai emporté.

23 mai, 2012 21:47  
Anonymous Anonyme a écrit...

Le prénom de Petain était maréchal. Maréchal Pétain!

28 mai, 2012 10:27  
Blogger Curare- a écrit...

Née en 1962, Et dieu créa la femme,
Je fus la énième à m'appeler Brigitte ___

28 mai, 2012 22:11  
Anonymous sebastien a écrit...

effectivement, ce couplage prénom et age a été une de mes découvertes étant jeunes … et à partir d'un prénom il existe un pourcentage de chance de connaître l'age dun'e personne …

je ne sais pas si la police utilise cela mais je l'avais constaté très tot puisque au sein des différentes classes successives dans lesquelles je suis passé il y avait au moins 3 Sebastien chaque année …

devinez ma date de naissance …

Sebastien

31 mai, 2012 09:58  
Anonymous Cochonfucius a écrit...

Voir aussi prénoms et bac par Baptiste Coulmont

09 juillet, 2012 13:45  

Enregistrer un commentaire

mardi, mai 22, 2012

Législatives: Carte de France de la (non)-parité

Je me suis amusé à analyser la liste des 6611 candidats aux législatives diffusée par le ministère de l'Intérieur. On a largement dit dans la presse que 2646 de ces candidats sont des candidates, soit 40,0%. En comptabilisant les civilités, M. ou Mme, j'ai réalisé une carte de la parité par département (cliquer pour agrandir) :


Douze départements sont particulièrement vertueux et atteignent ou dépassent la parité, la palme revenant à l'Ariège, avec 60,0% de femmes candidates :


A l'inverse, on trouve quelques cancres... L'Outremer ne brille pas par son féminisme. A Wallis-et-Futuna, aucune femme sur les 6 candidats. Les autres DOM ne sont guère mieux lotis. En France métropolitaine, 14 départements n'atteignent pas un tiers de candidates. Bonnet d'âne pour la Corse-du Sud :



14 Commentaires:

Blogger JF a écrit...

Jolie carte; mais si je puis me permettre un commentaire technique, le choix des couleurs n'est pas des plus heureux. Un petit coup d'oeil sur le "color Brewer" peut-être ?

23 mai, 2012 09:14  
Blogger Jean Véronis a écrit...

Mieux comme ça?

Merci du lien, l'outil est très utile !

23 mai, 2012 09:43  
Blogger JF a écrit...

Si vous utilisez R pour les stats etc., il y a une "library" (Rcolourbrewer) qui implémente les schémas directement dans R...

23 mai, 2012 10:07  
Blogger Jean Véronis a écrit...

Ah, super ! merci pour toutes ces infos.

23 mai, 2012 10:20  
Anonymous Cochonfucius a écrit...

Bel outillage, en effet.

23 mai, 2012 10:55  
Blogger florent a écrit...

Bonjour,

Un détail que je ne comprends pas: le département des Côtes d'Armor est dans la liste des douze. Pourtant il a une couleur plus claire que son voisin le Finistère...
Et les numéro dans la table sont ceux de département? dans ce cas, c'est peut etre le bug car les cotes d'armor c'est le 22... pas le 24

23 mai, 2012 19:59  
Blogger Jean Véronis a écrit...

Ouh là!!! merci Florent, ce sont les 2A et 2B des Corses qui m'ont mis le bazar (quelle drôle d'idée quand même de numéroter des départements comme ça... c'est la cauchemar de l'informaticien moyen ça !).

J'ai corrigé, c'est la Dordogne, le 24 !

23 mai, 2012 20:16  
Anonymous jp a écrit...

En quoi 60 % de femmes représentent-ils une meilleure parité que 40 % ?

25 mai, 2012 17:52  
Blogger Jean Véronis a écrit...

Dans un système profondément inégalitaire, celui qui lance un signal positif n'est-il pas digne d'être remarqué ?

25 mai, 2012 18:46  
Blogger Cuvelier Etienne a écrit...

Bonjour,
Merci pour cette intéressante cartographie.
Je cherche aussi le fichier des candidats pour une autre étude mais n'en n'ai encore trouvé nulle trace. Pourriez-vous m’aiguiller ?
Merci.

29 mai, 2012 11:36  
Anonymous Anonyme a écrit...

"dépassent la parité"
comment dépasse-t-on la parité? Soit on s'approche de la parité soit on s'éloigne de celle ci.

30 mai, 2012 22:48  
Blogger Jean Véronis a écrit...

Oui, enfin... vous voyez ce que je veux dire, pas vrai ?

31 mai, 2012 07:29  
Anonymous Anonyme a écrit...

Bonjour,

Analyse très intéressante. Avez-vous pu récupérer une liste globale au format xls par exemple des candidats ? Sur le site du Ministère de l'intérieur, je n'ai pas trouvé de liste globale.

Merci

03 juin, 2012 12:14  
Anonymous Jesse a écrit...

Pardon mais la palme revient plutôt à la Dordogne et aux Hautes Alpes. Le reste est soit mysoginie, soit misandrie. Mais pas la parité qui suppose égalité. Attention aux mots...

09 juin, 2012 19:07  

Enregistrer un commentaire

Appli: France 2012 - Législatives

Vous avez peut-être téléchargé l'application France 2012 pour iPad et smartphones, que nous avons réalisée pour Radio France et l'AFP avec mes amis Benoît Raphaël, le graphiste Julien Tauvel et l'équipe Revsquare à New York (Benoît l'avait décrite ici). Attention, Véronis inside® ;-) Ce sont mes algorithmes qui sont à l'oeuvre pour tout le "backoffice", c'est-à-dire la détection des termes et entités nommées (personnes, lieux, partis et autres), le "clustering" (groupage des news sur le même sujet) et la catégorisation, l'analyse du buzz sur les réseaux sociaux, etc. — un ensemble de technologies que nous appelons Trendsboard, et dont nous vous reparlerons bientôt avec Benoît !

Je suis très heureux de vous annoncer la nouvelle version, qui va suivre les législatives jusqu'à la fin juin. Vous pouvez la télécharger sur l'AppStore ou Google Play.

Voici une copie d'écran de la Une construite automatiquement :


Des carrousels latéraux inspirés des jeux vidéos permettent de filtrer les nouvelles, à gauche, en fonction des thèmes :


 et à droite, en fonction des partis :


Enfin, la géolocalisation permet de filtrer les articles qui concernent votre région grâce à la détection des noms de lieux (avec la désambiguïsation made in Véronis, pour les cas comme Orange ou Cher...)


J'espère que vous aurez plaisir à tester cette application, qui est une première pour Radio France et l'AFP. J'en profite pour remercier au passage Joël Ronez, directeur des nouveaux médias de Radio France, assisté d'Alexandre Albert-Stewart, ainsi que Bernard Pellegrin, directeur adjoint de l'information à l'AFP, qui ont mis tout leur enthousiasme dans ce projet. Je sens que cette collaboration naissante augure de grandes et belles choses !

6 Commentaires:

Anonymous JB Gabellieri a écrit...

Dispo sur Androïd ? Un lien vers Google Play ?

22 mai, 2012 11:35  
Blogger Jean Véronis a écrit...

Oui, bien vu ! Je rajoute le lien dans l'article, merci.

22 mai, 2012 11:45  
Blogger Antoine Dubuquoy a écrit...

Voila le lien vers Google Play pour télécharger l'appli: http://tinyurl.com/7zkueys

22 mai, 2012 11:52  
Blogger Jean Véronis a écrit...

yes, merci ! http://tinyurl.com/7zkueys

22 mai, 2012 11:58  
Blogger Frédérique a écrit...

J'ai eu un peu de mal à comprendre le fonctionnement au début, mais ensuite, cette appli est vite devenue indispensable pendant les Présidentielles. C'est très bien de l'avoir prolongée pour les législatives, d'autant que je vote dans la commune de ma résidence secondaire, en Ardèche, et que, pour obtenir des infos ardèchoises quand on travaille à Paris, ce n'est pas si facile...

22 mai, 2012 19:15  
Anonymous Cochonfucius a écrit...

merci pour ce bel instrument !

23 mai, 2012 10:47  

Enregistrer un commentaire

samedi, mai 05, 2012

Présidentielle: La présence des candidats sur le Web entre les deux tours

Juste avant le premier tour, j'avais montré (ici), grâce à ma plate forme qui analyse en temps réel plusieurs milliers de sources (médias et blogs), que les volumes de citations sur le Web reflétaient d'assez près les mouvements d'opinion. Il faut bien sûr prendre tout cela avec prudence, car nous manquons d'études et de recul, mais on y voyait en particulier juste avant le premier tour, les trois tendances que les instituts de sondage n'avaient pas très bien estimées : le tassement de Jean-Luc Mélenchon, la percée de Marine Le Pen et une remontée assez franche de François Hollande.

Voici ce que donne la plate forme pour les deux finalistes sur les dernières semaines :


On voit que lors du premier tour les courbes sont très serrées, ce qui correspond grosso modo au résultat du scrutin. Le nombre de citations de François Hollande se tasse ensuite pendant toute la durée de l'entre-deux tours (ce qui est conforme à ce qu'ont observé les instituts de sondage). Puis le candidat socialiste remonte à égalité pour le débat, et dépasse très légèrement Nicolas Sarkozy sur la journée d'hier. Les courbes sont en tout cas très proches dans la dernière ligne droite. Je ne sais pas s'il faut croire la sagesse des foules du Web, mais il se pourrait bien, comme le disent certains, que cette élection se fasse sur le fil du rasoir...


1 Commentaires:

Anonymous Cochonfucius a écrit...

Le débat n'a effectivement pas montré de supériorité évidente d'un prétendant sur son adversaire. Le choix est donc libre, ce qui donne en général du "cinquante plus epsilon" et pas un succès franc et massif.

Le "clinamen" évoqué jadis par Lucrèce.

05 mai, 2012 16:00  

Enregistrer un commentaire

vendredi, mai 04, 2012

Débat: Moi, François Hollande

Tous les commentateurs ont relevé la tirade finale de François Hollande lors du débat qui l'opposait à Nicolas Sarkozy : Moi, président de la République... Répétée 15 fois. Une belle anaphore, figure chère à la plume de Nicolas Sarkozy, Henri Guaino, dont elle a été en quelque sorte la marque de fabrique en 2007 (voir étude ici et ici). Au-delà de cet écho, dont on ne saura jamais s'il était un clin d'oeil ironique, l'affirmation du moi chez le candidat socialiste, présenté souvent comme consensuel et rassembleur, voire « mou », a pu surprendre.

Je me suis livré à une analyse quantitative rapide sur l'usage des pronoms dans le débat par les deux protagonistes. Les résultats sont assez étonnants. On sait que Nicolas Sarkozy était un fervent adepte du moi et du je — égotisme linguistique sur lequel Ségolène Royal n'était pas en reste (voir détail ici, ici et ici). Avant-hier soir, c'est François Hollande qui s'en est fait le champion. Sarkozy et Royal utilisaient le pronom je 17 à 18 fois pour 1000 mots (en 2007), Hollande monte le curseur jusqu'à 22,6. Il ne rattrape pas tout à fait son modèle (gestuel et linguistique), François Mitterrand, qui battait tous les records avec 24 je pour 1000 mots, mais il s'en approche (on se peut sans doute pas rejoindre complètement Dieu). Nicolas Sarkozy est resté fidèle à lui-même, avec presque 17 je pour 1000 mots, comme en 2007. Le moi n'est pas en reste, puisque Hollande l'utilise carrément deux fois plus que Sarkozy (3,4 contre 1,6 pour 1000 mots).


L'usage de la première personne en complément (c'est-à-dire me) est également assez éloquent, puisque là, les fronts se renversent :


Nicolas Sarkozy prend le dessus. Ce n'est pas anodin : c'est un peu plus compliqué, bien entendu, mais comme on l'a en gros appris à l'école, le sujet agit, le complément subit. Et Nicolas Sarkozy était largement dans une séquence de victimisation lors du débat : Madame Aubry me traite de Madoff..., Monsieur Hollande peut me reprocher bien des choses... on m'a reproché... on me dit... Vous me faites une critique... etc.

En opposition, le vous, globalement accusateur, était prépondérant chez Hollande, qui a manifestement réussi à placer Nicolas Sarkozy sur la défensive pendant une grande partie du débat :



Enfin, comme je l'avais fait remarquer en 2007, les pronoms ne valent qu'avec des verbes, et c'est sur la formule je veux que Nicolas Sarkozy était véritablement champion toutes catégories (voir ici). Mais avant hier soir le je veux sarkozien était manifestement en berne. François Hollande voulait deux fois plus.



Comme disait René Char, les mots savent de nous des choses que nous ignorons d'eux...


4 Commentaires:

Anonymous Cochonfucius a écrit...

La sémiologie du discours des grands personnages sur leur modeste personne a de beaux jours devant elle !

04 mai, 2012 11:34  
Anonymous Grégoire C. a écrit...

Bonjour Jean,

Vous ne pensez pas que le "Moi, président de la république..." se veut un rappel de l'ablatif absolu latin, sur le mode du fameux Cicerone consule ?

Une écriture anticipée de l'histoire, en quelque sorte.

Une vanité, comme on dit en peinture.

À dimanche soir, pour l'allocution officielle : Moi, désormais président de la république…

04 mai, 2012 13:14  
Anonymous Anonyme a écrit...

Sortons un moment de l''approche proposée ici pour un rappel nécessaire.
La domination de l'idéologie du travail est telle que peu de commentateurs (aucun ?) avaient relevé cette déclaration d'un N.S que l'on peut à bon droit il me semble qualifier de Vichyssois de Neuilly (toutes choses inégales par ailleurs, comme il se doit) :
"Le travail c'est la liberté"

04 mai, 2012 21:10  
Anonymous Nathalie a écrit...

"le travail c'est la liberté", vu par Prévert et Grimault dans "Le Roi et l'Oiseau" (1980)
http://www.youtube.com/watch?v=BjOoCDKhPMA

06 mai, 2012 10:44  

Enregistrer un commentaire

mardi, mai 01, 2012

Google: Fichier juif ?


Avant-hier, TF1 a perturbé ma sieste dominicale en m'envoyant une équipe pour recueillir quelques mots pour le JT de 20h sur l'affaire du « fichier juif » de Google... Une séquence de fin de JT n'est pas un format qui se prête beaucoup à l'élaboration, et je me suis dit que je pourrais essayer de rassembler ici mes réfléxions sur le sujet. Je pense que tout le monde a désormais entendu parler de l'affaire. Plusieurs associations, SOS Racisme, le MRAP, l'UEJF et l'AIPJ, ont assigné Google en référé demain 2 mai pour « trouble manifestement illicite », estimant que le moteur contrevient à la loi française, qui interdit tout fichage ethnique, en associant fréquemment le mot juif à des noms de personnalités dans son module de suggestion.






Je ne suis pas juriste et je laisse d'autres bien plus qualifiés s'exprimer sur le sujet. Je me contenterai d'apporter modestement quelques éléments de nature technique au débat.


1. Le problème est-il nouveau ?

Non. Au contraire, il ressort régulièrement. A ma connaissance c'est Colombe Schneck qui avait soulevé le lièvre en mai 2009 sur France Inter (écouter l'émission, voir également sur le blog de Renaud Revel). Il a été redécouvert par Emmanuele Anizon sur Telerama.fr début 2011, article qui avait été relayé par Le Monde (15 février, article de Stéphane Foucart uniquement en archives payantes), le Nouvel Obs, etc.

J'avais fait moi-même remarquer sur ce blog en 2010 que d'autres suggestions de Google reflétaient les stéréotypes les plus désagréables sur les juifs, les noirs, les femmes, les arabes...


(voir aussi de beaux exemples en écho sur Slate et une analyse intéressante d'Olivier Ertzscheid).

2. L'explication de Google

L'AFP avait relayé la chose et Google m'avait répondu par le même canal (voir ici), expliquant qu'il s'agissait d'une agrégation automatique, pur « reflet de l'activité de recherche de tous les utilisateurs du moteur ».

La ligne de défense de Google cette fois-ci est globalement la même. La firme affirme que les suggestions se sont « aucunement issues d'un choix éditorial de la part de Google », mais « générées de manière totalement algorithmique, sur la base de critères purement objectifs ».

Google Suggest « apprend » en effet ce que les internautes ont tapé, et le restitue ensuite en fonction des premières lettres tapées par l'utilisateur (cet algorithme existe depuis 2004, et avait fait l'objet d'un de mes premiers billets sur ce blog).


3. L'algorithme peut-il être leurré ?

Les suggestions reflètent-elles les vraies fréquences naturelles de requêtes ou bien peuvent-elles être « spammées » ? On m'a posé plusieurs fois la question et l'on peut en effet légitimement se demander si les décomptes sur lesquels sont basées les suggestions ne sont pas faussées par des individus ou groupes organisés. Je n'ai évidemment ni certitude ni preuve, mais on peut se poser la question en voyant par exemple un certain nombre de requêtes qui, comme par hasard, correspondent à des titres de posts sur des forums...

Diverses techniques existent qui pourraient permettre de contourner les limites de Google (campagnes coordonnées, utilisation de proxies, programmes malveillants divers implantés à l'insu d'utilisateurs sur de nombreuses machines, Amazon Mechanical Turk, etc.) et qui pourraient leurrer Google quant au nombre de requêtes de tel ou tel type. L'idée a certainement déjà traversé l'esprit de quelques spécialistes de SEO, et on peut imaginer que des groupes d'idéologies ou d'intérêts divers puissent mener des attaques ciblées sur des personnes ou entreprises. Google pourrait expliquer si le phénomène existe et si des mesures particulières sont prises pour le contrecarrer.

Dans le cas précis de la plainte qui sera étudiée demain, je crois plutôt que l'association de nombreux noms avec le mot juif résulte d'une ambiance délétère, et d'un souci malsain qui est de « débusquer les juifs » pour reprendre les termes de l'avocat de SOS Racisme.


4. Cela concerne-t-il seulement les juifs ?

Non. Toutes les religions y passent. On se demande visiblement si Obama ne serait pas musulman, Zidane chrétien ou Jospin protestant :




Dans certains cas l'association est vraie, dans d'autres non.... C'est sans doute la faiblesse de la plainte déposée contre Google. Il est difficile de voir dans ces associations un « fichier juif ». Parmi les requêtes les plus proposées, on a « Sarkozy juif » ou « Hollande juif », mais à ma connaissance ce n'est la religion ni de l'un ni de l'autre (pas plus qu'Obama n'est musulman). Nous verrons ce que dit la justice demain.

Remarquons au passage que les associations ne concernent pas que les religions. Un certain nombre de dénominations plus ou moins injurieuses sont récurrentes :



Sur ce point, notons que Google a déjà été attaqué en justice (et a perdu plusieurs fois). Dès 2009, Direct Energie avait condamné Google pour l'association du nom de cette société avec le mot arnaque. A ma connaissance c'était le premier cas en France et le jugement est extrêmement intéressant à lire (ici). En 2010, un particulier s'était plaint de voir son nom associé aux doux qualificatifs d'escroc, sataniste, arnaque ou violeur et avait obtenu gain de cause (voir ici). En février, la société de vente directe de produits diététiques Kriss Laure a fait condamner Google à supprimer la suggestion kriss laure secte sous une astreinte de 2 500 euros par jour (voir ici).

Nicolas Sarkozy serait donc fondé (comme d'autres) à attaquer Google et gagnerait probablement selon cette jurisprudence.

Dans le cas des religions, c'est peut-être un peu différent. A nouveau, je ne suis pas juriste, mais il me paraît difficile de voir dans les mots juif ou musulman des insultes (j'espère !). Le point de vue judiciaire sur ce cas serait intéressant (mais apparemment ce n'est pas la ligne d'attaque qu'ont choisie les associations, puisqu'elle ne se plaignent pas d'une insulte mais d'un fichage illégal).


5. Google intervient-il ?

Oui. Contrairement à ce que la firme déclare le processus n'est pas totalement algorithmique, et il y a bien intervention humaine (même en dehors des cas imposés par la justice comme ci-dessus). Certainement pas pour ajouter des suggestions mais pour en filtrer certaines. Par exemple, il est assez simple de vérifier que « les arabes... », « les nègres... » ou « les youpins... » ne ramènent aucune suggestion. Il y a donc bien une liste d'exclusion, mais elle semble assez rudimentaire, et le choix des termes filtrés paraît assez aléatoire.

On peut d'ailleurs, de façon assez intéressante, voir sous la surface de l'algorithme car la liste ne semble pas inclure les fautes d'orthographe...






6. Des solutions techniques existent-elles ?

Oui. Il serait assez trivial pour une firme qui a les moyens de Google d'opérer des filtrages sur un certain nombre de « patrons » de requêtes correspondant à ce qui choque le plus apparemment les sensibilités, à savoir l'association d'un patronyme avec une liste de mots tels que juif, musulman, escroc, etc.


7. Pourquoi Google ne réagit-il pas ?

Seule la firme a la réponse. Le phénomène est connu depuis plusieurs années et Google ne souhaite visiblement pas intervenir. Même dans les cas qui ont porté à condamnation (comme l'association avec le mot escroc) on voit qu'aucune action globale n'a été prise (exemple « Sarkozy escroc » ci-dessus).


8. Faut-il réagir ?

Je n'ai pas un penchant réglementeur et liberticide, mais visiblement des gens ou des groupes sont dérangés, voire choqués, par certaines suggestions. Mais jusqu'où faut-il aller ? Les correcteurs orthographiques n'osent plus proposer le mot arabe ou le mot juif... Est-ce bien raisonnable ?

Le débat est donc nécessaire, et même salutaire.

*

Finissons sur une note d'humour sur le mode de l'arroseur arrosé :


Peut-être que la dernière suggestion est la bonne. Cela expliquerait toutes ces questions qu'on lui pose sur les religions : Il doit savoir...


12 Commentaires:

Anonymous Anonyme a écrit...

article très instructif comme toujours,
je crois qu'il y a une erreur dans la date 5/1/12 pour 1/5/12
Emmanuel

01 mai, 2012 23:11  
Blogger Jean Véronis a écrit...

merci pour le compliment ! et merci de me signaler le coup de la date... Visiblement Blogger me la met au format américain. Je vais voir si ça se paramètre.

01 mai, 2012 23:15  
Anonymous Anonyme a écrit...

déjà en mars 2011...

01 mai, 2012 23:59  
Anonymous EtienneB a écrit...

Il y a bien moyen de leurrer Google Suggest assez facilement.

http://www.deliciouscadaver.com/comment-definitivement-pourrir-la-e-reputation-de-quelquun-pour-5e.html

02 mai, 2012 01:21  
Blogger Jean Véronis a écrit...

EtienneB> Un grand merci pour ce lien (je le remets en format cliquable).

02 mai, 2012 09:06  
Blogger Xavier a écrit...

Pour le point 3, la réponse est apparemment oui et cela a déjà été pratiqué à grande échelle. Ici par des roumains pour améliorer la perception de leurs concitoyens par les internautes: http://www.seomoz.org/blog/romanians-are-smart-or-how-to-change-the-google-autocomplete-suggestions

02 mai, 2012 09:18  
Blogger Jean Véronis a écrit...

Xaxier> Merci pour ce lien édifiant (cliquable ici).

Vous comprenez mon usage prudent du conditionnel, dans une affaire en cours de jugement. Mais on va dire qu'il ya des indices convergents...

02 mai, 2012 09:38  
Anonymous elifsu sabuncu a écrit...

Un détail, mais pas vraiment...Juif n'est pas que une religion, et donc se demander si quelqu'un est juif n'est pas tout à fait seulement une question sur sa religion...Quand on veut stigmatiser voire persécuter un juif, on ne s'intéresse pas tant à sa religion qu'à son orgine familale, ethnique, culturelle, géographique, etc. ou une combinaison de tout ça. Je sais que c'est difficile pour pas mal de personnes de comrpendre ça, et pourtant...c'est vrai.

02 mai, 2012 15:50  
Blogger Jean Véronis a écrit...

Oui. Cela vaut pour toutes les religions d'ailleurs...

02 mai, 2012 15:54  
Anonymous sebastien a écrit...

Et si on prenait du recul … et qu'on acceptait que Google ne soit pas un oracle ?

Ce ne sont que des algo. qui peuvent être manipulés (par du spam comment ou autre technique BH) … de plus ces réponses sont relatives (géoloc par ex. et temporaires) …

Encore une fois, ce n'est qu'un outil ! Google suggest est la manifestation statistique de ce que cherchent les utilisateurs … et de plus cela peut être manipulé …

Demander à Google de filtrer ? sur quelle base ? ou et la limite ?

si la réponse à Google serait un algo pour limiter ces réponses, il y aurait d'autres pb liés car de personnes mal intentionnées pourraient retourner ce filtrage à leur avantage (ou ceux de leur client).

bref, avant de voir le mal chez les autres, regardons en nous !


Sebastien

10 juin, 2012 11:28  
Anonymous grugru a écrit...

Pour le dernier point, oui, google est bien Dieu , voici l'argumentaire :
http://www.thechurchofgoogle.org/

26 octobre, 2012 23:48  
Blogger Khalid Nadir a écrit...

Au états unis, l'origine ou la "culture", la religion d'une personne n'est pas un tabou, il suffit de chercher des célébrités sur wikipedia us, pour être renseigné quand la personne est juive, ou arabe ou autre.

D'ailleurs l'affaire de l'application iphone ou on pouvait chercher qui est juif et qui ne l'est pas était crée par un juif (sic)
Je crois que bcp de gens cherchent à savoir si quelqu'un est juif mais sans arrière pensé antisémite.
Moi qui suit d'origine arabe, je faisais une recherche sur isabelle adjani par hasard, et il y était fais mention qu'elle était d'origine maghrébine, je le savais mais j'ai eu plus de détails, ce n’était pas le but de ma recherche, mais cela m'a intéressé
, pas par communautarisme, ça je m'en fous, mais cela vous donne une vision différente de la personne que vous pouvez recouper avec vote histoire dans mon cas.

Et c'est la la vrai difficulté, comment savoir qu'une recherche est antisémite?

Si on enlève toute les recherches dites antisemites, finalement il doit rester que des suggestions racistes et elle doivent être minime.

Et puis finalement aussi, je me rappelle être tombé sur une recherche sur le suicide (par hasard hein) le premier lien invitait a savoir comment se donner la mort le plus facilement, mais apres avoir cliqué dessus, on avait un long texte rassurant avec bcp d'espoir et bien ecrit qui tenter de rassurer le suicidaire et lui donner les moyens d'en sortir.

Bref, toute cette affaire est grossi et porté par des gens qui ne sont pas sur internet, les mêmes personnes qui disait que twitter ne servait exclusivement qu'a la délation.

L’hypocrisie de google qui me gène, c'est que la censure existe, celle des termes "porno" par exemple, qui est arbitraire, parce qu’on peut faire des recherches avec des mot crues, mais pas avec le but de tomber sur des sites purement pornos
Mais ils le font surement pour lutter contre le spam.

Le seul consensus sur la censure dans le web reste toujours la lutte contre le spam.

28 juin, 2013 09:45  

Enregistrer un commentaire