Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

lundi, novembre 28, 2005

E-Pub: La RATP n'aime pas les méthodes de l'UMP

L'UMP a surpris beaucoup de monde avec sa première campagne de pubs AdWords ciblée sur des mots-clés tels que banlieues, racaille (si, pour un court instant! voir ici), sécurité, etc. L'histoire, qui a été signalée tout d'abord par Rezo et votre serviteur, a fait le tour du monde... Même les Américains, habitués à bien des formes de publicité politique, ont été étonnés (Business Week, New York Times, Today online, etc.). On peut discuter du bien-fondé du procédé, mais ce qui me surprend beaucoup c'est surtout l'absence de discussion dans le monde politique. Tout au plus, les socialistes se sont-ils mis à copier la technique (de façon assez maladroite, mais ils avaient l'esprit tourné ailleurs).

Au-delà du procédé, qu'on peut approuver ou pas en tant que citoyen, il y a quand même quelque chose que j'ai trouvé assez perturbant: parmi les mots-clés achetés par l'UMP, figuraient aussi Parti Socialiste, Jospin, François Bayrou, Montebourg, Robert Hue, PCF, Arlette Laguiller, LCR, etc. Est-ce bien loyal? Que l'on tombe sur une pub UMP en tapant Nicolas Sarkozy, très bien. Que l'on tombe dessus en tapant banlieues ou violences urbaines, il me semble que ça mérite un débat citoyen... Mais que l'on tombe sur une pub UMP en tapant François Bayrou ou Arlette Laguiller, cela me semble un peu curieux (l'inverse me surprendrait tout autant, rassurez-vous si vous êtes sympathisant UMP)! En fait, cela me rappelle l'affaire Louis Vuitton contre Google: la requête Louis Vuitton renvoyait vers des pubs de sites concurrents ou même de sites vendant des contrefaçons! Google a été condamné en février dernier pour contrefaçon et actes de concurrence déloyale. Les attendus du jugement sont extrêmement intéressants à lire [pdf]. Ce jugement faisait suite à plusieurs affaires analogues: "Bourse des vols" jugé en octobre 2003 (VIATICUM et LUTECIEL contre Google), Méridien contre Google (référé de décembre 2004) et ACCOR contre Overture jugé en janvier 2005. Google s'engage désormais à supprimer les annonces abusivement liées à des marques à la demande du propriétaire de celles-ci [voir ici].

La jurisprudence est donc assez claire sur les marques commerciales. Sur les noms d'hommes politiques et les dénominations de partis, je ne crois pas qu'aucune affaire ait jamais été portée devant les tribunaux. Ce serait amusant: PCF contre Google, etc. [comme le fait remarquer un lecteur, Parti Socialiste, Parti Communiste, etc. sont des marques déposées -- voir INPI]. Cependant, il y a quelques jours, pendant la journée de grève des transports, l'UMP étendait ses pratiques à la RATP. ResetParameters a sorti l'info avec une copie d'écran, et, lui laissant la primeur, je n'ai mis qu'un petit écho sur ce blog. La requête RATP proposait un "lien commercial" vers le site de l'UMP ("Grèves des transports: Nicolas Sarkozy vous invite à voter pour exiger un service minimum garanti!"). Or RATP est une marque déposée (en 1972, sous le numéro 1 195 253), et étant donné la jurisprudence ci-dessus, l'issue d'un litige RATP contre UMP ne ferait pas l'ombre d'un doute (la RATP ne se prive pas de faire respecter ses droits dans d'autres circonstances: exemple)...

Si je parle de tout cela aujourd'hui, c'est qu'un lecteur de ce blog vient de me faire parvenir un échange de mails qu'il a eu avec la RATP après avoir lu le billet concerné et qui éclaire l'affaire sous un jour intéressant. Nous l'appellerons Monsieur M***.

Premier message de Monsieur M*** à la RATP, apparemment à travers le site Web:
--------------------------------------
VOTRE MESSAGE ADRESSÉ À LA RATP

Expediteur : M****
E-mail : ************
Sujet : publicite_partenariat

Message :

Je voudrais attirer votre attention sur
http://www.u-blog.net/resetparam/note/58079

Il me semble que vous seriez en droit de porter plainte
http://actu.abondance.com/2005-06/google-vuitton.php


INFORMATIONS COMPLEMENTAIRES
Contact : Monsieur M***

[je coupe le reste pour respecter son anonymat]
Première réponse de la RATP:
De : - CML/AKIO-0101
Envoyé : jeudi 24 novembre 2005 09:24
À : *****
Objet : Publicite_partenariat

Bonjour,

Je transmets le lien au service concerné qui prendra les mesures adaptées.

Cordialement,

François Jeunehomme
RATP / Relations de Service
Quelques jours plus tard:
From: alain.nuffer@ratp.fr
Date: Nov 28, 2005 9:03 AM
Subject: RE : Publicite_partenariat
To: ****************

Bonjour et merci pour votre vigilance

Le nécessaire a été fait (rapidement) grace à vous et le lien n'existe plus.

Bonne journée

Cordialement

Alain NUFFER
Responsable de l'Agence de Développement Multimédia
RATP/COM

Effectivement, le lien avait disparu très vite. Arnaud Dassier, qui dirige cette campagne de communication de l'UMP (société L'enchanteur des nouveaux médias) est-il un bricoleur qui improvise sur le Net sans trop connaître les lois (et la Netiquette)? ou bien passe-t-il outre, se disant que l'appui d'un Ministre de l'Intérieur, patron du parti commanditaire, peut aplanir bien des difficultés?

Il paraît qu'Arnaud Dassier lit ce blog (il semble d'ailleurs avoir laissé un commentaire l'autre jour, mais sait-on si c'était bien lui...). Je suis tout-à-fait prêt à publier ses explications et son point de vue. Il suffit de m'envoyer un petit mail (histoire de filtrer les plaisantins).

27 Commentaires:

Anonymous Anonyme a écrit...

Ah une bonne vieille délation bien de chez nous, ça fait chaud au coeur de voire les traditions se perpetuer, bravo Mr M. et vive la France !

28 novembre, 2005 23:31  
Anonymous Anonyme a écrit...

toto> « Ah une bonne vieille délation bien de chez nous, ça fait chaud au coeur de voire les traditions se perpetuer [...] »

délation : dénonciation inspirée par des motifs méprisables, dit le robert.

où sont les motifs méprisables de monsieur m., monsieur toto ?

l'ère des réseaux, dans laquelle nous sommes depuis que l'humain vit en société, connaît une transformation extrêmement profonde, structurelle, car pour la première fois, grâce aux technologies du numérique, chaque individu dispose des moyens :

- d'interpeller toute personne, physique ou morale, qui commet un acte irrespectueux, voire répréhensible ;
- d'apporter sa connaissance, son savoir, ses conseils, etc. à toute personne, physique ou morale, victime d'un tel acte.

la campagne de l'ump est légitime dans la mesure où la publicité politique est autorisée. elle devient irrespectueuse lorsqu'elle se sert du nom de ses adversaires. elle bascule dans l'illégalité lorsqu'elle détourne des marques commerciales à son profit.

la délégation de responsabilité qui fonde l'organisation pyramidale de nos sociétés démocratiques a abouti à la situation contemporaine où les individus détenteurs de pouvoirs les conservent par tous les moyens, légitimes ou non, et bénéficient d'une révoltante impunité lorsqu'ils agissent illégalement. l'intrusion des technologies du numérique provoque un court-circuit généralisé dans les hiérarchies parce qu'elles permettent à chacun de se réapproprier sa responsabilité individuelle. lorsque monsieur m envoie son mail, il agit comme un individu responsable ; responsable de lui-même d'abord, responsable des conséquences de ses actes vis-à-vis de la société, responsable du devenir de la société par sa participation active.

]m[

ps : PCF, PC et Parti Communiste Français sont des marques déposées, tout comme PS, Parti Socialiste... et même NPS Nouveau Parti Socialiste.

29 novembre, 2005 04:33  
Blogger DiogenePasCynique a écrit...

Bonjour,

D'abord félicitations pour votre site, je fais rien qu'à apprendre des choses intéressantes ! Concernant la réponse des moteurs de recherche sur des marques commerciales, j'ai été confronté à ce problème (voir : http://restructuration.blogspot.com/2005/11/il-faut-positiver.html#113276893850588396, dans les commentaires, et le billet suivant). J'ai essayé de résoudre le problème, mais ma faute principale semble être d'avoir renseigné la balise meta "keywords" et d’avoir essayé (je ne suis pas spécialiste) de référencer mon blog correctement ! Bien sûr, je suis d'accord avec vous sur le problème du détournement fait sciemment en utilisant la fonction adwords, mais dans mon cas, je ne me sens pas vraiment responsable du problème de positionnement d’un site à but commercial. Evidement, je de défends absolument pas les excès que vous décrivez !

Cordialement.

29 novembre, 2005 07:57  
Blogger all a écrit...

Google c'est planté l'UMP a acheté le mot RAP et pas RATP

29 novembre, 2005 09:53  
Anonymous Anonyme a écrit...

À signaler le fait que le sigle de la RTM avait été acheté lui aussi par l'UMP. Cela a disparu pendant le week-end.

29 novembre, 2005 10:10  
Anonymous Anonyme a écrit...

Le jugement du procès "Vuitton contre Google" n'a à peu près aucun rapport avec l'utilisation d'Adwords par l'UMP, car dans l'affaire Vuitton le problème unique était la contrefaçon: la vente de produits "contrefaisants" (comme disent les attendus) proposés pour une recherche de la marque "vuitton".

L'UMP ne cherche pas à vendre des T-shirts du PS au rabais, ni à se faire passer pour un autre parti en orthographiant son nom de façon fantaisiste (partii comuniste low price!)

La concurrence déloyale serait peut-être plus appropriée, mais il faudrait admettre que le code de la consommation s'applique au débat politique: ce serait assez cocasse.

Ne peut-on pas considérer au contraire que ce genre de pratiques enrichit le débat public, et surtout qu'on ne peut parler de débat que lorsque des personnes se parlent qui sont d'un avis différent? Si les partisans de tel ou tel parti ne sont autorisés que d'adresser la parole aux cotisants du même parti, quel intérêt cela a-t-il, pour la démocratie en général, et pour eux-mêmes en particulier?

29 novembre, 2005 10:51  
Anonymous Anonyme a écrit...

@frondeur :

Ainsi donc l'envoi de propagande politique par courriel et le référencement AdWords de marques déposées, détournées vers un site de promotion d'un parti politique seraient des moyens d'"enrichissement du débat public" ?

Que c'est intéressant !

Ce qui est particulièrement intéressant, c'est que la LCEN (loi pour la confiance en l'éonomie numérique ???) ne dit mot des pratiques politiques sur les réseaux, bien qu'elle fut lancée par le président de l'UMP en place, principal agitateur des réseaux récemment.

La politique n'étant pas une marchandise, la LCEN ne s'applique pas. Sauf que... Sauf que le fait de recevoir de la propagande politique reste soumis au bon vouloir des recevants, et que le fait de cliquer sur RATP en s'attendant à obtenir le plan du métro parisien et se retrouver sur la tronche d'un présidentiable n'a rien d'anodin.

Mais la fin justifiant les moyens depuis Machiavel, j'imagine qu'il se trouvera d'autres frondeurs pour réclamer encore plus de pourriels et de liens incongrus. La liberté des uns commencent où s'arrête celle des autres, et réciproquement.

YR

29 novembre, 2005 11:54  
Anonymous Anonyme a écrit...

Ne peut-on pas considérer au contraire que ce genre de pratiques enrichit le débat public ?

Cela me semble douteux. L'insertion de publicités ou le detournement de mots-clés ne participe en aucune manière au débat. On reste dans le domaine du monologue, de la communication "push", du spam en somme.

Par contre, cette affaire est intéressante dans la mesure où elle permet d'apporter un nouvel éclairage à ce phénomène. Je sais bien que Jean Veronis ne cherche pas spécialement à s'en prendre à l'UMP, ni à un autre parti. Néanmoins, je suis frappé par la différence de traitement qui est faite, ici et sur de nombreux sites, entre cette campagne de l'UMP d'une part, et les techniques de Google-bombing d'autre part, ces dernières ayant - semble-t-il - les faveurs du public.

Or, dans les deux cas, la démarche reste essentiellement la même.
a/ Elle repose sur le détournement de mots-clés (et d'information, au sens plus large du terme).
b/ Elle vise un but politique.

Accessoirement, on constatera que 100% du Google-bombing est fait contre des gens ou des partis dits de droite, et qu'il provient de réseaux marqués à gauche. Qu'un parti de droite, aujourd'hui, procède au même type de détournement, me semble être un simple et prévisible retour de bâton. Reste le problème de fond : cette pratique est-elle condamnable en soi (auquel cas le Google Bombing devrait être villipendé lui aussi) ou est-elle légitime (auquel cas la campagne de l'UMP ne devrait guère soulever l'indignation) ? Ou pour le dire d'une manière plus volontairement polémique : cette pratique est-elle ignoble quand elle vient de droite, mais sympathique quand elle vient de gauche ?

29 novembre, 2005 12:08  
Anonymous Anonyme a écrit...

La différence majeure entre le google bombing et l'utilisation "abusive" des adwords google par l'UMP n'est pas une différence droite/gauche, mais une différence de nature. Les adwords sont une action délibéré du parti lui-même, avec rétribution sonnante et trébuchante tandis que le google bombing est une oeuvre peut-être plus "désintéressée" de particuliers.

29 novembre, 2005 12:41  
Anonymous Anonyme a écrit...

« Ou pour le dire d'une manière plus volontairement polémique : cette pratique est-elle ignoble quand elle vient de droite, mais sympathique quand elle vient de gauche ? »

Sans parti-pris, je n'ai pas le souvenir d'avoir reçu un SPAM d'un candidat de gauche, ni du centre d'ailleurs ; ni le souvenir de liens vers un parti de gauche sur des sujets racolleurs (si ce n'est anecdotique)... Vous faites dans votre tentative d'apologie de l' e-campagne UMP une confusion entre des pratiques de professionnels de la com. et une forme de contre-pouvoir spontanné réagissant devant ce qui apparaît comme une méthode douteuse : il y a une franche différence entre une action stratégique de prise de territoire rationnalisée, par tous les moyens, et celle consistant à lui résister avec les moyens du bord.

Nagual.

29 novembre, 2005 12:50  
Anonymous Anonyme a écrit...

Le Google Bombing est à mon avis tout aussi peu condamnable que l'achat de mots-clé adwords par l'UMP: car ou bien on est pour la liberté, la liberté des google bombers et la liberté des partis politiques de "communiquer", ou bien on est contre, effectivement, et il faut condamner les deux pratiques.

Mais le Google bombing est vraiment du détournement de mots-clé, c'est une action subversive et anonyme (résultant d'une action collective), tandis que l'achat d'Adwords se fait au grand jour...

'yr' cite "le fait de cliquer sur RATP en s'attendant à obtenir le plan du métro parisien et se retrouver sur la tronche d'un présidentiable" mais on ne voit pas à quoi il fait référence: s'il y a des personnes qui croient qu'en cliquant sur une pub pour l'UMP, signalée comme telle, sous la bannière "liens commerciaux", elles vont obtenir le plan du métro parisien, il me semble qu'on serait en droit de doubler leurs impôts, pour cause de naïveté irréparable...

Quant aux spams ("pourriels" dans le vocabulaire francophonement correct), il est extrêmement facile de s'en protéger (can you say bayesian filtering?), tandis que les mesures liberticides mises en place pour tenter de les éradiquer ne manqueront pas de faire des dommages collatéraux très-horrifiques.

29 novembre, 2005 14:05  
Anonymous Anonyme a écrit...

frondeur : l'ump ne cherche certes "à vendre des T-shirts du PS au rabais", ni meme des tickets de métro

par contre elle utilise (utilisait) le nom de l'entreprise RATP pour mieux nuire à la RATP en tant que service public..

29 novembre, 2005 14:35  
Anonymous Anonyme a écrit...

J'ai essaye : Montebourg, PCF et LCR ne marche pas (ou plus).
Par contre "Parti Radical", "Lutte Ouvriere", "Noel Mamere", "de Villiers" marchent tres bien.

Et la question interessante devient : "qui a ete oublie ? et pourquoi ?"
(Vraiment, vous ne voyez pas ? Fermez un oeil, ca aide...)

Et puisqu'on s'interesse aux rapport de l'UMP avec le web, quels sont les "mots cles" du site web de l'UMP (il suffit de demander a voir la "source" de la page web) ?
...Roulement de tambour....
'sarko,sarkozy,sarkosy,brice,hortefeux,ump,union,mouvement,populaire,mehaignerie,gaudin,politique,retraite,famille,securite,reforme,decentralisation,economie,entreprise,justice,chantier,cancer,handicapes,prisons,environnement,integration,chirac,europe,election,politique,ministre,jeunes,federations,gouvernement,chomage,sante,rpr,udf,dl,raffarin,senat,assemblee,parlement,communique,campagne,agenda,adhesion,citoyen,sondage,europeen,forum,cyber,vote,presidentielle,portfolio,photo,photographe,sarkozy,nicolas,insertion,national,region,cantonal,equipe,retraite,senior,femme,politicien,elus,debat,discours,video,congres'

Bon, hormis qu'on y trouve deux fois "sarkozy" et une fois "sarkosy". Il est amusant de voir que juste apres on trouve "brice" et "hortefeux". Mais si...! Brice Hortefeux, ministre delegue aux collectivites territoriales, mais surtout bras droit du precedent. Et puis surtout, encore une fois, dans la liste des noms propres, il semble en manquer un... non ? Allez, je vous aide: pendant que Brice Hortefeux devenait ministre de je-sais-plus-quoi, lui devenait premier ministre...

29 novembre, 2005 14:40  
Anonymous Anonyme a écrit...

« les mesures liberticides mises en place pour tenter de les éradiquer ne manqueront pas de faire des dommages collatéraux très-horrifiques. »

Bien d'accord avec vous ! Sachant que les mesures liberticides ne manquant pas de faire des dommages collatéraux sont, pour le moment, le produit du gouvernement actuel dont les membres éminents font de la "communication", le google-bombing m'apparaît être une manoeuvre bien dérisoire pour les désamorcer.

29 novembre, 2005 15:38  
Blogger all a écrit...

Position-squatting = délit de contrefaçon

Mais personne n'ose porter plainte contre l'UMP

29 novembre, 2005 16:10  
Anonymous Anonyme a écrit...

Mon cher nagual, je ne cherche pas à faire "l'apologie de l'e-campagne" de l'UMP, pour une raison bien simple : je trouve ces détournements détestables. Je cherche juste à pointer le caractère assez hémiplégique de la plupart des condamnations.

Les actions de google-bombing ne sont d'ailleurs pas plus désintéressées que la e-campagne de l'UMP. Elles fonctionnent juste sur un autre mode. Ce qui les rend sympathiques (à certains), c'est leur positionnement politique. A ce propos, j'attends toujours de trouver sur la Toile une condamnation quelconque de la e-campagne du PS. Accessoirement, je suis également prêt à parier que le jour où des sympathisants d'extrême-droite disposeront des réseaux nécessaires pour du google-bombing, on ne parlera plus de "résistance au système" mais sans doute de mépris des internautes, de piratage de l'information etc. On aura raison, d'ailleurs. On aurait tout aussi raison d'en faire autant aujourd'hui.

Quant à savoir comment s'opposer à ces phénomènes... Comme l'observe mopt, il est très difficile de réguler cela sans courir le risque de mettre en place des mesures potentiellement liberticides. Je pense tout de même qu'il y a des points d'attaque possibles. Par exemple une réflexion sur un éventuel statut-juridique du mot-clé, par opposition à l'usage normal du mot dans un texte. Mais ce serait là un vaste et délicat débat, qui ne tiendra pas bien sur un commentaire de blog ;o)

29 novembre, 2005 16:36  
Anonymous Anonyme a écrit...

@frondeur
s'il y a des personnes qui croient qu'en cliquant sur une pub pour l'UMP, signalée comme telle, sous la bannière "liens commerciaux", elles vont obtenir le plan du métro parisien, il me semble qu'on serait en droit de doubler leurs impôts, pour cause de naïveté irréparable...

C'est marrant çà, parce que moi, quand je vois RATP écrit en bleu et souligné, je vois un lien vers la RATP, et pas vers un parti politique. Quand bien même il serait écrit en dessous que "non, non, c'est pas vers la RATP que pointe ce lien mais vers un parti qui utilise cette marque pour récupérer des adhérents potentiels".

Je ne doute pas qu'il s'agit de profiter d'une certaine actualité pour se présenter en première ligne sur les pages g00gle, ce qui est assez bien joué, en terme d'exposition.
Mais il me semble également évident qu'il s'agit de profiter de l'inattention de certaines personnes cherchant des renseignements liés à la RATP (ou tout mot clé approchant) et donc de tromper l'internaute.

Sur ce, je préfère ma naïveté insondable aux calculs politiciens de certains. Si en plus çà double ma prime pour l'emploi, c'est parfait ;o)

29 novembre, 2005 17:11  
Blogger all a écrit...

C'est quoi ce spam avec plein de liens ? j'ai vu ça aussi chez Eolas

29 novembre, 2005 18:10  
Anonymous Anonyme a écrit...

Cher Hérode. Il est vrai que je m'étais focalisé sur les derniers évènements et vous avez bien fait d'ajouter quelques points de réflexion. Pour reprendre, entre l'outil et les motivations la confusion ne doit pas demeurer : nous pouvons tout aussi bien tuer un homme qu'agrémenter un appartement avec un vase, ce dernier n'est pourtant pas incriminé. Statuer sur l'utilisation d'un mot clef ne devrait se faire que dans des circonstances clairement préjudiciable envers un individu ou une collectivité et surtout au cas par cas, mais il est vrai ici que les responsabilités seraient délicates à déterminer, et plus certainement dans le bureau d'un legislateur que sur un blog (quoique... il y en des très bien ;) ).

30 novembre, 2005 01:50  
Anonymous Anonyme a écrit...

...ou bien on est pour la liberté, la liberté des google bombers et la liberté des partis politiques de "communiquer"...

Il y a une différence entre la liberté d'individus (les google bombers) et la liberté d'une institution (les partis politiques).

Ces dernières sont tenues à un certain respect des citoyens, et ne doivent pas profiter des moyens dont ils disposent pour abuser des internautes.
Quand ils se mettent carrément dans l'illégalité, comme avec les spams, ou les pourriels, de Nicolas Sarkozy, cela devient scandaleux !

30 novembre, 2005 16:41  
Anonymous Anonyme a écrit...

Contrairement à ce que dit yr plus haut, je pense que les liens ne sont pas là pour être cliqués par mégarde mais pour faire des associations d'idées rapides. On connait la puissance des images subliminales et je doute fort qu'un lien vers l'UMP lorsque l'on cherche RATP ou SNCM nous laisse indifférent. Le rapport sera rapidement fait, au moins de manière implicite dans nos cerveaux. Et lorsque l'on dira RATP, un reflexe quasi-pavlovien nous fera adhérer à l'UMP. Cependant on ne peut adhérer qu'une seule fois et vu le prix, il vaut mieux éviter. Le fait d'utiliser une marque pour faire sa pub n'est pas réprimandable. Un designer, Ora Ito, a été lancé en faisant des contrefaçons virtuelles d'objets de marques. Et Télé2 fait ses campagnes de pub sur le dos de France Télécom ou SFR et Orange. Mais bon, il faut être bête pour taper ratp dans Google puisqu'il suffit d'abord d'essayer une adresse banale, http://www.ratp.fr, par exemple et on tombe directement sur le site.

30 novembre, 2005 18:25  
Anonymous Anonyme a écrit...

1 --- À propos des sources

@YR

C'est marrant çà, parce que moi, quand je vois RATP écrit en bleu et souligné, je vois un lien vers la RATP [...]

Effectivement, c'est marrant ! Parce que moi, quand je VOIS la copie d'écran [disponible ici --- pour éviter d'aller rechercher plus haut dans l'article], je vois Grèves des transports écrit en bleu et souligné. Ce qui n'est pas la même chose que RATP écrit en bleu et souligné...


2 --- Effet rhétorique

@ALEXANDRE
On connait la puissance des images subliminales

Il ne me semble pas que nous soyons dans un cas d'images subliminales. Faire appel au « pouvoir » des images subliminales dans cette argumentation ne me parait pas légitime.


3 --- Pour nos amis ethnométhodologues

@ ALEXANDRE

Mais bon, il faut être bête pour taper ratp dans Google puisqu'il suffit d'abord d'essayer une adresse banale, http://www.ratp.fr,

Même pas besoin d'aller jusqu'au ratp.fr, ratp suffit ! C'est vraiment plus pratique...


4 --- Considérations liminaires sur l'analyse d'un document

@ un peu tout le monde ;-)

Pour l'influence ou non des publicités dans Google.

a) Il faut prendre en compte le côté pratique (praxique même --- pour ceux qui utilisent la notion de praxis) de l'utilisation de son navigateur, de l'internet et de l'artefact ordinateur en général. En ayant pris cela en considération, il faut également s'intéresser à la taille de l'écran (en fait de la fenêtre du navigateur). Je ne suis pas certain qu'avec une taille de 1024 x 854 l'effet d'influence des publicités soit aussi important. J'ai testé les recherches google en 800 x 600 : la proximité des publicités peut interférer la lecture des résultats. En 1280 x 854... elles sont vraiment lointaines. Si des personnes de chez FT [ils ont des super-lunettes ;-)] (ou des ethnométhodologues) peuvent tester où le regard se pose vraiment dans la consultation d'une réponse google, on aura une vrai réponse... (Je viens de donner une idée aux publicitaires là ?)

b) Par contre, je trouve plus « gênant » le fait d'avoir directement la pub juste au dessus des résultats, par exemple si l'on recherche achat ordinateur apple ...

01 décembre, 2005 16:06  
Anonymous Anonyme a écrit...

Bien bien.

Sinon, quelqu'un peut m'expliquer CA ?

01 décembre, 2005 18:39  
Blogger Jean Véronis a écrit...

MKE> Très curieux (ce n'est pas un lien commercial). Je n'ai pas entendu parler de MSN bombing pour l'instant... En tous cas quelqu'un est intervenu et l'UMP ne sort plus (on l'a encore sur la requete porn sarkozy).

02 décembre, 2005 08:54  
Blogger Jean Véronis a écrit...

Bonjour à tous. Il y a eu décidément beaucoup de commentaires sur ce billet, ce qui montre que cette nouveauté médiatico-politique mérite un débat! Je n'ai pas pu réagir au fur et à mesure, parce que j'ai eu une semaine horriblement chargée (si! je bosse un peu en dehors du blog ;-).

Je remercie Hérode de souligner que je ne cherche pas à m'en prendre spécialement à l'UMP. Croyez-moi, je n'hésiterai pas à épingler d'autres partis ou tendances si l'occasion se présente.

Ceci étant, on "s'en prend" toujours plus au pouvoir en place. C'est une tradition dans tous les pays démocratiques, et je crois qu'elle est saine! Justement, pour faire le lien avec un autre thème abordé dans les commentaires, il me semble que la différence avec le "Google bombing" est bien celle-là. Les techniques se ressemblent (jusqu'à un certain point) mais elles se distinguent par un facteur primordial: leurs auteurs! D'un côté nous avons une campagne du pouvoir en place (avec un curieux mélange des genres entre un parti et un ministre de l'Intérieur, qui donne à la chose un petit côté orwellien), de l'autre une action humoristique due à des agitateurs impertinents. Je crois que l'impertinence --les Guignols, les Coluche-- sont nécessaires aux démocraties... Les pays où on ne peut pas faire ça sont la Chine, l'Iran ou la Corée du Nord.

Merci en tous cas pour la qualité et le ton de vos commentaires: sur d'autres forums et sur des thèmes analogues le débat se résume à peu près à l'invective et à l'insulte... C'est bon de pouvoir laisser un billet comme celui-là (sujet chaud) sur la première page, et de pouvoir revenir quelques jours après sans trouver un pugilat électronique généralisé. Vraiment merci à tous (et heureusement que nous ne sommes pas tous d'accord)!

02 décembre, 2005 09:47  
Anonymous Anonyme a écrit...

Firefox 1.5 + CustomizeGoogle et hop plus d'AdWords.

02 décembre, 2005 17:13  
Anonymous Anonyme a écrit...

sriou: "Si des personnes de chez FT [ils ont des super-lunettes ;-)] (ou des ethnométhodologues) peuvent tester où le regard se pose vraiment dans la
consultation d'une réponse google, on aura une vrai réponse..."

La societe EyeTools a fait des recherches dans ce sens ( http://blog.eyetools.net/eyetools_research/ ), justement sur les resultats de google : http://www.eyetools.com/inpage/research_google_eyetracking_heatmap.htm

Par contre ceux ci ne prennent pas en compte (a premiere vue, je n'ai pas lu le detail) la resolution de l'ecran.

Lien vers une "heatmap" en haute resolution : http://eyetools.com/blog/images/google/eyetools_google_search.jpg

05 décembre, 2005 12:34  

Enregistrer un commentaire

jeudi, novembre 24, 2005

Texte: Nuages dynamiques

Les lecteurs assidus de ce blog auront noté mon intérêt pour les représentations graphiques du texte sous toutes ses formes. Les nuages de mots [voir dialogue, banlieues1, banlieues2, Chirac] me paraissent par exemple être très prometteurs pour la visualisation de l'information et la navigation -- mais ils sont tout de même un peu rustiques au niveau graphique! Quand j'ai découvert (voir ici) l'affiche dynamique réalisée par Marc-André pour leroidelacapote.com [sur une idée de Jared Tarbell], j'ai eu un déclic dans ma petite tête: j'ai vu dans cette animation plus qu'une simple pub. Ne pourrait-on réutiliser l'idée pour visualiser le champ sémantique de textes? Il suffirait d'injecter dans l'animation les mots les plus fréquents (à part les mots-outils), de rendre les liens cliquables, etc. J'ai suggéré l'idée à Marc-André, en lui envoyant mes "mots des banlieues", et il m'a renvoyé ce superbe "nuage dynamique" (les mots émergent tout doucement, c'est exprès ;-) :






Rechargez la page pour obtenir une autre représentation
Clic droit pour zoomer à l'infini !

Les mots qui apparaissent représentent l'univers lexical des blogs francophones à propos des banlieues (voir méthode ici). Chaque mot est cliquable, et renvoie vers les blogs recensés par Technorati. Contrairement à mes premiers essais de nuages façon TagCloud, la taille ne reflète pas ici la fréquence, mais est aléatoire: on a une nouvelle image à chaque rafraîchissement de la page, et je trouve cette part d'aléatoire fascinante. Une nouvelle lecture émerge à chaque fois... L'oeuvre ouverte.

J'avais un peu tendance à avoir une aversion viscérale pour Flash: sites lourds qui plombent votre navigateur, impossibles à indexer, etc. Mais en y réfléchissant bien, c'est peut-être un préjugé qu'il faudrait que je réexamine de plus près. Tout d'abord, j'ai été extrêmement étonné de voir que ce fichier Flash ne "pèse "que 13 ko. Rien du tout par les temps qui courent: moins que bien des images jpg ou autres. Côté indexation, certes Flash pose un problème aux moteurs, mais ai-je vraiment envie que Google et les autres viennent indexer cette liste de mots? Je n'en suis pas encore à créer tout mon blog en Flash, rassurez-vous! Mais il y a peut-être des usages de Flash (représentations sémantiques, couplage avec des "tags", intégration de fils RSS, etc.) qui méritent un examen plus approfondi. Est-ce que finalement le fameux Web 2.0 avec lequel tout le monde se gargarise ces temps-ci, ce n'est pas un ensemble d'efforts pour trouver des technologies variées qui nous fassent sortir du carcan d'un bon vieil HTML qui nous paraît chaque jour un peu plus limité et un peu plus poussiéreux ?

Flash y aura-t-il sa place? J'aimerais bien savoir ce que vous en pensez.

Un grand merci à Marc-André et longue vie au Roi de la Capote !

29 Commentaires:

Blogger all a écrit...

[La page est lente à charger]


Clic !

24 novembre, 2005 18:57  
Blogger Eric Baillargeon a écrit...

Le Big Picture sémantique de CNET News est aussi un des rares exemples où je trouve l'utilisation du Flash assez bonne pour la visualisation de l'information et la navigation entre les articles publiés.

24 novembre, 2005 19:17  
Anonymous Anonyme a écrit...

« on a une nouvelle image à chaque rafraîchissement de la page, et je trouve cette part d'aléatoire fascinante. Une nouvelle lecture émerge à chaque fois... »

sur le plan esthétique, la réussite est indéniable ; sur le plan du sens, je serai plus réservé. chaque "nouvelle lecture" en est-elle vraiment une ? si tu entends par là que cette part d'aléatoire, en quelque sorte un point de vue de la machine porté sur le lexique extrait par les automates, donne une chance à un mot peu fréquent de nous sauter à l'oeil, pourquoi pas. mais ce résultat pourrait aussi être atteint par des processus pilotés et non par l'aléatoire.

« Flash y aura-t-il sa place ? »

en soi, la technologie flash est remarquable. mais, comme pour toute technologie déployée sur Internet, il me paraît plus important de contribuer à la promotion et au déploiement de standards ouverts, en l'occurrence le format scalable vector graphics (svg), plutôt que de favoriser l'adoption d'un format propriétaire comme flash.

a]m[+

24 novembre, 2005 19:25  
Blogger Jean Véronis a écrit...

All> Les mots apparaissent tou doucement mais c'est exprès (j'ai ajouté un petit avertissement dans le texte). Sinon, je n'ai pas l'impression que ça plombe la pge. 13 ko, ça n'est pas grand chose.

NetDisaster: Excellent! J'aime bien celui-là aussi!

24 novembre, 2005 19:28  
Blogger Jean Véronis a écrit...

Eric> Oui, je trouve Big Picture assez réussi moi aussi (je voulais en parler, et puis les journées n'ont que 35 heures, alors c'est parti aux oubliettes...)

24 novembre, 2005 19:30  
Anonymous Anonyme a écrit...

Superbe ! Un bonheur pour ce traitement des mots, d'autant plus apprécié que je suis personnellement totalement infoutu d'imaginer comment mettre en oeuvre l'appareillage technique et intellectuel (procédure) qui est derrière. Chapeau !

24 novembre, 2005 19:45  
Blogger Jean Véronis a écrit...

Luc> Merci, c'est gentil!

24 novembre, 2005 21:11  
Blogger Jean Véronis a écrit...

Michaël> si tu entends par là que cette part d'aléatoire [...] donne une chance à un mot peu fréquent de nous sauter à l'oeil: oui, tout à fait! L'inconvénient des TagClouds est qu'ils imposent une lecture unique et figée. les mots peu fréquents sont absents ou enfouis. Je suis d'accord: d'autres mécanismes sont sans doute imaginables pour arriver à un même résultat.

format propriétaire: complètement d'accord. Souhaitons que SVG se développe (je crois qu'Adobe le soutient, ce qui n'est pas négligeable).

24 novembre, 2005 21:14  
Anonymous Anonyme a écrit...

Je me joins à Michaël. D'accord, il y a des emplois très judicieux de Flash, mais on ne peut pas oublier que c'est un format fermé et propriétaire : tout le contraire du web qui repose sur des formats et des protocoles ouverts.

24 novembre, 2005 21:15  
Blogger Jean Véronis a écrit...

Christophe> Nos messages se sont croisés. Bien d'accord sur la question des formats ouverts!

24 novembre, 2005 21:19  
Blogger вирус a écrit...

Mille bravos! L'aléatoire semble effectivement mieux mettre en valeur la diversité des lectures possibles du textes. Il y a toujours cette ambivalence de la relation Forme / Fond: une forme récurrente peut être saillante, mais aussi - à l'inverse - être à se point répétée et usée qu'elle s'en trouve au contraire reléguée au statut fond ; d'ailleurs, cette dernière position de fond, à son tour, est ambivalente : "information" neutralisée ou, a contrario, présente de manière presque subliminale...
Vos prouesses techniques font naître l'envie de voir même des procédés en plus: la couleur et même le relief pourraient peut-être capter la fréquence de l'item (qui n'en reste pas moins une donnée importante, indépendamment de son interprétation), voire d'autres dimensions (lexicales par exemple).
En fait, de la première représentation demeurent deux seules choses qui me paraissent nécessiter une réflexion: la linéarité, bien sûr, mais aussi et surtout: la réduction de la matière du texte en mots clefs figurés par des infinitifs, des adjectifs et des substantifs sans articles. Je pense qu'il faut réfléchir à ce qui se passe à cette étape, pour l'instant un tantinet arbitraire.

24 novembre, 2005 22:55  
Blogger вирус a écrit...

(zut, pardon, plein de fautes de frappe: "lectures possibles du texte", "reléguée au statut de fond"; d'autres sans doute... pardon, je ne m'habitude pas à cette interface si peu pratique).

24 novembre, 2005 22:58  
Anonymous Anonyme a écrit...

Ces présentations ne sont pas très claires. Les mots qui tombent au hasard sont assez peu réalistes comme 'bois' par exemple. il faudrait pouvoir combiner le Tag cloud et ce genre de présentation tout en jouant sur le hasard. Une petite remarque, concernant les favicons de votre site, que vous pourriez personaliser.

24 novembre, 2005 23:18  
Blogger Jean Véronis a écrit...

вирус> réduction du texte aux infinitifs, des adjectifs et des substantifs sans articles: oui! c'est la pratique traditionnelle en matière d'extraction de mots-clés, mais elle pose fortement problème. Mon billet banlieues2 était une tentative pour en sortir (un peu)... Mais c'est tout un secteur de recherches qui se dessine ici (et sur lequel la communauté est peu avancée).

25 novembre, 2005 07:12  
Blogger Jean Véronis a écrit...

Alex> bois est un bug, qui provient de la segmentation, à tort, de clichy-sous-bois. Pas très compliqué à améliorer.

il faudrait pouvoir combiner le Tag cloud et ce genre de présentation tout en jouant sur le hasard: oui c'est tout à fait ma perception.

25 novembre, 2005 07:13  
Anonymous Anonyme a écrit...

"Clic droit pour zoomer à l'infini !"
N'est-ce pas un peu prétencieux ?
Après quelques clics on arrive vite à "l'infini"...;o)
me tromperais-je?

25 novembre, 2005 09:42  
Anonymous Anonyme a écrit...

« les mots peu fréquents sont absents ou enfouis. »
On ne peut pas repprocher ça au TagClouds puisque c'est justement leur raison d'être !
L'aspect aléatoire est certe artistique, mais l'objectif de la représentativité de la fréquence est perdu.

« L'inconvénient des TagClouds est qu'ils imposent une lecture unique et figée. »
Ne pourrait-on pas faire des TagClouds avec l'esthétique du "nuage dynamique" mais en gardant une représentativité de la fréquence, non pas directement proportionnelle, mais probabilistiquement proportionnelle ? Ainsi, la taille des mots reste statistiquement proportionnelle à leur fréquence mais la lecture n'est plus figée. A chaque rafraîchissement, le "nuage dynamique" change, tout est restant représentatif de la fréquence des mots ...

Laurent

25 novembre, 2005 09:58  
Anonymous Anonyme a écrit...

Pour ce type de représentation, un javascript peut être employé assez facilement, les mots étant encapsulés dans des div avec des propriétés de style permettant de jouer sur leur taille, leur position, et pourquoi pas aussi sur leur couleur en faisant varier la luminosité ?
Le coté artistique est sympatique, mais le signifiant m'est plus intéressant.

25 novembre, 2005 11:49  
Anonymous Anonyme a écrit...

Personellement, je n'aime pas Flash car il est très mal optimisé sous MacOS X et mon pauvre G4 à 400mhz rame comme c'est pas permis :(

25 novembre, 2005 14:35  
Anonymous Anonyme a écrit...

Salut Jean,
je crois que je t'ai trouvé de quoi faire un très joli nuage :-)

25 novembre, 2005 16:16  
Anonymous Anonyme a écrit...

Pour rendre à César ce qui est à César, l'idée de cet assemblage de mot vient de l'artiste Jarred Tarbell (qui distribue en plus son code en open-source) L'oeuvre en question.

En ce qui concerne Flash et le sempiternel "SVG c'est mieux", Flash progresse très vite et depuis la version 5 (2000) ne se résume plus à un outil d'animation vectoriel. C'est aujourd'hui plus proche d'une machine virtuelle à-la-java capable de se connecter à des webservices, de lire du XML de manière asynchrone (depuis 2000 !). Ce qui fait la puissance de Flash, c'est la qualité des outils de développement de Macromedia, qui ciblent les developpeurs comme les 100% graphistes (ce qui manque cruellement à SVG), mais c'est aussi son format OUVERT (mais propriétaire) qui permet à n'importe qui de générer des SWF; la communauté Open-Source Flash est d'ailleurs très forte : OSFlash

28 novembre, 2005 11:11  
Blogger Jean Véronis a écrit...

Max> Merci pour le lien vers Jarred Tarbell, que je ne connaissais pas. J'ajouterai un petit lien dans le billet. Très intéressant.

Flash/SVG: merci aussi. Débat à suivre!

28 novembre, 2005 11:53  
Anonymous Anonyme a écrit...

Ce qui a été à César est toujours à César, Max! J'ai déjà laissé un commentaire dans le billet précédent, je vais donc résumer:
Je n'ai JAMAIS prétendu que ce code était le mien...
...Les redresseurs de torts feraient mieux de connaître les règles de la communauté Opensource... Le Copyright est toujours dans le code utilisé et fourni à Monsieur Jean Veronis.
Essayez donc de faire avancer les mots au lieu de chercher la petite bête...

Marc-André

01 décembre, 2005 22:50  
Anonymous Anonyme a écrit...

Marc-André : Pardon, je n'ai jamais voulu dire que vous aviez volé le code de Jarred; celui-ci est d'ailleurs tellement connu dans la communauté Flash que le plagiat est à mon sens impossible ;) D'ailleurs s'il fournit ses sources, c'est bien pour qu'on puisse les ré-utiliser et les étendre, et l'application qui en est faite ici et très judicieuse.

02 décembre, 2005 11:37  
Anonymous Anonyme a écrit...

Comme que le flash est cliquable, on ne peut plus déplacer l'animation une fois celle-ci agrandie. Dommage.

02 décembre, 2005 17:31  
Anonymous Anonyme a écrit...

Voilà une idée que les dadaïstes, dont je viens de voir l'expo à Beaubourg, n'auraient pas renier, ni même les futuristes avec les mots en liberté. Sauf qu'à un alignement horizontal, ils auraient sans doute préféré une oblique ou une diagonale ;)
Par contre je ne m'attendais pas tomber toujours sur le même site quand je clique sur un mot; Peut-être que c'est le jeu mais même si les pages sont différentes, je pensais naviguer vers différentes adresses. En tous cas je vois déjà là tout un poème!
Super les nuages dynamiques!
Quand à la technologies Flash et oui il y en a qui sont pour, d'autre contre... mon avis? c'est un outil, avant tout, l'indexation pose un problème certes, et la souplesse de cet outil offre aussi de gros avantages.

02 décembre, 2005 23:02  
Anonymous Anonyme a écrit...

...Les redresseurs de torts feraient mieux de connaître les règles de la communauté Opensource... Le Copyright est toujours dans le code utilisé et fourni à Monsieur Jean Veronis.
Une des règles de la communauté opensource, est aussi le respect ... reprendre un code, qui, à la base est une "oeuvre numérique" à des fins marketing ... et donc commerciales ...

05 décembre, 2005 15:41  
Blogger Audrey et Greg a écrit...

L'idée originale se trouve sur http://levitated.net/daily/levEmotionFractal.html. J. Tarbell a fait ça en 2002.

27 janvier, 2009 16:45  
Blogger Jean Véronis a écrit...

Oui, je le cite dans le texte ;-)

28 janvier, 2009 13:17  

Enregistrer un commentaire

mercredi, novembre 23, 2005

Ortograf: OpenOffice vs Microsoft



La sortie de la nouvelle version d'OpenOffice en français il y a quelques jours m'a incité à étendre mon petit comparatif des correcteurs orthographiques. Dans une étude précédente [ici], j'avais comparé le correcteur de Microsoft Word avec la fonction de correction offerte par la barre Google. L'avantage était clairement à MS Word (avec le patch qu'il est important de télécharger), cet avantage provenant essentiellement d'un bon traitement des noms propres, et dans une moindre mesure, de ses capacités en matière d'orthographe grammaticale (accords en particulier). On va voir qu'avec OpenOffice le match est plus serré.



J'ai gardé le même texte fautif pour l'évaluation (un article du journal Le Monde passé au "pourrisseur" de textes : ici), et les résultats sont les suivants (le bruit est constitué des fausses alertes et le silence correspond aux erreurs non repérées):

%
BruitSilence
MSWord (avec Patch)1,721,3
OpenOffice0,025,3
Google1,724,0

Sans noms propres et mots étrangers

%
BruitSilence
MSWord (avec Patch)9,320,0
OpenOffice6,027,6
Google34,722,4

Avec noms propres et mots étrangers


Si l'on ignore les noms propres et les mots anglais cités dans le texte, OpenOffice donne un peu moins de fausses alertes que MSWord, mais ignore un peu plus de mots fautifs. La tendance est la même si l'on prend en compte les noms propres et les mots anglais: un peu moins de bruit, et plus de silence. Il est important de bien régler OpenOffice sur l'option "détecter toutes les langues": la détection de la langue semble assez bien faite, du moins sur mon exemple. La phrase "Do you like roast-beef?" citée en anglais dans le texte est bien repérée comme anglaise par OpenOffice, alors qu'elle ne l'est pas dans MSWord (il faut dire que la détection de la langue sur des fragments aussi courts est extrêmement délicate!).

On voit donc que les résultats se tiennent dans un mouchoir de poche. Globalement, il y a un léger avantage pour MSWord par rapport à OpenOffice (Google est loin derrière). Je ne veux pas être trop technique, mais on peut le mesurer précisément (si l'on pénalise de la même manière le bruit et le silence) en utilisant la moyenne harmonique de la précision et du rappel (mesure F), et elle est légèrement plus élevée dans les deux cas pour MSWord (87,4% contre 85,4% dans le premier cas; 85,0% contre 81,8% dans le second).

La performance n'est tout de même pas mauvaise pour OpenOffice, compte tenu de son caractère libre et des moyens sans aucun doute plus limités dont il dispose pour son développement. Bien sûr, il faudrait faire des tests à plus grande échelle, avec d'autres types de textes, et mon expérience n'a qu'une valeur indicative. Il me semble toutefois que les développeurs de la version française d'OpenOffice doivent faire preuve de vigilance: Microsoft a manifestement réouvert le chantier du correcteur français, avec une équipe très compétente, et sur certains points son avance conceptuelle est forte, même si elle ne transparaît pas encore beaucoup dans les chiffres. C'est le cas de la correction de l'orthographe grammaticale, sur laquelle, comme je l'ai signalé l'autre fois, Microsoft est en train d'améliorer notablement les choses. Notons également qu'OpenOffice n'intègre pas encore l'orthographe recommandée (depuis 1990...) par le Conseil Supérieur de la Langue Française et l’Académie Française telles que règlementaire, révolver, ambigüe, etc. (mais elle serait très simple à intégrer).


Post-scriptum


1. PYves (commentaire ci-dessous) a fait la même évaluation avec TextEdit sous MacOS 10.4. Voici ses résultats:

%BruitSilence
TextEdit - Sans NP/étr.025,3
Avec NP/étr.19,225,9

Performances identiques à OpenOffice si l'on ne compte pas les noms propres et les mots étrangers. Si on les compte, la performance est un peu meilleure en termes de silence, mais moins bonne en termes de bruit . Très intéressant. Merci PYves !

2. Thierry Fontenelle a traduit ce texte en anglais sur le blog de Microsoft consacré au correcteur, avec quelques commentaires introductifs (je suis totalement d'accord avec ses commentaires).

Libellés :


10 Commentaires:

Anonymous Anonyme a écrit...

Bonjour,

Rien à voir mais je me disais que ça pouvait vous intéresser.

http://www.u-blog.net/resetparam/note/58079

23 novembre, 2005 12:07  
Blogger Jean Véronis a écrit...

Mke> Oui! je reçois l'info de plusieurs sources à la fois: l'UMP récidive.

J'ai mis un lien vers votre copie d'écran dans "Aix-Echos" (cadre en haut à gauche). Merci!

23 novembre, 2005 12:20  
Anonymous Anonyme a écrit...

J'utilise OpenOffice et même si cela m'a pris un temps d'adaptation, j'ai finalement presque complètement abandonné Microsoft Office... sauf pour la correction de textes. Je copie-colle dans Word car j'y trouve plus d'erreurs, notamment pour la grammaire. Beaucoup de fautes ne sont pas (encore) détectées par OO. Dommage mais quand on compare le nombre de versions et les moyens mis en oeuvre des 2 côtés, je trouve que Microsoft fait figure de Goliath. Et je garde ma nouvelle lessive.

23 novembre, 2005 17:58  
Anonymous Anonyme a écrit...

Pour revenir à Nicolas Sarkozy, bien que ce ne soit pas par plaisir, ni le lieu, ni le moment, si l'on tape sarkozy dans google, justice est faite puisque la troisième entrée est: Iznogoud.

23 novembre, 2005 18:19  
Anonymous Anonyme a écrit...

Et pour revenir à nos moutons, dommage de ne pas avoir fait de comparatif avec le moteur intégré de MacOs X. En effet, que ce soit avec l'éditeur de texte TextEdit, Safari ichat (AIM) ou autre logiciel offrant la possibilité d'écrire, la correction automatique est activée. Très pratique, mais je ne sais pas ce que cela donne vs OO ou Word…

23 novembre, 2005 23:05  
Anonymous Anonyme a écrit...

Au secours !

Je double-clique le mot "révolver" par réflexe moteur, de la même manière qu'au cinéma, quand un zombi surgit dans le dos d'un héros, je m'agrippe à l'accoudoir de mon fauteuil.

Et là, ça lance le chargement d'une drôle de fenêtre qui me propose la traduction du mot en anglais. Fenêtre qui perturbe ma lecture et met deux secondes à se charger, et me propose, hasard fâcheux et donc pratiquement obligatoire, une traduction bien entendu inutile pour ce mot-là.

La fonction est utile, mais j'avoue que du point de vue de l'accessibilité, je la préférerais activable en option, plutôt qu'automatiquement activée... Surtout que mon triple clic habituel quand je veux sélectionner un paragraphe pour le lire ne fonctionne plus :/
Enfin bon, c'est plutôt une jolie initiative qui montre la richesse des pages dynamiques récentes, je ne veux pas cracher dans la soupe non plus :)

23 novembre, 2005 23:14  
Anonymous Anonyme a écrit...

jcm> J'ai fait le test pour TextEdit sur MacOS 10.4 :
Sans NP/étr. bruit=0,0% ; silence=25,3%
Avec NP/étr. bruit=19,2% ; silence=25,9%

24 novembre, 2005 17:49  
Blogger Jean Véronis a écrit...

Merci PYves! J'ai copié vos résultats en PS dans le message.

24 novembre, 2005 21:30  
Anonymous Anonyme a écrit...

Merci pyves.
Apple a donc bien travaillé, étonnant de leur part quand on connaît leur peu d'entrain à s'occuper d'autres langues que l'Anglais. C'est bien sûr largement perfectible avec NP…

24 novembre, 2005 23:43  
Anonymous Anonyme a écrit...

Bonjour

Openoffice utilise myspell, un correcteur ortografik dérivé de ispell... Il marche correctement, mais est en passe d'etre remplacé par hunspell, qui gère tres bien l'utf-8 (utile pour mes dictionnaires en moore, bambara...). Il est telechargeable à l'adresse suivante:

https://sourceforge.net/project/showfiles.php?group_id=143754

et je voudrai bien voir les resultats de votre test avec hunspell :)

Etienne

26 novembre, 2005 09:29  

Enregistrer un commentaire

lundi, novembre 21, 2005

E-Pub: A mots couverts

Marc-André me signale une jolie pub animée qu'il vient de réaliser [sur une idée de Jared Tarbell] pour un site spécialisé dans la vente en ligne de petits vêtements sans couture:


Cliquer sur l'image pour voir l'animation

Le parallèle avec la superbe exposition qui a lieu en ce moment même au Centre Pompidou (voir commentaire chez Fuligineuse) est peut-être un peu osé, mais je me dis que si Flash et Actionscript avaient existé à l'époque, les dadaïstes ne les auraient sans doute pas dédaignés:


Cliquer sur l'image pour voir l'animation

En tous cas, leroidelacapote.com m'a donné le vertige: moi qui ne suis pas de la "génération capote", je n'aurais jamais soupçonné que l'offre était aussi diversifiée (et parfois franchement marrante)! Ca donne envie de se mettre au LaTeX latex.

5 Commentaires:

Anonymous Anonyme a écrit...

"Marc-André me signale une jolie pub animée qu'il vient de réaliser"

Oui et bien Marc andré pourrait tout de même signaler qu'il n'a pas "réalisé" cette animation, mais qu'il a simplement copié / et réutilisé un script de J. Tarbell (fait en 2002).

Voici l'adresse du script :
http://levitated.net/daily/levEmotionFractal.html

Copier et créer c'est bien, mais citer quand même l'artiste à l'origine de la réalisation me paraît être le minimum.

--
Pierre Arlais

29 novembre, 2005 14:15  
Blogger Jean Véronis a écrit...

Merci pour le lien, Pierre. Il y a d'autres choses superbes sur ce site!

30 novembre, 2005 09:57  
Anonymous Anonyme a écrit...

Oui, on parle tout le temps de Joshua Davis ou de Yugo Nakamura, mais, dans le domaine de l'exploration - création visuelle basés sur des math / physique (via Flash ou Processing), je trouve les travaux de J. Tarbell plus aboutis.


A visiter donc pour ceux qui sont intéressés :
http://www.processing.org
http://www.flight404.com

--
Pierre Arlais

30 novembre, 2005 17:00  
Anonymous Anonyme a écrit...

Quelle agressivité concernant ce code !
Oui ce code est de Monsieur J. Tarbell, et oui je cite mes sources, car le copyright est toujours dans le code utilisé en cours, et je n'ai JAMAIS prétendu que ce code était de moi. Non mais!
Avant de penser être un redresseur de tort la prochaine fois, renseignez-vous au moins sur les pratiques de l'Opensource. On peut utiliser le code comme bon nous semble, si on respecte le copyright de l'auteur du code au sein de celui-ci, ce que j'ai fait.
Pour finir, mon intention était d'attirer celle de Monsieur Jean Veronis pour qui j'ai beaucoup de respect, justement sur ce bout de code que j'avais en stock, concernant ses travaux linguistiques, car je me suis dit que cela pourrait l'intéresser. Lui, au moins il essaye de faire avancer le schmilblick, pauvres aigris que vous êtes.
Essayez-donc ne serait-ce que de faire au moins la moitié de ce que Monsieur Veronis à fait et à transmis à ces élèves!


Marc-André

01 décembre, 2005 22:41  
Anonymous Anonyme a écrit...

1 - Agressivité
Là je ne vois pas trop d'agressivité :
à la phrase : "Marc-André me signale une jolie pub animée qu'il vient de réaliser", il était important de préciser qui est l'auteur du travail puisque ce n'est pas le dit Marc André.

2 - Open Source
Comme le précise J. Tarbell, son travail relève de la license GNU General Public License
(http://www.gnu.org/copyleft/gpl.html)
Or quand on regarde la page (http://www.leroidelacapote.com/condom/blog/?p=34) où est publiée ta version de l'animation de J. Tarbell, il n'est possible nulle part de télécharger le code source ou mention précisant qu'il est possible d'en faire la demande.
Donc tu ne respectes pas les obligations liées aux articles 2 et 3 de la license GNU General Public License...
Pour ton instruction, car tu as l'air d'en avoir grand besoin : License GPL ne veut absolument pas dire domaine public ! Il serait bon de te renseigner un petit peu avant de sortir des énormités sur l'Open Source.

Si le code source mentionnant J. Tarbell était disponible sur la page afin que d'autres puissent faire évoluer le travail de J. Tarbell, alors tout serait pour le mieux. Ce n'est pas le cas.

Qui plus est le lien sur l'animation renvoie vers un site qui n'a de fins que commerciales, le travail fourni par J. Tarbell, que tu n'as en aucun cas fait évolué (simple réutilisation sans enrichissement en terme de fonctionnalités ou autres), a donc juste été copié pour créer du click sur un lien commercial.

04 décembre, 2005 13:37  

Enregistrer un commentaire

vendredi, novembre 18, 2005

Lexique: Diplopie

Tout le monde se demande pourquoi le président Chirac a ressorti ses lunettes du temps du Bébête Show (vous vous rappelez l'aigle Black Jack?)...



C'est peut-être Libération qui a la réponse: le président souffrirait de diplopie. Voilà un mot bizarre. Voyons ce que le TLFi nous en dit:
DIPLOPIE, subst. fém.
MÉD. Trouble de la vision consistant à percevoir deux images ou plus pour un seul objet (cf. strabisme) [TLFi]

En gros, la diplopie c'est le fait d'y voir double... C'est ce qui arrive quand on a un peu trop forcé sur la bouteille, mais il paraît que Jacquot tient bien la Corona. En revanche, on savait qu'il souffrait d'un "léger trouble oculaire" lié à son accident vasculaire cérébral (AVC), sans en connaître la nature exacte. Je ne suis pas médecin (peut-être que des lecteurs pourront nous éclairer?), mais si on lit les sites spécialisés [par exemple ici] la diplopie semble effectivement être l'une des conséquences possibles des AVC. Et ça colle assez bien: si le problème était simplement une intolérance aux lentilles, on pourrait toujours lui écrire son discours en caractères géants sur les pancartes... Par contre, si le problème est mécanique, il n'y a plus que les lunettes, qui peuvent agir comme des prismes pour remettre la vision d'aplomb.

Je ne sais pas si ça peut lui permettre d'éviter de nous confondre avec des veaux, comme son Illustre Modèle, qui s'est lui aussi décidé à porter de grosses lunettes noires -- trop tard d'ailleurs (je n'ai pas réussi à trouver une seule image du Général avec ces célèbres lunettes sur le Net: incroyable, non?). En tous cas, nous aurons appris au moins un mot.

Au fait, diplo, ça veut dire "double" en grec. Comme dans diplodocus:


16 Commentaires:

Anonymous Anonyme a écrit...

Vous m'étonnez !..... :

"prime" en lieu et place de "prisme",

ainsi que :

"je ne sais pas si ça lui permettre"

Le stress ? une surcharge de travail ?

Ces observations n'enlèvent en rien la valeur de l'article cependant.

Mais n'y à t'il pas un risque de dévalorisation de votre image ?

;-))

18 novembre, 2005 11:39  
Anonymous Anonyme a écrit...

Match nul : 1 partout.

J'aurais mieux fait de me relire et/ou de me taire au vu de ce commentaire :

"Ces observations n'enlèvent en rien la valeur de l'article cependant."

Promis, la prochaine fois je fais un effort !

;-))

18 novembre, 2005 11:42  
Anonymous Anonyme a écrit...

Non : 2 - 1 :
"Mais n'y à t'il pas un risque de dévalorisation de votre image ?"
Et de votre grammaire ? :-)
Les coquilles ne sont pas importantes...
Encore bravo Monsieur Véronis.

18 novembre, 2005 11:50  
Anonymous Anonyme a écrit...

très juste !

18 novembre, 2005 12:02  
Blogger Jean Véronis a écrit...

Ouh là là! La fatigue... ou la myopie!

Merci!

18 novembre, 2005 12:06  
Anonymous Anonyme a écrit...

Et bien il y a une photo du Général avec ses fameuses lunettes, en train se signer le registre municipal de St Remy des Monts en 1965, ici : http://www.saosnois.com/St-remy-des-monts/Charles%20De%20Gaulle.htm
(je reconnais qu'elle est subtile mais ...)
Et puis aller, puisque je suis en forme, une autre ici 7 ans plus tôt mais déjà les droles de montures : http://www.elangelcaido.org/fotografos/horvat/horvat04.html

18 novembre, 2005 14:34  
Anonymous Anonyme a écrit...

Euh : Au fait, diplo, ça deux dire "double" en grec.

Deux et double font quatre. ;o)
Fatigué? Mais toujours intéressant!

18 novembre, 2005 22:13  
Anonymous Anonyme a écrit...

Double, comme dans diplodocus, ou comme dans diplomate. Mais "mate", alors, ça veut dire quoi ?

19 novembre, 2005 00:39  
Anonymous Anonyme a écrit...

Sûrement du verbe "mater", regarder. Ce qui donne Diplomate : personne qui y regarde à deux fois avant de prononcer une parole malheureuse....

19 novembre, 2005 09:25  
Blogger Jean Véronis a écrit...

Lui> On dirait que j'ai besoin d'un petit week-end de repos, moi (ou de lunettes: j'ai relu au moins trois ou quatre fois!). Merci!

19 novembre, 2005 09:55  
Anonymous Anonyme a écrit...

Diplôme vient du grec διπλωματ- diplômat, réduit à δίπλωμα díplôma au « nominatif » (c'est-à-dire la forme que prend un mot quand il est sujet ou quand on le cite dans un dictionnaire) parce que le grec ancien n'accepte pas qu'un mot se termine par un /t/. C'est de ce radical qu'il faut partir pour expliquer des mots comme diplomat-ique ou diplomat-e (dérivé du premier).

Le radical de διπλω-ματ- diplômat- est proprement le διπλο- diplo- dont parle Jean (et -ματ est un suffixe de formation de noms neutres comparable au latin -men : ainsi, à part pour l'initiale, le grec ὄνο-ματ- óno-mat- répond au latin no-men, qui nous a donné le mot nom), utilisé comme préfixe au sens de « double ».

Ce radical, à son tour, se décompose en δι- di- et πλο- plo- : le premier signifie « deux fois » et correspond exactement au latin bi- (tous deux issus d'un étymon *dwi-) tandis que le second est dérivé d'une racine verbale *pl- « plier, tresser, entrelacer », qu'on retrouve dans le latin plico (même sens ; cf. im-pliquer), verbe lié à plecto en latin, qu'on retrouve à son tour sous la forme πλέκτω pléctô en grec.

Ainsi, δι-πλο- diplo- signifie proprement « plié en deux ». Ce qui est « plié une seule fois », en revanche, est ἁ-πλο- ha-plo-, où ἁ- ha- est l'équivalement du latin sim-, tous deux issus de *sm-, « une seule fois » (pour les plus courageaux, le /h/ grec est issu de *s en début de mot et /im/ en latin vient de /em/, qui corresond à /a/ en grec de la même manière que /men/ en latin correspond à /ma/ : il s'agit de la « vocalisation » d'une nasale). Donc, ἁ-πλο- ha-plo- (penser à haplo-logie et haplo-ïde) trouve son frère jumeau latin sous la forme sim-plu-, qui nous donne « simple ».

J'en reviens à diplôme : le sens étymologique de ce mot est δι-πλω-ματ- di-plô-mat- : « chose (-ματ- -mat-) pliée (πλο- plo-) deux fois (δι- di-) ». Un diplomate est donc celui qui porte les diplômes, c'est-à-dire des actes officiels repliés (peut-être parce qu'ils sont scellés).

Enfin, il faut savoir qu'en grec ancien le δίπλωμα díplôma était au sens premier une « quantité double » puis un « objet double », que ce soit une tablette repliable, un vase formé de deux récipients ou une feuille pliée. Le sens actuel est donc limité au dernier mentionné.

Pour aller plus loin, on pourra se référer au Dictionnaire étymologique de la langue grecque de Chantraine, au Dictionnaire étymologique de la langue latine d'Ernout, au Dictionnaire grec français de Bailly (ou au Liddell/Scott, accessible en ligne : http://perseus.mpiwg-berlin.mpg.de/cgi-bin/resolveform).

19 novembre, 2005 13:18  
Anonymous Anonyme a écrit...

Oups... Toutes mes excuses à feu Meillet : il est aussi auteur du Dictionnaire étymologique de la langue latine au même titre qu'Ernout.

Petite question : saurez-vous retrouver le second radical de diplopie ?

19 novembre, 2005 13:23  
Blogger Jean Véronis a écrit...

Vincent> Superbe, cette discussion sur diplomate. J'en suis plié.

Quant à diplopie, la deuxième partie vient de ops, opos, l'oeil, non? ou bien y a-t-il un piège?

19 novembre, 2005 13:37  
Anonymous Anonyme a écrit...

Oui, c'est bien sûr le radical ὠπ- ôp- / ὀπ- op-, qui donne le nom ὤψ ôps / ὠπ-ός ôp-ós ou ὄψ ops / ὀπ-ός op-ós, « œil » mais aussi « visage » dans Αἰθι-οπ- Aithi-op-, « au visage (οπ- op-) brûlé (αἰθ- aith-, devenu æth- en latin puis éth- en français ; cf. l'éther, espace céleste igné) ». C'est de cet Αἰθι-οπ- Aithi-op- que nous tirons le nom de l'Éthiopie, proprement le « pays des visages brûlés », par référence au mythe de Phaéton (dont les maladresses ont bûlé une partie de l'Afrique et de ses habitants, disaient les Anciens).

Ce qui est moins connu, cependant, c'est que le radical indo-européen d'où est issu ὀπ- op- se manifeste aussi dans des mots à l'allure différente parce que cet étymon se terminait par un consonne complexe (une occlusive à appendice labio-vélaire : pour la petite histoire, ce radical est noté *h3ek^w- [^w = w en exposant]) dont le grec s'est débarrassée de diverses manières et qui a évolué bien différemment en latin. En effet, c'est toujours le même radical indo-européen dans des mots grecs comme optométrie, métope, prosopopée, cyclope, ou ophtalmologie mais aussi dans des mots issus du latin comme oculiste, atroce (latin atr-oc-, littéralement « à l'œil noir »), féroce (latin fer-oc-, littéralement « à l'œil farouche ») voire véloce (dans ce dernier cas, oc- n'a plus de valeur sémantique mais a été utilisé comme suffixe de dérivation permettant de former des adjectifs sur le modèle des mots précédents).

Enfin, le mot moderne en grec démotique est μάτι máti, aussi issu de ce radical : c'est le résultat d'une aphérèse et d'une apocope du diminutif ὀμμάτιον ommátion, ou le radical ὀπ- op- est devenu ὀμ- om- devant le suffixe -ματ -mat décrit plus haut. On retrouve ce radical modifié dans des mots peu courants comme ommatidie, d'après le Petit Robert : « du gr. ommation “petit œil” ; Biol. Unité optique de l'œil composé des arthropodes, formant en soi un photorécepteur complet ».

Jean, j'arrête de squatter votre blog avec mes remarques étymologiques, promis. Le mot choisi pour ce billet était très tentant, je dois dire.

19 novembre, 2005 15:19  
Anonymous Anonyme a écrit...

"Au terme de vingt jours de violences dans les banlieues, Dominique de Villepin s'inquiète du "climat d'excitation" dans le pays.

Il sent les Français déboussolés et sa majorité se raidir. "Une ambiance anti-bougnoules", dit un de ses proches.

Jeudi encore, comme les jours précédents, Matignon a reçu quelque 2 000 courriers électroniques remplis de haine et de racisme."
Christophe Jakubyszyn
Article paru dans l'édition du 20.11.05
http://www.lemonde.fr/web/article/0,1-0@2-706693,36-711961@51-704172,0.html

19 novembre, 2005 16:51  
Anonymous Anonyme a écrit...

il était aussi possible de double-cliquer sur diplopie...

21 novembre, 2005 09:02  

Enregistrer un commentaire

jeudi, novembre 17, 2005

Writing: The Nomina Sacra under the prison

It’s quite symbolic, really. A prisoner is carrying out some digging work in Meggido prison in Israel (which "plays host” to some 1,200 Palestinian prisoners), when the blows from his pickaxe uncover two beautiful mosaics, one of which represents Ichtus, a sign by which early Christians recognised each other (see my previous post [fr]):



Here in France we were distracted by other events [fr], but this story has caused quite a stir all over the world (Washington Post, Yahoo News, National Geographic). Some people believe these mosaics could have belonged to the first church in the Holy Land and perhaps in the whole of Christendom. Indeed, they appear to date from the end of the 3rd century, long before the emperor Constantine legalized Christianity in 313 and up until now believed to be a time when Christians, who were persecuted, were not in a position to build places of worship. The Israeli authorities and the Vatican immediately turned this into a major media event (the discovery could encourage tourism for the former, and strengthen faith for the latter – something which they both seem to be in real need of...) but it’s best not to get over-excited yet: the discovery is of such enormity that we ought to step back and let the experts make a calm judgement.

In any case, another picture took my breath away while I was looking through the photo albums on Yahoo and National Geographic.



Or, in modern characters:
ΠΡΟΣΗΝΙΚΕΝ
ΑΚΕΠΤΟΥΣ·
ΗΦΙΛΟΘΕΟΣ
ΤΗΝΤΡΑΠΕ
ΖΑΝΘΩ·ΙΥ·ΧΩ
ΜΝΗΜΟΣΥΝΟΝ
This translates as something along the lines of "The devout Akeptus dedicates this memorial to the God Jesus Christ" (see discussion and comments on Brandon Wason’s blog).

The three sets of letters which I have marked in pink are examples of what is called nomina sacra, something which I already talked about a few months ago [fr]. The nomina sacra is a system of abbreviations developed by the first Christians, but unlike other shorthand systems such as the Tironian notes (developed by Tiron, Ciceron’s secretary) they are only used for sacred words (God, Lord, Jesus, and such). Here, we can recognize:
Θ[Ε]Ω : God
Ι[ΗΣΟ]Υ : Jesus
Χ[ΡΙΣΤ]Ω : Christ
The nomina sacra was developed very early on (probably at the end of the 1st century, since we find it in the Egerton Papyrus 2 [1, 2]— if you liked the Da Vinci Code you’ll like Egerton ;-).



Examples of nomina sacra in epigraphy (especially inscriptions on monuments) are much less common, and there don’t seem to have been any before the fourth century (it must have been risky to display your religious beliefs on the walls... [see the discussion on Phil Harland’s blog]).

As you can imagine, I am following the story with much interest, and quite frankly with great excitement...

By the way, does Meggido ring any bells? Armageddon is the location of the Apocalypse (as well as the title of a bad film) : Har Meggido means the "mountain of Meggido" in Hebrew, and the transliteration in Greek would have given Harmagedôn (but of course, as is always the case there is some controversy surrounding this…). If you want to find out more, you can always read the cabalistic thriller of a trendy French woman writer [fr], but if you want a real Revelation, you’d be better off reading the original. It’s a bit wild, mind -- history doesn’t record what the apostle might have been smoking!


And he gathered them together into a place called in the Hebrew tongue Armageddon.
And the seventh angel poured out his vial into the air;
and there came a great voice out of the temple of heaven, from the throne, saying, It is done.
And there were voices, and thunders, and lightnings;
and there was a great earthquake, such as was not since men were upon the earth,
so mighty an earthquake, and so great.
And the great city was divided into three parts, and the cities of the nations fell:
and great Babylon came in remembrance before God,
to give unto her the cup of the wine of the fierceness of his wrath.

0 Commentaires:

Enregistrer un commentaire

mercredi, novembre 16, 2005

Ecriture: La Nomina Sacra sous la prison

L'histoire est tout un symbole: un détenu participe à des travaux dans la prison de Meggido en Israël (qui "accueille" quelque 1200 prisonniers palestiens), quand ses coups de pioche mettent à jour deux superbes mosaïques, dont l'une représente l'Ichtus, un des premiers signes de reconnaissance de la Chrétienté [voir précédent billet]:



Nous avions le regard tourné ailleurs, mais l'affaire a fait grand bruit à travers le monde (Washington Post, Yahoo News, National Geographic). Selon certains, ces mosaïques pourraient avoir appartenu à la première église de la Terre Sainte et peut-être de la chrétienté. En effet, elles semblent dater de la fin du IIIè siècle, bien avant la légalisation du Christianisme par l'empereur Constantin (313), à une époque où l'on pensait jusqu'ici que les Chrétiens, persécutés, n'étaient pas en mesure de bâtir des lieux de culte. Les autorités israéliennes et le Vatican ont immédiatement fait un tapage médiatique (la découverte pourrait renforcer le tourisme pour les uns, la foi pour les autres -- les deux semblent en avoir bien besoin...) mais il convient de rester les pieds sur terre: la découverte est si énorme qu'elle demande du recul et une analyse à tête reposée par les spécialistes compétents.

En tous cas, j'ai eu le souffle coupé par une autre image en parcourant les albums photos de Yahoo et National Geographic:



Soit, en caractères modernes:
ΠΡΟΣΗΝΙΚΕΝ
ΑΚΕΠΤΟΥΣ·
ΗΦΙΛΟΘΕΟΣ
ΤΗΝΤΡΑΠΕ
ΖΑΝΘΩ·ΙΥ·ΧΩ
ΜΝΗΜΟΣΥΝΟΝ
Quelque chose comme "Ce mémorial est dédié par la pieuse Akeptus au Dieu Jésus-Christ" (voir discussion et commentaires de Brandon Wason).

Les trois couples de lettres que j'ai encadrés en rose sont des exemples de ce qu'on appelle nomina sacra, et dont j'ai déjà parlé il y a quelques mois. La nomina sacra est un système d'écriture abrégée développé par les premiers chrétiens, mais contrairement à d'autres systèmes d'abréviation, comme les notes tironiennes, dévelopées par Tiron, le secrétaire de Cicéron, elles ne concernent que les mots sacrés (Dieu, Seigneur, Jésus, etc.). Ici, nous reconnaissons :
Θ[Ε]Ω : Dieu
Ι[ΗΣΟ]Υ : Jésus
Χ[ΡΙΣΤ]Ω : Christ
La nomina sacra a été développée très tôt (probablement à la fin du Iè siècle, puiqu'on la trouve dans le papyrus d'Ergerton II [1, 2]-- si vous avez aimé le Da Vinci Code vous aimerez Egerton ;-).



Les exemples de nomina sacra en épigraphie (en particulier sur des inscriptions monumentales) sont beaucoup moins courants, et on ne semble pas en avoir avant le quatrième siècle (ce devait être risqué d'afficher son appartenance religieuse sur les murs... [voir discussion chez Phil Harland]).

Alors, vous imaginez que je suis l'affaire avec grand intérêt, et pour tout dire avec une grande excitation...

Ah oui, au fait, Meggido, ça ne vous rappelle rien? Armaguédon, c'est le lieu de l'Apocalypse (en plus du titre d'un mauvais film) : Har Meggido signifie la "montagne de Meggido" en Hébreu, et la translittération en Grec aurait donné Harmagedôn (mais bien sûr, comme toujours il y a des controverses...). Si vous voulez en savoir plus, vous pouvez toujours lire le thriller kabalistique d'une écrivaine branchée, mais si vous voulez vraiment avoir la Révélation, lisez plutôt l'original. C'est assez déjanté (l'histoire ne dit pas ce qu'il avait fumé, l'apôtre!).

Ils les rassemblèrent au lieu dit, en hébreu, Harmagedôn.
Et le septième ange répandit sa coupe dans l'air ;
alors, partant du temple, une voix clama : " C'en est fait ! "
Et ce furent des éclairs et des voix et des tonnerres,
avec un violent tremblement de terre ;
non, depuis qu'il y a des hommes sur la terre,
jamais on n'avait vu pareil tremblement de terre, aussi violent !
La Grande Cité se scinda en trois parties,
et les cités des nations croulèrent ;
et Babylone la grande, Dieu s'en souvint pour lui donner la coupe
où bouillonne le vin de sa colère.

12 Commentaires:

Anonymous Anonyme a écrit...

Comme quoi on a encore beaucoup de choses à découvrir. Le sujet s'avère ici d'autant plus pationnant mais il faut espérer que cela ne va pas tourner au sensationnalisme (du genre faites un pélérinage sur le premier lieu de culte du monde, organisé par "les amis de la foi" ^^ ou que cela repris dans des bouquins du genre le da vinci code, genre littéraite qui cartonne pour le moment). Sinon question plus pratique, ces nomina sacra reposent-elles sur une phonétique( i.e. qu'en prononçant ces caractères ont retrouve une sonorité proche du mot signifié) ou sur une symbolique(comme les poissons que les premiers Chrétiens trçaient dans la terre pour se reconnaître)?

16 novembre, 2005 13:48  
Blogger Nicolas a écrit...

Cela me surprend toujours de voir à quel point une découverte bouleverse et surtout réécrit l’Histoire. C’est vraiment intéressant et cela montre encore une fois qu’il faut toujours gardé l’esprit ouvert sur ce qu’on présente comme étant la vérité, alors que ce n’est qu’une image élaborée à partir de ce qui est connu.
Excellent billet, Jean ! Je voudrais seulement te signaler une petite faute de frappe à la dernière phrase : l'histoire ne dit pas ce qu'est-ce qu'il avait fumé, l'apôtre!

16 novembre, 2005 14:12  
Blogger Jean Véronis a écrit...

Sébastien> En fait, ça n'est ni l'un ni l'autre. La nomina sacra prenait le plus souvent la première et la dernière lettre, par exemple KS pour KristoS. Un peu comme nous faisons quand nous écrivons en agrégé tt = tout ou qd = quand.

L'origine de ce procédé est assez mystérieuse. On peut voir une parenté avec le tétragramme sacré des Juifs, YHWH, mais c'est quand même assez différent, puisque là ce sont toutes les consonnes du mot qu'on conserve. De plus, la gamme des mots sacrés et beaucoup plus étendue, et il n'y avait pas dans la chétienté d'interdiction de prononcer ces mots...

16 novembre, 2005 14:17  
Blogger Jean Véronis a écrit...

Nicolas> Merci! (pour les compliements comme pour la coquille!)

16 novembre, 2005 14:19  
Blogger all a écrit...

ΜΝΗΜΟΣΥΝΟΝ, mnèmosunonn
encore aujourd'hui

16 novembre, 2005 16:34  
Anonymous Anonyme a écrit...

petite remarque qui donne un coté actuel à la "nomina sacra".

pour le tétragramme des juifs, il faut souligner le fait que c'est toute la langue hébraïque qui est écrite avec des consonnes. les voyelles sont des simples ajouts aux mot ( au dessus et en dessous) et ne sont pas révélatrices de sens : les sens des mots sont liés à leur racines de trois lettres, et les mots liés par leur racine commune ont un sens proche.

en résumé, en hébreux : une lettre est une consonne.

d'autre part il est fréquent encore aujourd'hui que dans les prières en hébreu (et même dans leur traduction) on abrège le nom de D... de cette manière, pour traduire le coté inexprimable du nom.

enfin, la tradition juive rapporte l'existence de 2 niveaux de grec, l'un parlé par tout le monde, et l'autre par des personnalités supérieures (diplomates).
cette "langue" de niveau supérieur ( ou plutot "langue-pensée") est une forme de grec supérieur dans lequel a été traduite la thora en grec pour la première fois par des rabbins : il s'agit de la septante. on dit que cette langue est la seule à part l'hébreu qui permette de traduire la thora sans en dénaturer le sens.

je vois là aussi un parallèle intéressant avec la nomina sacra.

16 novembre, 2005 17:25  
Anonymous Anonyme a écrit...

J'ajouterai à ce très intéressant billet que « nomina sacra » est un pluriel neutre en latin et non un féminin et que si « la nomina sacra » peut choquer un latiniste, c'est une confusion très fréquente dans l'histoire de notre langue, dans laquelle de nombreux neutres pluriels (latins ou grecs puis latins) ont été réinterprétés comme des féminins : « Biblia » (les livrets) --> « la Bible », « folia » (les feuilles) --> « feuille », etc. J'ai donné d'autres exemples dans http://fr.wikipedia.org/wiki/Langue_romane concernant ce procédé.

D'autre part, « Ichtius » a un i en trop.

17 novembre, 2005 07:19  
Blogger Jean Véronis a écrit...

Merci Vincent! bel article sur Wirkipedia. Je mets un lien cliquable : langue romane.

17 novembre, 2005 07:56  
Anonymous Anonyme a écrit...

Hum ! Pas mal d'inexactitudes dans ce billet. C'est certes une grosse découverte mais certainement pas la première église de la chrétienté et probablement même pas la première connue de Palestine : la Maison de Pierre à Capharnaüm est probablement un édifice de culte/pèlerinage chrétien dès la fin du Ier s. L'édifice chrétien (domus ecclesiae) de Doura Europos en Syrie est antérieur à la destruction de la ville en 256-257. Par ailleurs, les chrétiens n'ont pas attendu 313 pour construire des églises ! Dès la seconde moitié du IIIe s. il y a quantité de domus ecclesiae dans tout l'Empire et à Rome en particulier (les tituli) : en effet, pendant la "Petite Paix de l'Eglise", entre 261 et 295, les chrétiens ont eu tout loisir d'aménager des édifices de culte. Bien sûr on n'en a pas ou presque de traces archéologiques (elles ont disparu sous les églises postérieures) mais ils sont connus par les sources littéraires, y compris non chrétiennes... Donc attention à ne pas entrer dans le jeu médiatique de l'interprétation hyperbolique d'une telle découverte.

17 novembre, 2005 17:04  
Blogger Jean Véronis a écrit...

Marsyas> Pas mal d'inexactitudes... Vous n'en pointez qu'une, que d'ailleurs je ne reprends pas à mon compte, celle de "première église de la Terre Sainte et peut-être de la Chrétienté". Je dis bien que l'affaire "demande du recul et une analyse à tête reposée par les spécialistes compétents". Si vous lisez les débats actuels, vous verrez que tous ne sont pas aussi péremptoires que vous. Je suppose que tout est dans la définition qu'on veut bien donner au mot église. Bien entendu, il y a eu des lieux de culte depuis l'origine même du Christiannisme, mais beaucoup d'auteurs s'accordent à mentionner Dura-Europos (en Syrie) comme première église proprement dite (connue, bien sûr). Comme vous dites, elle est datée de la première moitié du IIIè siècle. Donc, tout dépendra de la date qu'on finira par fixer à l'édifice de Meggido, mais en tous cas, la localisation de cette découverte est exceptionnelle.

Je suis d'accord avec vous sur le battage médiatique. Mais il a lieu surtout à l'étranger. L'absence inverse d'information en France est surprenante.

17 novembre, 2005 22:41  
Anonymous Anonyme a écrit...

Si je puis me permettre, en passant, je voudrais rappeler que mettre à jour n'est pas mettre au jour. Rien de bien grave, je vous l'accorde.

18 novembre, 2005 14:57  
Blogger Chantal Raza a écrit...

Ixtus est un anagramme grec le voici....

Poissons en Grec = Ixtus
Le u en grec se prononce i


Soit IXTIS

I = Iesou = Jésus
X= Xristos = Christ
T = Theo = Dieu
I = Ios = Fils
S = Sotir = Sauveur

Ixtus

A bientot! ;)

03 février, 2008 07:01  

Enregistrer un commentaire

lundi, novembre 14, 2005

Texte: Chirac sur un nuage

Voici les "nuages" de mots [voir 1 et 2] de l'allocution du président Chirac, diffusée il y a quelques minutes (la taille reflète la fréquence; vous pouvez cliquer pour avoir les contextes d'utilisation de chaque mot):

Les noms (qui apparaissent au moins trois fois) :


Les verbes (qui apparaissent au moins deux fois):


Rappel des difficultés que vivent nos compatriotes (il faut être "près des gens"...). Rappel à la loi. Rappel des devoirs. Le mot banlieue n'est jamais prononcé. Le président parle de quartiers (c'est connu) ou de territoires (ça, c'est nouveau). Mais je vous laisse commenter librement...

L'original est disponible en version écrite et audio sur le site de l'Elysée.


20 Commentaires:

Anonymous Anonyme a écrit...

Je suis certain que « devoir » et « savoir » (voire « pouvoir ») ne sont pratiquement jamais utilisés à l'infinitif comme verbes dans un tel contexte, mais comme des substantifs. La nature ne veut strictement rien dire, tout est dans la fonction des mots.

14 novembre, 2005 22:39  
Blogger Jean Véronis a écrit...

Dominique> Exact! J'ai tout passé dans un "lemmatiseur" qui calcule (modulo quelques erreurs par-ci par-là) la forme de base de mots. Les formes de "devoir - verbe" sont les suivantes :

7 doivent
3 doit
1 devons

Le mot "devoir" - nom est employé une fois lui aussi (le devoir de la République), mais il n'est pas comptabilisé avec le verbe "devoir".

Merci Dominique de ce regard attentif qui me donne l'occasion de préciser les choses!

14 novembre, 2005 22:51  
Blogger Loran a écrit...

c'est etrange ce mot difficulté au milieu des autres mots plus "presidentiels".

Bonne soiree

14 novembre, 2005 23:17  
Blogger Jean Véronis a écrit...

Loran> On a dû lui souffler qu'il fallait qu'il se rende "proche" de ceux qui souffrent : "Face aux souffrances et aux difficultés de tant de nos concitoyens", " Des problèmes, des difficultés, beaucoup de Français en ont. " , etc.

Dommage que je n'aie pas eu le temps de générer les contextes comme pour "banlieues"...

14 novembre, 2005 23:24  
Anonymous Anonyme a écrit...

C'est un veritable vocabulaire de geographie spatiale et sociale:

- le lieu
- le groupe social

Avec un groupe de mots pour evoquer la crise:

- crise, violence, evenement

Et un rappel aux principes:

- loi, republique, regle

C'est marrant mais si on regroupe les mots par classe semantique on dessine (automatiquement) le sens politique du discours

Commentaires d'un beotien je le precise ...

15 novembre, 2005 07:00  
Blogger Jean Véronis a écrit...

Anonymous> Béotien. Pas tant que ça, c'est bien vu.

15 novembre, 2005 08:23  
Blogger Jean Véronis a écrit...

J'ai ajouté des liens vers les contextes...

15 novembre, 2005 08:23  
Anonymous Anonyme a écrit...

Derrière ces nuages de mots, il faut plutôt voir les termes que les conseillers en communication de Mr Chirac ont décidé de bannir de ce discours.
Aucune trace du mot immigration, auquel nous ramène pourtant la plupart des thèmes évoqués par Mr le président (appartenance à la république, incitation à la discrimination positive, regroupement familiale...)

15 novembre, 2005 10:05  
Anonymous Anonyme a écrit...

Dommage, quelque part, qu'on n'enseigne pas - il ne semble pas, du moins - ce genre de techniques aux rédacteurs des discours présidentiels. Ca permettrait de calibrer un discours pour ce qu'on veut en faire, au besoin en rajoutant des mots pour faire gonfler le nuage dans un sens ou dans l'autre.

Je suppose que ce nuage n'est pas anodin. Il doit se dégager du discours une impression, une tonalité, que cette mesure met plus ou moins au jour, en révélant les mots les plus employés.

Cela dit, pour donner une note politique, je suis étonné par la teneur de ce discours, tout de même. Je trouve que ça ne ressemble pas vraiment à du Chirac. Il aurait changé de rédacteur ?

15 novembre, 2005 10:08  
Anonymous Anonyme a écrit...

Cher theorus, heureusement que les rédacteurs des discours présidentiels (ou autres personnalités politiques) ne sont pas formés aux techniques de haut niveau d'analyse du langage et de discours :)

Sinon, j'ai lu la version écrite du discours sur le site de l'Elysée et j'ai remarqué que l'expression (mythique ?) "mes chers compatriotes" revient 3 fois. Au début, au milieu et en fin du discours. Calcul des rédacteurs ?

En tous cas, ce blog est passionnant, peut-être aussi parce qu'on y tient pas un discours passionné ;)

15 novembre, 2005 11:32  
Anonymous Anonyme a écrit...

Croyez-vous que les personalités politiques utilise(ro)nt des "nuages" pour concevoir leurs discours ? je crois qu'il éxiste des logiciels qui permettent cela... C'est enrichissant en tout cas, une fois de plus.

15 novembre, 2005 13:40  
Anonymous Anonyme a écrit...

Et a un autre niveau existe-t-il des outils pour inventorier et classer les figures(?) employées dans son discours, par exemple : "Mettre en cohérence discours et actes" etc.

15 novembre, 2005 15:39  
Anonymous Anonyme a écrit...

Dièse : Aucune trace du mot immigration

Rappelons que certains considèrent comme des immigrés les Antillais, les Réunionnais, les Mahoris, les Harkis, alors qu'ils ont payé un lourd tribut avant d'appartenir à la France. Immigré, c'est le mot soft, politiquement correct dans leur langage raciste pour parler des gens qui sont d'une autre couleur ou dont les parents sont venus d'un autre continent. Noir antillais ou Noir africain, Arabe ou Kabyle algérien ou Arabe ou Kabyle harki, quelle différence ? Et celui qui est issu d'un mariage mixte, il est encore immigré ? Toujours immigré ? Ses enfants le seront encore et on comptera les quartiers de francitude comme on le faisait pour les quartiers de noblesse ou de métissage ? Cette logique folle nous conduit au désastre.

15 novembre, 2005 18:48  
Blogger Jean Véronis a écrit...

David> outils pour inventorier et classer les figures -- je ne pense pas...

15 novembre, 2005 20:59  
Anonymous Anonyme a écrit...

Très intéressant en effet... On peut aussi remarquer que le mot "naturellement", un tic célèbre de Chirac est absent du discours. Pour mémoire, le 3 mai dernier au 20h, il l'avait répété 20 fois si j'ai bien compté:
Constitution pour l' Europe: Interview de M. Jacques CHIRAC

De là à penser que le président est si largué qu'il ne trouve plus rien de naturel à la situation, il n'y a qu'un pas...

Merci en tous cas pour cette analyse.

Jul

15 novembre, 2005 22:30  
Anonymous Anonyme a écrit...

chirac :

« Je rencontrerai également l'ensemble des responsables de l'audiovisuel. Les médias doivent mieux refléter la réalité française d'aujourd'hui. »

loi instituant un état d'urgence :

« article 11-2 Habiliter les mêmes autorités à prendre toutes mesures pour assurer le contrôle de la presse et des publications de toute nature ainsi que celui des émissions radiophoniques, des projections cinématographiques et des représentations théâtrales. »

mais où est donc annoncé le rétablissement du ministère de l'information ?

]m[

ps : kirovitch, je compte personnellement quatre occurrences des chers compatriotes

16 novembre, 2005 05:29  
Blogger Daniel Berzosa a écrit...

Bonjour,
Membre du collectif "univers de marques", je voulais attirer votre attention sur notre blog "marketing Patrol" qui publie des bulletins d'etonnement.En marge de l'affaires Sarko-Adwords, j'ai noté depuis que certaines compagnie d'assurances (natamment assurland" et autres opérateurs adwordiens se sont lancé dans le "fear marketing", surfant sur la vague racailleuse. C'est là une nouveauté où le marketing y gagne ce que l'humanité y perd...Je donne quelques exemples relevés ce matin, mais je n'ai pas tapé l'intégralité des "maux-clés", naturellement...
L'adresse du blog : http://marketingpatrol.blogspot.com/

16 novembre, 2005 13:16  
Anonymous Anonyme a écrit...

Je voulais réagir sur la photo du président en fin de votre billet. On y voit écrit "Déclaration aux Français".
Or une coquille sur le site de l'Elysée a fait dire "Déclaration au français" au singulier. Qu'ont-ils avec le français nos hommes politiques?



la preuve en image

17 novembre, 2005 07:14  
Anonymous Anonyme a écrit...

Pascal Riché sur A l'heure américaine avait fait le même exercice avec un discours de Bush justifiant la guerre en Irak... je crois qu'il faut quand même aller revoir ça, qui est bien plus saisissant que le discours de Chirac :
http://usa.blogs.liberation.fr/2005/06/pourquoi_la_gue.html

17 novembre, 2005 12:50  
Anonymous Anonyme a écrit...

à Theorus :
Parfois, certains hommes politiques n'hésitent pas à utiliser les travaux de lexicologie politique.
Un exemple : Deroubaix et Gobin on réalisé une étude du vocabulaire de présentation de la Commission européenne par les présidents successifs de l'origine à jacques Delors. Cette étude a circulé dans les milieux européens. La lecture de la première déclaration du successeur de M. Delors, M. Santer est éclairante. L'étude avait par exemple mis en évidence l'usage nouveau introduit par Jacques Delors de s'adresser au parlement en interpellant les députés. Jacques Santer reprend cet usage, dans les mêmes formes. Qu'une partie du vocabulaire soit commune à delors et Santer, quoi de plus "normal" c'est la règle dans ce genre de discours. Mais la reprise de la forme et du vocabulaire attaché à cette forem est plus rare. Tout ça n'est évidemment que difficilement "prouvable". mais est néanmoins sensible.

29 novembre, 2005 14:20  

Enregistrer un commentaire

Google: Define:racaille

TOMHTML, lecteur fidèle de ce blog, me signale la perle suivante (je passe sur la faute d'orthographe...) :



TOMHTML avait promis de créer un best-of des définitions tordues de Google dans un commentaire à mon coup de Gougueule d'avril sur la vision de la femme à travers la fonction define, et il a tenu parole ici. Ca mérite le détour. Souvent tordant, mais expliquez à vos élèves de français langue étrangère que c'est un jeu, pas un vrai dictionnaire! S'ils veulent de vraies définitions, il y a un véritable trésor qui ne demande qu'à être consulté.

Et puis, il y a aussi quelque chose d'autre, plus simple (je reconnais que le TLFi est un peu compliqué) mais superbe, dont je parlerai les jours prochains. Indice: il faut chercher sur ce blog (quelqu'un a déjà trouvé mais n'a pas mis de commentaire, donc le suspense continue).

Libellés :


9 Commentaires:

Blogger TOMHTML a écrit...

Merci Jean, pour ce post :)
J'espère bien compléter ma petite liste de définitions étranges... d'ailleurs, si on retire les définitions extraites de wikipedia, elles sont toutes plus ou moins étranges.
Le pire c'est que n'importe qui peut avoir ses définitions dans Google. En effet, la méthode est simple : il suffit de créer une page, avec pour titre (title + H1) "Lexique", "Définitions" ou "Dictionnaire" , de faire une liste de mots (balises li), de mettre le premier mot de chaque "li" en gras, le faire suivre de deux points et d'une phrase courte.
Et voila, vous êtes dans Google Define :)
Je vais créer une petite page "test" ;)
@+ et encore merci Jean.

PS : une petite définition trouvée après avoir vu notre président à la télé tout à l'heure : define:Lunettes

14 novembre, 2005 20:27  
Anonymous Anonyme a écrit...

Toutes ces définitions sont bien délirantes... :)

Mais un tel manque de précision est étonnant de la part de Google. En effet, outre les définitions plus ou moins humouristiques, on trouve beaucoup de définitions qui n'ont rien à voir... ou qui n'en sont pas. L'exemple des lunettes, dont la source est sur-représentée dans les résultats de l'opérateur define en français est un bon exemple de non-définition.

Quant à la devinette... Hmmm... Quelque chose d'autre, plus simple que le TLFi mais superbe... S'agit-il d'un outil en rapport avec votre activité de recherche ? J'ai peut-être une idée...
Bon, allez, je me lance : ne serait-il pas question du DISFA ?

14 novembre, 2005 21:21  
Blogger Jean Véronis a écrit...

Lokin> Non, ce n'est pas le Disfa!

14 novembre, 2005 22:34  
Blogger TOMHTML a écrit...

Un petit lien au passage pour que google référence ma page test : Dictionnaire des définitions. Oui j'insiste un peu sur le titre et sur les définitions, tant qu'à faire... ;)
Je vais tenter de faire plus de lien pour que google indexe bien cette page, et on en reparlera dans quelques temps...

14 novembre, 2005 22:49  
Anonymous Anonyme a écrit...

Je suis en effet allé chercher bien loin une réponse qui se trouvait juste sous mes yeux... ;)
Mais ça m'aura au moins permis de découvrir les projets de recherche de l'équipe DELIC !

Et après tout, ne peut-on pas envisager la consultation du DISFA par le biais de la solution ? ;)

15 novembre, 2005 00:45  
Blogger Jean Véronis a écrit...

Lokin> Oui, je travaille sur le DISFA, version HTML, avec une recherche en ligne, etc. J'ai déjà une maquette, et j'espère que je pourrai la monter bientôt...

15 novembre, 2005 07:12  
Anonymous Anonyme a écrit...

Dans un autre genre (même pas avec la fonction define) quand on tappe "failure" dans Google, on a la biographie de Bush qui remonte en tête ;-)

15 novembre, 2005 13:45  
Anonymous Anonyme a écrit...

mais ou est passé notre président?
celà m'a bien amusé!!!

define: Chirac

Chirac est une commune française, située dans le département de la Lozère et la région Languedoc-Roussillon. Ses habitants sont appelés les Chiracois.
fr.wikipedia.org/wiki/Chirac_(Lozère)

29 novembre, 2005 15:35  
Anonymous Anonyme a écrit...

Bonjour à tous,

J'ai monté il y a quelques temps un "dico subjectif" qui contient quelques perles.
En ce moment, il est en "repos" et je revalide les 15000 définitions...
Cela peut vous intéresser

http://www.crieur.com

08 janvier, 2006 07:34  

Enregistrer un commentaire

vendredi, novembre 11, 2005

Google: Poilus

Évidemment...



Ce n'est pas de cela que je voulais parler en ce 11 novembre, mais pourquoi pas... Vous vous souvenez sans doute que j'avais exprimé ma lassitude face à ce genre de liens, que nous ne désirons pas tous, et en tous cas pas n'importe quand (allez gérer votre classe de CM2 qui fait des recherches sur les femmes politiques, les hommes préhistoriques ou... les poilus!).

Mais pour être tout à fait honnête, ce matin je n'avais pas le filtre "SafeSearch" activé. Dans le courant de l'été, Google a en effet introduit cette fonctionnalité dans le formulaire de recherche français de façon très discrète --plusieurs années après son introduction sur le formulaire anglophone (il a été introduit aux US en 2000). Il faut dire que là-bas, des résultats du type de ceux que je dénonçais dans mon précédent billet provoqueraient un tollé général de la part des associations de parents et autres lobbies, qui serait de nature à faire plier même le dieu de Mountain View (et pour éviter tout souci, le filtre était même efficace à 150%!). Je suis bien placé pour savoir que le filtrage n'est pas plus compliqué en français qu'en anglais (on connaît les mots-clés, n'est-ce pas...) et donc, je persiste dans ma suspicion : c'était autant d'argent de gagné en attendant que les autres pays râlent. No evil of course, just money.

Et justement, les Frenchies commençaient à râler, et pas seulement sur ce blog (qu'ils lisent avec attention au Googleplex): j'ai senti clairement un ras-le-bol monter au cours des derniers mois, notamment de la part des enseignants qui doivent gérer la chose quotidiennement dans leurs classes. Les marketoïdes de Moutain View ont dû considérer que l'absence de filtrage allait leur faire perdre plus d'argent que sa présence. Reste à évaluer son efficacité (on peut fort bien imaginer pour le français une étude telle que celle des collègues de Harvard que je mentionnais plus haut).

Première impression tout en touillant mon café ce matin (donc pas très scientifique): il y a un net progrès. Voici ce que la requête poilus donne avec le filtre activé:



Bizarre quand même l'association à femmes, mais bon, le lien n'est pas trop méchant (juste quelques rencontres avec des filles de l'Est, mais ça n'est pas trop chaud).

Voilà pour les annonces publicitaires. Mais le plus étonnant ce sont les liens normaux, non "sponsorisés", sur la première page. Très propres dans les deux cas, filtre ou pas. Idem avec femmes enceintes. Plus de vidéos et autres actions "live" avec des femmes enceintes sur la première page. Même les liens commerciaux sont assez "soft".

Technologies du langage est toujours premier [voir ici] sur la requête "sexe hard" (l'une des requêtes les plus juteuses du Web -- sans mauvais jeu de mots), mais seulement avec SafeSearch activé:



Il est très intéressant de constater que les pages qui sont référencées sont celles de mes index (par date et par catégorie), qui sont sur le site de l'université (www.up.univ-mrs.fr) et pas sur Blogger. Mes pages qui parlent de "sexe hard" (en tout bien tout honneur!) sur aixtal. blogspot.com [ici et ici] ne sortent que si SafeSearch est activé. Google se méfierait-il de la "safitude" de sa propre filiale (accusée d'ailleurs d'être une "spam factory" [1, 2])?

Bien sûr la protection est très illusoire (quel enfant ou ado ne saura pas désactiver le filtre?), mais ça va quand même dans le bon sens. Un bon point pour Google (pourvu que ça dure). Yahoo va un peu plus loin, puisqu'il propose le filtre parental par défaut et qu'il faut faire un effort explicite pour le désactiver:



Mais bon, il reste du boulot pour que toutes les sensibilités puissent cohabiter sur le Web en bonne harmonie (je ne suis pas pour la censure)...

Libellés :


9 Commentaires:

Anonymous Anonyme a écrit...

Un détail : " Mes pages qui parlent de "sexe hard" (en tout bien tout honneur!) sur aixtal. blogspot.com [ici et ici] ne sortent que si SafeSearch est activé"

c'est si le filtre est désactivé, non ? ou bien je n'ai rien compris.

11 novembre, 2005 18:12  
Blogger Jean Véronis a écrit...

Ce commentaire a été supprimé par un administrateur du blog.

11 novembre, 2005 19:03  
Anonymous Anonyme a écrit...

Alors c'est l'hypothèse où je n'ai rien compris alors...!


Dans le commentaire juste au-dessus vous me dites, premier paragraphe "Lorsque le filtre est activé..." et dans le second "Par contre avec le filtre activé..." : c'est bien la même chose ? Ou alors sans le savoir en cliquant sur ce lien je suis entré dans .. la quatrième dimension.

J'ai l'impression que mon commentaire sur les google news à éveillé l'intérêt d'au moins un individu... Je prégère toutefois ma capture d'écran à celle de media-tech (elle est ici http://www.carantec-pc.com/downld/villepin-sarko.jpg)

12 novembre, 2005 11:09  
Blogger Jean Véronis a écrit...

Souplounite> [Aaarg... J'ai buggué dans mon commentaire, un doigt qui glisse et ont dit le contraire de ce qu'on veut dire... Je refais et je supprime l'autre pour ne pas généner plus de confusion. Merci!]

---

Non, non, justement! Lorsque le filtre est désactivé les cinq ou six premiers sont des trucs vraiment en rapport avec le sujet, du genre super crad: vidéos extrêmes, etc. Ils doivent avoir au moins trois cent fois chacun des mots clés du domaine ;-) Sans parler des photos. Cliquez sur le premier et vous serez édifié. Je ne peux pas les battre (surtout que je ne rapporte rien à Google, sauf des ennuis). Donc, Technologies est 6 ou 7è...

Par contre avec le filtre activé, tous ces sites partent aux oubliettes, et Technologies, qui est très BCBG, sort premier: bon PageRank, etc.

Conseil (gratuit) aux référenceurs: si vous voulez que votre site sorte premier sur certains mots-clé douteux, ne forcez pas trop la dose...

12 novembre, 2005 11:29  
Anonymous Anonyme a écrit...

Pour faire disparaître toutes les publicités des pages de résultat de Google, vous pouvez utiliser Mozilla Firefox avec l'extension "CustomizeGoogle" (http://www.customizegoogle.com/). Evidemment si les liens à problème sont dans les résultats, ça ne résout pas tout, mais au moins aucune pub n'apparaît. Et puis pour les utilisations type "classe de CM2", autant supprimer toutes les publicités, mêmes celles qui sont "légitimes".

12 novembre, 2005 12:58  
Anonymous Anonyme a écrit...

On peut aussi utiliser d'autres moteurs, moins pollués par la publicité. Ou alors, si on désire garder les performances de Google (un bon moteur tout de même :o), utiliser des meta-moteurs se basant sur les résultats de Google (et d'autres...).
Ex. : Mozbot, un joli produit régional (auvergnat).

14 novembre, 2005 12:04  
Blogger VinZ a écrit...

Je trouve le filtre utile. Au début, réticent à la censure, je l'avais désactivé sur Yahoo!, mais au bout de quelques recherches d'images et surtout de vidéos, je l'ai vite remis : si vous cherchez des vidéos d'une chanteuse, vous trouverez aussi pas mal de vidéo de filles du même nom, du strip-tease (ce que, à la rigueur, je pourrais accepter) jusqu'au porno (ce qui m'agace beaucoup plus)... Surtout que Yahoo! associe une image à chaque vidéo..

Réactiver le filtre m'a permis de me débarasser de tout ça dans mes recherches...

14 novembre, 2005 17:01  
Anonymous Anonyme a écrit...

Sur google images, il me semble que le filtre est active par defaut. Je me trompe ?

21 novembre, 2005 12:18  
Anonymous Anonyme a écrit...

Aujourd'hui dans Libé, Marcella Iacub: "Madame Bovary ou les vertus de la pornographie".

"Il n'y a pas si longtemps, on ne cessait de mettre en avant [le fait que les 'sauvageons' passeraient trop de temps à regarder des films pornographiques] pour expliquer les comportements délétères de ces jeunes hommes, dont l'amusement principal était, avant qu'ils ne décident de mettre feu à des voitures, de violer en bande leurs voisines des cités. Après tout, ne pourrait-on dire que s'ils brûlent des voitures c'est pour montrer qu'ils sont des hommes, qu'ils sont puissants comme les acteurs des films porno auxquels ils sont censés s'identifier? Une fois toutes leurs voisines violées, ne fallait-il passer à une vitesse supérieure dans la démonstration de virilité? Mais si personne ne fait aujourd'hui cette suggestion, c'est qu'au fond on ne croit pas vraiment que ces films soient cause du moindre comportement délétère."

Bonne lecture MM. les censeurs.

29 novembre, 2005 09:59  

Enregistrer un commentaire

jeudi, novembre 10, 2005

Aixtal: One candle and 228,000 unique visits


One year, 240 posts, 228,000 unique visits, 570,000 page views ... It’s been quite an adventure!

[Thanks Logogle]

To be honest, I can’t remember the exact date I created Aixtal (and it seems to be quite in fashion lately to forget one’s date of birth ...), but it was some time around the end of October 2004. I wrote a couple of test posts then deleted them immediately. The first post that’s still online dates from 10 November 2004; in it, I announced the release of Firefox in French [fr]. It all seems so long ago ...

At the time, my aim in starting this blog was to try out this new technology. I told myself that it could be a useful way of making announcements (like the one about Firefox) to my students in Traitement Automatique des Langues (Natural Language Processing) in Aix (hence the name Aixtal). But once I realised that other people had started poking around and finding things they liked, such as this post [fr], or this one [fr], I realised that I would have to take things more seriously and re-read everything I post [on the use of this word in French: fr] (I get a rap on the knuckles for every mistake I make – and you don’t miss a single one ;-).

The number of people reading this site really took off when I started writing about Google [1, 2, 3...] It even led to a kind of rave party here in Aixtal-en-Bloggie [fr], which threw me into a bit of a panic, I must admit (I’m not used to it, you see). And so it went on, with many an exciting moment (like this [fr]). The clickable chart below shows some of the highlights ...


It’s been a marvellous experience, and I have really learned a lot from you all. A blog teaches you rigour, and modesty … Whenever you slip up, there’s always someone there to point it out to you - in the nicest possible way. I am truly touched by the relevance and (mostly) the politeness of your comments.

My heartfelt thanks to you all!

3 Commentaires:

Anonymous Anonyme a écrit...

Hear! Hear!
Great blog keep up the good work, and thanks for letting the anglophones in on the fun. I read the postings in French too just not very well.

However, I am saddened by the lack of Anglophone comments. It must hardly seem worth it to write in English.
p.s. I don't know how to sing happy birthday in French in case you were wondering.

13 novembre, 2005 23:01  
Anonymous Anonyme a écrit...

Congratuations. Thanks for a great blog.

13 novembre, 2005 23:54  
Anonymous Anonyme a écrit...

Just to add to the anglophone comments, let me wish you a happy blogday as well!

14 novembre, 2005 23:01  

Enregistrer un commentaire

Aixtal: Une bougie et 228 000 visiteurs uniques


Un an, 240 billets, 228 000 visiteurs uniques, 570 000 pages vues... Quelle aventure!

[merci Logogle]

En fait, je ne me souviens plus très bien de la date exacte à laquelle j'ai créé Aixtal (c'est une coquetterie très à la mode que d'oublier sa date de naissance...). C'était à la fin octobre 2004. J'ai dû publier un ou deux billets à titre de test, que j'ai effacés ensuite. Le premier billet qui reste est daté du 10 novembre 2004. J'annonçais la sortie de Firefox en français. Ça me paraît bien loin...

A l'époque j'ai créé ce blog pour tester la technologie, en me disant que ça pourrait servir pour faire passer des annonces (comme celle de Firefox) à mes étudiants de Traitement Automatique des Langues à Aix (d'où le nom Aixtal). Et puis, je me suis aperçu que d'autres gens venaient butiner. Il y a des billets qui ont commencé à plaire, comme celui-ci, ou celui-là. Alors, il a fallu que je m'applique, que je relise deux fois tout ce que je "poste" (pan sur le bec à chaque faute, vous ne me loupez pas ;-).

Ce qui a fait décoller l'audience c'est mes petites Gougueleries [1, 2, 3...] Ça a même provoqué une rave géante à Aixtal-en-Bloggie, qui m'a un peu affolé (je n'étais pas habitué). Et puis ça a continué comme ça, avec pas mal de moments forts (par exemple ici). La carte cliquable ci-dessous résumé tout...


C'est une grande expérience. Vous m'avez beaucoup appris. Le blog est une formidable école de la rigueur, et de la modestie... Dès qu'un mot dérape il y a toujours quelqu'un pour vous moucher. Gentiment, d'ailleurs. Vos commentaires me touchent par leur pertinence, et (presque toujours), leur gentillesse!

Un grand merci à tous!

19 Commentaires:

Anonymous Anonyme a écrit...

Joyeux Anniversaire :)

J'allais laisser un petit mot méchant mais je n'allais pas gacher votre premier anniversaire!

10 novembre, 2005 22:21  
Blogger Nicolas a écrit...

Félicitation et joyeux anniversaire. Continuez comme cela...

10 novembre, 2005 22:43  
Anonymous Anonyme a écrit...

Compleaños feliz! Tócate la nariz! Y si no te la tocas no serás tan feliz!

10 novembre, 2005 23:00  
Blogger TOMHTML a écrit...

Bon anniversaire Aixtal ;)
Perso ça fait un bail (depuis Février en fait) que je surfe sur votre blog, et je dois dire que ça ne m'a jamais déçu
Continuez comme ça !

11 novembre, 2005 00:27  
Anonymous Anonyme a écrit...

Oui bon anniversaire grand professeur Aixtal comme parfois vous aimez vous nomer avec humour ! On vous aime beaucoup et c'est toujours un plaisir de vous lire !

11 novembre, 2005 02:15  
Anonymous Anonyme a écrit...

Vous ai découvert avec "l'affaire Google", lecteur quasi quotidien depuis (merci Bloglines)

Continuez et bon anniversaire

Bonjouçr chez vous

11 novembre, 2005 09:58  
Anonymous Anonyme a écrit...

Un joyeux anniversaire et des encouragements pour la suite (c'est vrai quoi ! il faut penser à tous les bloggo-dépendants qui suivent ce blog !!!)
1 an et il me semble lire ce blog depuis toujours, comme quoi on fait vite figure de dinosaure dans le monde des TIC ;-)

11 novembre, 2005 11:00  
Anonymous Anonyme a écrit...

http://www.reelclassics.com/Audio_Video/Quotes9n/2001_sitdowncalmly.wav

(juste un petit conseil de la part de...qui vous savez !)

11 novembre, 2005 11:29  
Anonymous Anonyme a écrit...

Un grand merci à toi, et surtout continue !

11 novembre, 2005 11:45  
Anonymous Anonyme a écrit...

Allez, un message sans intérêt mais qui ne fait pas non plus de mal : joyeux anniversaire, et que cela dure encore longtemps ! ^_^

11 novembre, 2005 18:49  
Blogger Jean Véronis a écrit...

Merci à tous (non, ces messages ne sont pas sans intérêt: ils font drôlement plaisir) !

11 novembre, 2005 19:05  
Anonymous Anonyme a écrit...

Si je puis me permettre, ce n'est pas seulement les affaires sur Google qui rendent votre blog très intéressant. J'apprécie le ton, l'absence quasi totale de fautes d'orthographe, les expériences intelligentes et pertinentes, et l'érudition. Vous faites partie des quelques sites que je lis en priorité avant de me mettre au travail! Merci et félicitations pour cet excellent blog, qui fait tache dans l'océan du vain et de l'inutile... Cédric

12 novembre, 2005 14:10  
Anonymous Anonyme a écrit...

Felicitations et bonne continuation !

Et rendez-vous pour le million de visiteurs !

Bye,

13 novembre, 2005 14:09  
Anonymous Anonyme a écrit...

salut jean,

vu la date, je me contenterai d'un joyeux non-anniversaire ,-) mais je ne raterai pas l'occasion de te demander comment tu as produit les statistiques de ton site :

Un an, 240 billets, 228 000 visiteurs uniques, 570 000 pages vues

pour les deux premiers chiffres, aucun souci de compréhension, guère plus pour le quatrième. mais le troisième me trouble !

chacun de tes visiteurs “uniques” n'aurait-il vu que 2,5 pages en un an ???

a]m[+

13 novembre, 2005 18:11  
Blogger Jean Véronis a écrit...

Michaël> C'est SiteMeter qui gère mes stats de visites. Le problème est de ne pas comptabiliser plusieurs fois la même personne qui visite plusieurs pages à la suite. Chaque gestionnaire de statistiques a sa propre définition de ce qu'est un "visiteur unique". Evidemment ça ne veut pas dire personnes différentes, mais plutôt sessions de visite par la même personne (ou en tous cas provenant de la même adresse IP). Pour SiteMeter, une visite est oublié au bout d'un délai de 30 minutes [voir ici]. Il n'y a aucun moyen de savoir combien de visiteurs différents sont passés.

Donc ça veut dire qu'en moyenne chaque visiteur regarde 2,5 pages à chaque passage sur le site. Pas mal!

Merci de ta vigilance qui me permet de préciser les choses!

13 novembre, 2005 19:06  
Blogger Loran a écrit...

Bravo et bon anniversaire.
Et surtout: encore!

14 novembre, 2005 10:35  
Anonymous Anonyme a écrit...

Joyeux "blog-anniversaire" Jean :)

J'apprecie tes billets sur les moteurs et les technologies de recherche, bien plus pertinents et critiques que nombre de blogs pourtant spécialisés dans le "search".

Continue !

14 novembre, 2005 11:05  
Anonymous Anonyme a écrit...

Bon anniversaire Jean.

Depuis un mois, pour ne plus rien rater et être le premier au courant, je me suis abonné au fil RSS de ton blog : c'est si simple avec Thunderbird
Bonne continuation...

14 novembre, 2005 13:46  
Anonymous Anonyme a écrit...

Merci a toi Jean !
Chaque billet est un regal !

14 novembre, 2005 14:32  

Enregistrer un commentaire

Blogs: Banlieues dans les nuages

J'ai montré l'autre jour comment les blogs parlent des banlieues à l'aide d'un nuage de mots [ici]. Ce nuage décrivait assez bien le paysage lexical de l'actualité: jeunes, Sarkozy, Paris, banlieues, violences, etc. mais je ne m'étais intéressé qu'aux mots isolés. Or les mots aussi prennent parfois leur force en bande: on entend ces jours-ci revenir comme des leitmotivs les expressions police de proximité, égalité des chances, forces de l'ordre, etc. Voici le nuage de ces expressions, construit automatiquement à partir des blogs francophones (la taille reflète la fréquence):

appels au calme · Assemblée nationale · Azouz Begag · balles réelles · banlieue parisienne · banlieues de Paris · banlieues françaises · bon sens · centre commercial · centre ville · citoyens français · classe politique · classes moyennes · Clichy sous Bois · cocktails Molotov · contrôle d'identité · coup de gueule · discrimination positive · Dominique de Villepin · droit de vote · droits de l'homme · Education nationale · égalité des chances · élection présidentielle · émeutes dans les banlieues · êtres humains · extrême droite · feu aux poudres · flambée de violence · forces de l'ordre · forces de police · Front National · gouvernement français · grande majorité · grandes villes · grands frères · grenade lacrymogène · grippe aviaire · guérilla urbaine · guerre civile · guerre en Irak · guerre mondiale · habitants des cités · habitants des quartiers · hommes politiques · Ile de France · incendies de voitures · jets de pierre · jeune homme · jeunes des banlieues · jeunes des cités · jeunes des quartiers · jeunes filles · jeunes gens · langue de bois · langue française · logements sociaux · Los Angeles · ministère de l'Intérieur · Ministre de l'Intérieur · mode de vie · modèle français · monde entier · mort de jeunes · Nicolas Sarkozy · nuit de samedi · nuit de violences · opinion publique · ordre public · ordre républicain · parti politique · Parti socialiste · police de proximité · police nationale · politique de la ville · politique d'intégration · pouvoirs publics · Premier ministre · Président de la République · problème des banlieues · quartiers difficiles · quartiers sensibles · région parisienne · rétablissement de l'ordre · secrétaire général · services publics · situation actuelle · société française · SOS Racisme · taux de chômage · tolérance zéro · transports en commun · Union européenne · véhicules brûlés · véhicules incendiés · violences dans les banlieues · violences urbaines · voitures brûlées

Intéressant non?

Pour les technologues, voici la méthode que j'ai utilisée. J'ai tout d'abord recupéré le texte intégral des 2000 billets qui contiennent le mot "banlieues" (avec leurs commentaires) et que j'avais identifiés grâce à Technorati (l'autre jour je n'avais travaillé que sur les extraits retournés par ce moteur). J'ai demandé à mon ami Didier Bourigault de passer ce corpus (environ 1,7 million de mots) dans son programme Syntex, qui est à l'heure actuelle à peu près ce qui se fait de mieux dans le domaine de la recherche automatique de terminologie (Syntex est intégré dans une chaîne complète d'analyse syntaxique et d'extraction de termes réalisée dans le cadre d'une collaboration entre l'ERSS, à laquelle appartient Didier Bourigault, et la société Synomia). D'un retour de mail, Didier m'a envoyé la liste des groupes nominaux les plus fréquents. Il ne restait plus qu'à lancer le tout dans mes petits programmes de génération de nuages, et de concordance. Si vous cliquez sur un mot vous aurez tous les contextes où le mot apparaît dans mon corpus, et à partir de ces contextes vous pourrez allez visiter les blogs qui en parlent...

Je ne veux pas vous ennuyer plus avec les détails (je répondrai volontiers, ainsi que Didier sans doute, aux questions techniques dans les commentaires), mais je voulais illustrer ce qu'on peut faire dans le domaine de la veille (sociale? citoyenne?) en quelques clics avec de bons outils de traitement automatique des langues. Il me semble que ça devrait intéresser journalistes, sociologues et autres commentateurs de l'actualité.

Libellés :


22 Commentaires:

Anonymous Anonyme a écrit...

Et rien sur Iznogoud ?

10 novembre, 2005 12:41  
Anonymous Anonyme a écrit...

Intéressant en effet, et pas seulement pour les professionnels.
Deux remarques:
Il conviendrait peut-être de retraiter ce tableau des expressions ayant la même signification : N S et MINISTRE DE L'INTERIEUR, DE VILLEPIN et PREMIER MINISTRE, JEUNES DES BANLIEUES et JEUNES DES CITES, etc... pour être encore plus parlant.
Le premier tableau faisait mention de Chirac, mais n'apparaît plus dans celui-ci sinon sous l'expression PRESIDENT DE LA REPUBLIQUE. Décidément, ce personnage est bien absent ces temps-ci!

10 novembre, 2005 13:03  
Anonymous Anonyme a écrit...

Une petite remarque : Toutes les lignes du nuage n'ont pas la męme hauteur. Du coup, les lignes de plus petite hauteur se retrouvent collées aux autres et sont moins lisibles (mais pas forcément moins importantes). Par exemple "nuit de samedi" profite de l'espace généré par "Nicolas Sarkozy", alors que "égalité des chances" est noyé dans la masse.

Une solution serait peut-ętre de modifier la propriété line-height du div "tagcloud" (par exemple line-height: 25px ).

10 novembre, 2005 13:09  
Blogger Jean Véronis a écrit...

Patrick> Oui, vous avez totalement raison! Le nuage ci-dessus montre les limites de la technologie actuelle: automatiser votre suggestion n'est pas facile, et pour l'instant je ne connais aucun système qui saurait le faire à grande échelle sur du texte brut (c'est là l'un des défis de notre domaine de recherche).

Chirac n'apparaît pas parce que ce n'est pas une expression composée (même remarque pour Iznogoud ;-). Il faudrait d'une certaine manière fusionner les deux nuages. Mais comment? Un autre thème de recherche...

10 novembre, 2005 13:09  
Blogger Jean Véronis a écrit...

Philippe> Oui, les lignes n'ont pas toute la même hauteur, car si on met arbitrairement 25px partout, on a quelque chose de trop espacé et peu lisible aussi. C'est un problème spécifique à Internet Explorer (qui, rappelons-le, ne respecte pas les standards...). Ca sort très bien sous Firefox.

Je vais essayer différents réglages, mais je suis pessimiste. Si des lecteurs ont la solution, je suis preneur! En attendant essayez Firefox, c'est gratuit! ;-)

10 novembre, 2005 13:16  
Anonymous Anonyme a écrit...

C'est curieux n'est-ce pas comme l'expression taux de chômag est peu employée. Ce qui est le plus cité, ce sont les personnalités et les lieux. La forme, donc, et pas le fond.

Ce qui ne nous change pas beaucoup. Avec cette mise en page, ça saute aux yeux, et ce qui est confusément ressenti devient documenté.

Bravo.

10 novembre, 2005 13:47  
Blogger Nicolas a écrit...

Je voudrais juste remettre un lien fonctionnel vers Firefox. Et j'insiste sur le fait que c'est vraiment un navigateur à essayer. L'essayer c'est l'adopter !

10 novembre, 2005 16:15  
Anonymous Anonyme a écrit...

Oui, diffusons Firefox ;)

Pour revenir au Blog, je me demande s'il n'est pas envisageable d'aller plus loin : creation d'une structure composee de contributeurs (techniciens et analystes) benevoles et dont le boulot est de faire ce genre de veille. Le tout est bien sur propose au monde entier par l'intermediaire d'un site (portail collaboratif ?)

En tous cas, bravo.

10 novembre, 2005 18:22  
Anonymous Anonyme a écrit...

trouvé sur le net

http://blog.nozav.org/?2005/11/10/36-google-se-tape-villepin-mais-sans-faire-expres

10 novembre, 2005 20:10  
Blogger Jean Véronis a écrit...

Caroline> Oui, très intéressant, merci (je lis souvent la Repubblica, mais je n'avais pas vu cet article). Je l'ai mis dans Mes Lectures

Sans rapport: êtes-vous la Caroline d'Agathe ou est-ce une homonyme?

10 novembre, 2005 20:16  
Blogger Jean Véronis a écrit...

Pythonner> Mais n'est-ce pas exactement ce que fait le service TagCloud ?

10 novembre, 2005 20:18  
Blogger Jean Véronis a écrit...

Kirovitch> Une structure... -- Oui, je rêve de quelque chose comme ça. Ca ne paraît pas impossible du point de vue technique. Il y a même un moteur Open sur lequel s'appuyer (Nutch). C'est le côté humain (bénévole) qui risque d'être plus problématique...

10 novembre, 2005 21:43  
Anonymous Anonyme a écrit...

Mouais. Sauf que ce n'est pas exactement la matière des billets en question parce qu'il y a aussi des noms de liens et donc de sites ou de blogues, voire de catégories qui se retrouvent coincés dans la masse (essayez sur Langue française ou Langue de bois par exemple).

10 novembre, 2005 21:54  
Blogger Jean Véronis a écrit...

Dominique> J'ai appliqué des filtres: je n'utilise pas le texte brut. Si vous cliquez sur "langue française" ou "langue de bois" justement vous verrez que les contextes ne sont pas particulièrement bruités. Bien sûr ça reste perfectible, mais bon...

10 novembre, 2005 22:01  
Blogger Jean Véronis a écrit...

Caroline> Le monde est petit! Pour ceux qui ne savent pas de quoi on parle, cliquez ici.

Une bien jolie BD pour enfants, avec de bons scénarios pas mal d'humour, qui paraît aussi dans Julie. C'est bien ça?

Bravo! continuez (ma fille est encore un peu petite, mais quand elle aura l'âge j'espère qu'il y aura tout une collection d'albums!).

11 novembre, 2005 08:53  
Anonymous Anonyme a écrit...

Où peut-on trouver le programme Syntex? Est-il libre, payant, ni l'un ni l'autre?

11 novembre, 2005 11:26  
Blogger Moulinvert a écrit...

Un autre moyen simple de veiller consiste à lire le canard enchaîné.

On y apprend ainsi que, si nos chers gouvernants sont restés silencieux pendant longtemps, c'est qu'ils attendaient que la pluie et le froid tempèrent les ardeurs des sauvages.

Depuis quelques jours il fait froid et humide, et le canard avait une fois de plus raison...

11 novembre, 2005 16:50  
Blogger Unknown a écrit...

Je ne connais pas grand chose a ces techniques, qu'entendez vous par "lancer le tout dans mes petits programmes de génération de nuages, et de concordance" ? Comment obtient-on ces nuages ?
Merci d'une réponse les applications auxquelles je pense sont très différentes des votres.
Cordialement

12 novembre, 2005 10:29  
Blogger Jean Véronis a écrit...

Mark> Ce sont des programmes que j'ai écrits pour la circonstance: qui prennent une liste d'expression avec leur fréquence, fabriquent le code HTML qui permet d'afficher différentes tailles et couleurs, qui calcule les contextes d'apparition et fabrique les pages de concordance correspondantes, etc. Bref, de la cuisine...

15 novembre, 2005 09:07  
Anonymous Anonyme a écrit...

Liens sur quelques "laboratoires sociologiques", veilleurs sociéteaux, ...Ds.2/Freeword

http://www.sociovision.fr/sociovision/page?nom=PRINCIPALE

http://www.alogic.fr/

http://www.esmerk.com/

http://www.clubdesvigilants.com/

21 septembre, 2006 17:21  
Anonymous Anonyme a écrit...

bonjour! j'ai trouvé votre article vraiment passionnant! Je suis encore étudiante mais des profs m'avaient parler du traitement automatique des langues lorsque j'étais en 3ème année. J'aime beaucoup la linguistique et je pense que le genre de programme que vous utilisez est un outil essentiel à l'observation des langues et non pas seulement à la sociolinguistique. Mes profs étaient vraiment calés là-dessus, je vais essayer de les rediriger vers votre site!

20 avril, 2007 23:12  
Blogger Jean Véronis a écrit...

Merci!

20 avril, 2007 23:18  

Enregistrer un commentaire

mercredi, novembre 09, 2005

Ortograf: Faites sauter la banque (en banlieue bien sûr)

C'est bien la preuve qu'il n'y a pas de misère dans les banlieues !



Quelle soirée! Et moi qui voulait regarder les Inrocks...

Merci à Olivier (pour Google Groups)
et à Rezo (pour le lien vers Samizdat)!

Libellés :


6 Commentaires:

Blogger tobi a écrit...

fr.soc.politique, le cloaque immonde de l'internet..

09 novembre, 2005 22:59  
Anonymous Anonyme a écrit...

Ce commentaire a été supprimé par un administrateur du blog.

09 novembre, 2005 23:10  
Anonymous Anonyme a écrit...

Mais on en revient à notre discussion d’il y a quelques semaines, sur le blog de Jean: http://aixtal.blogspot.com/2005/10/ortograf-repart-chez-microsoft.html
Même si un correcteur orthographique est « bête » (ce qui se discute, vu les développements récents), il va de soi que l’utilité de l’outil dépend aussi de son dictionnaire (on pourrait tout de même s’attendre à ce qu’un correcteur reconnaisse « banlieues » et que ce ne soit pas un mot inconnu ;-)).

Thierry Fontenelle [MSFT]

10 novembre, 2005 01:35  
Anonymous Anonyme a écrit...

Rassurez moi, l'enregistrement de Balkany c'est un montage à la KarlZéro... :o(

10 novembre, 2005 09:36  
Anonymous Anonyme a écrit...

J'avoue ne pas avoir eu le temps de fouiller, mais il me semble avoir reconnu un des "Yes Men" en la personne de l'interviewer ... ce qui n'ôte rien à aux propos hallucinants de Balkany ... Mais qui permettrait de comprendre la "non-réaction" du "journaliste". On vit une époque formidable.

10 novembre, 2005 09:59  
Blogger Jean Véronis a écrit...

A A> Les lignes trop longues (à cause des URL) désynchronisent tout sous IE et la page ne s'affiche plus correctement (utilisez Firefox!). Je recopie votre billet ci-dessous avec des liens cliquables:
---

A A a écrit...

Sur le même thème, voir ici et ici.

Pour avoir une idée de comment fonctionne un correcteur orthographique : ici

Extrait : "Un vérificateur orthographique est un outil extrêmement "bête", comme la plupart des logiciels. Il n'a aucune connaissance du sens des mots et à quoi lui servirait de connaître le sens des mots puisqu'il ne s'occupe que de mots qu'il ne connaît pas ! Même dans un ou deux siècles, les vérificateurs orthographiques ne sauront rien du sens des mots car le sens ne saurait servir pour corriger des mots inconnus..."

09 novembre, 2005 23:10

10 novembre, 2005 11:16  

Enregistrer un commentaire

E-pub: Les sossialos et la violance

Dengue.... Painsé-moa: je raive!!!




(A lyre apré cessi et ceci bien sûr).

Mersi à un lekteur aussi vigilent qu'anonime!




PS (ça veut dire "Post-scriptum" ;-)


7 Commentaires:

Anonymous Anonyme a écrit...

Les "science-politiciens lexico-sémiologues" vont pouvoir se régaler : ce soir (20h45) la foteu d'aurtografe socialiste est corrigée. Mais le vrai changement concerne le texte du lien adwords de l'UMP : après "soutenez la politique de N.S. pour rétablir l'ordre" puis "signez la pétition pour soutenir la politique de fermeté de N.S." voici venu "soutenez la politique de N.S. pour rétablir l'ordre républicain". Et demain ? Une "fermeté républicaine" ? A moins que la république ne se soit déjà définitivement fermée. Sur ceux qu'elle avait enfermés dans des cités dortoirs. On vit une époque formidable.

09 novembre, 2005 20:54  
Anonymous Anonyme a écrit...

Google a trouvé la solution au problème des banlieues ! Si Si ! Il faut pour cela aller dans Google Groups et taper "banlieues" (au pluriel sinon ça marche pas). Et là, là ... le correcteur de suggestions orthographiques se transforme visionnaire politique puisqu'il suggère : "Essayez avec cette orthographe : banques". Eeeeeeeeeeeet oui. Pour les banlieues, il faut des sous.

09 novembre, 2005 22:11  
Anonymous Anonyme a écrit...

Au delà du comique de l'énorme faute qui en dit long sur la politique de communication du PS, mais il faut dire que ce soir ils sont occupés à autre chose, je trouve que cette récupération des évennements dramatiques que vivent le pays de la part des deux grands parties est assez scandaleuse. Ces gens là n'ont-ils donc pas autre chose à penser en ce moment ? Les affaires du pays se limitent-elles à des questions électorales ? Il n'y a vraiment pas que les banlieues qui devraient être dans la rue.

09 novembre, 2005 23:08  
Anonymous Anonyme a écrit...

On notera aussi que l'UMP a également acheté le mot clé... "Cécilia" !
;-)

10 novembre, 2005 08:06  
Anonymous Anonyme a écrit...

Le PS a disparut des recherches avec banlieues. Plus de sous sans doute...
Par contre :
- On remarquera la richesse des déclinaisons orthographiques de l'Express et du Nouvel Obs
- Un rigolo paye un lien vers une éponge magique. Il n'a pas du trouvre le site de Karcher...

Bref, je crois qu'avec la météo, le cours du pétrole et google news, la recherche sur le mot "banlieue" va être l'une de mes pages favorite tous les matins.

10 novembre, 2005 09:09  
Blogger all a écrit...

voiture ki crame

10 novembre, 2005 09:28  
Anonymous Anonyme a écrit...

http://www.zdnet.fr/actualites/internet/0,39020774,39285264,00.htm

explique pourquoi

14 novembre, 2005 08:13  

Enregistrer un commentaire

mardi, novembre 08, 2005

News: Banlieues à la carte

Vous connaissez sans doute le site Newsmap, qui a eu un beau succès d'estime lorsqu'il est sorti en 2004. L'idée est simple: organiser les Google News sous forme de carte. Les nouvelles sont regroupées sous forme de carrés dont la taille est proportionnelle au nombre d'articles qui les traitent. Les différentes couleurs correspondent aux grands domaines (monde, nation, sports, etc.). Les nouvelles de Google.fr ressemblent à ceci aujourd'hui:



J'ai encadré en rose les carrés qui correspondent aux émeutes des banlieues. Je suis frappé de la toute petite surface qu'occupe ce thème. Pourtant, si j'ai bien compris, c'est l'événement majeur de la décennie, et notre premier ministre nous annonçait hier soir la proclamation de l'état d'urgence, qui, si je ne me trompe pas n'a été invoqué que deux fois après la guerre d'Algérie (dont une fois en Nouvelle Calédonie)... J'ai regardé sur les jours précédents (puisqu'il y a une archive sur le site), ça n'est pas très différent. Bizarre, non?

Sur Google News US, la taille est encore plus réduite:



Pourtant, en regardant les télés américaines on a l'impression qu'elles ne parlent que de ça...



Alors?


Post-scriptum

20 heures -- Un commentateur anonyme fait remarquer que la taille du carré dans les News US a pas mal augmenté. L'état d'urgence semble avoir frappé les esprits...



11 Commentaires:

Anonymous Anonyme a écrit...

C’est bien connu, on peut regarder un joli feu pendant des heures sans se lasser...
Pour la presse écrite, il est plus difficile de s’éterniser sur des non événements.

08 novembre, 2005 16:34  
Anonymous Anonyme a écrit...

Quoi de plus fédérateur que la peur ?

08 novembre, 2005 16:54  
Anonymous Anonyme a écrit...

Chaque journaliste a ses propres marottes, le moteur qui génère les Google News doit avoir ses propres priorités...

Du reste, l'importance accordée aux sujets économiques éclaire (peut-être) sur l'origine anglo-saxonne du bidule (bidule bien pratique au demeurant.

Merci pour votre blog et
bonjour chez vous

08 novembre, 2005 19:02  
Anonymous Anonyme a écrit...

Là maintenant, sur la page d'accueil de NewsMap, on est quand même en deuxième position. c'est pas si mal.

08 novembre, 2005 19:58  
Anonymous Anonyme a écrit...

En tout cas la France vue outre-atlantique est originale :
http://www.estvideo.net/dew/index/2005/11/08/583-boulets-a-la-carte

08 novembre, 2005 22:50  
Anonymous Anonyme a écrit...

Le rapport entre Google News France ou Canada français et Google News UK ou US est de 1 à 6 ou 7 pour les articles. Je veux bien que la masse de journaux et donc des articles soit plus importante en anglais, mais je me pose des questions sur le traitement de l'information par Google News. Il faut voir en fait ce qui est référencé comme site dit d'information à la base : on a ainsi dans Google News une agence de presse facho qui repompe tout ce qui traîne sur la Toile et puis une absence énorme de journaux régionaux.

08 novembre, 2005 23:37  
Anonymous Anonyme a écrit...

Ping Pong.:-(

08 novembre, 2005 23:52  
Anonymous Anonyme a écrit...

France's troubles beat out a drunk escapee and a football team in the US media. Now that's something. Well maybe not, after all, there was fire involved. (Now how do you make a one of those smiley faces but with a cynical expression?)

08 novembre, 2005 23:55  
Anonymous Anonyme a écrit...

Mais y a-t-il une corrélation avérée entre l'importance d'un événement et l'importance du battage médiatique correspondant ?

;-)

(ma question est un peu ironique, vous vous en doutez, d'une ironie sans méchanceté toutefois, et je me doute bien que vous n'êtes pas dupe...)

J'en profite pour vous féliciter pour votre blog.

Thierry

09 novembre, 2005 09:31  
Anonymous Anonyme a écrit...

Bonsoir,

Cela n'a rien à voir, mais depuis quelque temps je m'interroge sur le moteur de news.google.fr, qui agrège des articles pêchés sur le net, et des petites photos censées illustrer ces articles.

Si vous avez le temps, il est 20:10, allez jeter un oeil sur l'article intitulé "M. de Villepin impose sa stratégie de crise à M. Sarkozy" et sur la vignette associée. Bien qu'elle ne soit pas complètement sans rapport (sic) je me demande comment une telle juxtaposition a pu se produire... C'est très étonnant, on pourrait croire de l'humour volontaire ! Les moutons électriques rêvent-ils ?

Au besoin si le lien disparait entre temps, à cause de la suppression de l'article, j'ai pris une copie d'écran que j'ai disposé à cette adresse : http://www.carantec-pc.com/downld/villepin-sarko.jpg

J'aimerais vraiment savoir comment cet agrégateur fonctionne... Ceci doit rentrer dans vos compétences "technologies du langage" ou plutôt sémiotiques ?

Merci pour votre blog que je parcours régulièrement.

09 novembre, 2005 20:19  
Anonymous Anonyme a écrit...

J'ai compris pourquoi : http://hermaphrodite.fr/breve382

Lol !

09 novembre, 2005 20:34  

Enregistrer un commentaire

Blogs: Un nuage sur les banlieues

Beaucoup de blogs parlent des banlieues ces jours-ci, et c'est bien compréhensible.... Voici les 100 mots les plus fréquents qu'ils emploient:


Ce nuage a été obtenu avec l'API Technorati: j'ai récupéré les titres et extraits de 2000 blogs qui parlent de banlieues et j'ai calculé la fréquence des mots (après avoir enlevé les mots-outils: articles, prépositions, etc.). J'ai ensuite présenté le tout façon TagCloud (mais avec mes propres programmes): la taille des mots reflète leur fréquence, et on peut cliquer sur chaque mot pour trouver les blogs qui en parlent dans le contexte "banlieues". J'espère qu'aucun parti politique ne détournera cette liste pour des PoliticalAdWords ;-)

Libellés :


8 Commentaires:

Anonymous Anonyme a écrit...

Le plus consternant est encore de voir qu'ils persistent et signent par le biais de leur prestataire

08 novembre, 2005 12:13  
Anonymous Anonyme a écrit...

N'est il pas étrange de ne trouver ni Bouna, ni Zyed ?
Aurait on omis les dramatiques origines des évènements ?
Une rapide recherche sur Google semble le confirmer. Une recherche sur "bouna zyed" ne renvoie que 9 720 réponses alors que "clichy voitures brulées" en renvoie 11 100 et "clichy sarkozy" donne 158 000 pages.

08 novembre, 2005 16:05  
Anonymous Anonyme a écrit...

On peut aussi utiliser l'outil rigolo de google http://www.googlefight.com. Pour ce qui est de l'utilisation dans Adwords, Google propose également un outil de comparaison de mot-clefs pour optimiser la fréquence d'affichage des annonces commerciales.

Une recherche rapide sur "Racaille" et "Voyou" permet de comprendre pourquoi le premier de ces mot a été ciblé par l'agence de com de Monsieur Sarkozy.

Pex

09 novembre, 2005 10:02  
Anonymous Anonyme a écrit...

Je profite de votre Blog pour poser une question qui me tarabuste un peu. Beaucoup de media ont utilisé le mot "désespoir" pour qualifier le sentiment qui serait à l'origine des violences urbaines que nous connaissons aujourd'hui.

Pour moi, ce mot a toujours signifié plus qu'une absence d'espoir, qui est à mon avis le vrai sentiment des habitants des cités dont on parle.

Le "désespoir naîtrait plus de la suppression soudaine d'un espoir que l'on nourrit. Il aurait ainsi une force négative que l'absence d'espoir n'a pas.

Je n'ai pas de dictionnaire étymologique et je n'ai rien trouvé sur le net.

Merci d'avance.

Pex

09 novembre, 2005 13:50  
Anonymous Anonyme a écrit...

J'espère qu'aucun parti politique ne détournera cette liste pour des PoliticalAdWords ;-)
A propos d'adsense de Google, l'UMP utilise actuellement le mot "banlieue".
Bien vu!

14 novembre, 2005 00:03  
Blogger Jean Véronis a écrit...

Pex> Oui, étymologiquement parlant, il semblerait que le "désespoir" soit la perte de l'espoir. C'est certainement beaucoup plus cruel d'avoir de l'espoir et le perdre que de n'en avoir jamais eu. C'est sans doute proche de la désillusion... Mais bizarrement, la désillusion ne peut pas être la perte d'illusions: si l'on avait su que c'était des illusions, on ne serait pas désillusionné!

15 novembre, 2005 21:14  
Anonymous Anonyme a écrit...

auriez vous à disposition ce programme. je cherche une méthode pour faire une exploitation autre de l'api technorati mais cela dépasse mes compétences

14 octobre, 2006 10:22  
Blogger Jean Véronis a écrit...

Sylvain> Ce sont des programmes que j'ai écrit, mais je ne les distribue pas (d'ailleurs je doute qu'ils soient utilisables par d'autres que par moi: pas de doc, etc.).

14 octobre, 2006 10:25  

Enregistrer un commentaire