Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mardi, octobre 04, 2005

Ortograf: Eclispe partielle



C'est bien connu, il ne faut pas fixer les éclispes, ça brûle les yeux. A tel point que lorsqu'on retourne ensuite à son blog, on ne voit plus très bien ce qu'on écrit.



C'est arrivé à Marianne, une de mes fidèles lectrices, qui nous a éblouis tout à coup avec un titre allumé sur l'éclispe à Angers, qu'elle a osbervée avec ses collègues (l'histoire ne dit pas s'ils n'ont pas aussi un peu forcé sur la spécialité locale pour se réchauffer pendant le petit coup de froid de l'éclispe ;-) Je ris un peu, mais pas méchamment: Marianne a un bien joli blog, et elle laisse régulièrement ici des gentimentaires. En plus, ce genre de coquille, j'en fais moi-même des tonnes, et j'ai l'impression que ça ne s'arrange pas avec l'âge. Quand c'est dans le titre en plus, c'est vraiment la poisse, parce que Blogger fabrique l'URL du billet avec les mots du titre, et le changer bousille tous les liens...

En fait, je suis très reconnaissant à Marianne, parce qu'elle m'a rappelé qu'un des thèmes récurrents de ce blog était la métathèse. Je me suis amusé à diverses reprises sur les infractus, les aréoports et les génycologues [1, 2]. La vraie métathèse est de nature phonétique: les gens croient qu'on dit réellement infractus. Ici il s'agit d'une métathèse graphique --et involontaire. Je suis sûr que Marianne sait comment le mot s'écrit. Nos pauvres yeux ont beaucoup de mal à voir ce genre de coquille. Pour preuve, un petit contrôle sur Yahoo: 113000 personnes ont déjà fait la même faute sur eclispe! Incroyable, quand même. Il faut dire qu'il y a près de 55 millions de pages contenant le mot dans Yahoo (ça donne le tournis) et donc ça ne fait que 2 pour mille, mais tout de même!

Ce qui est vraiment curieux, c'est la différence entre le français et l'anglais:


eclipseeclispePour 1000
Anglais44300000940002,1
Français234000015800,7
Autres7860000174202,2
Total545000001130002,1

Les erreurs sont proportionnellement 3 fois moins fréquentes en français qu'en anglais. Bizarre. Sur des chiffres pareils, la différence ne peut pas être due au hasard. Ne tombons pas dans le stéréotype linguistique ridicule: les francophones ne sont pas meilleurs en orthographe que les anglophones. Il doit y avoir des variables cachées qui expliquent la différence. Il est possible par exemple que la composition du web francophone soit différente de celle du web anglophone: s'il y a plus de textes écrits rapidement (blogs, forums) dans la partie anglophone, cela pourrait expliquer la différence. Il y a sans doute d'autres hypothèses possibles. Peut-être que vous serez plus perspicaces que moi... En tous cas, voilà un beau sujet de recherche pour des étudiants en mal de sujet de master ;-)

Sans rancune Marianne? Vous disiez dans un commentaire récent que vous aviez sept sites qui citent votre blog, eh bien ça va faire huit avec ce billet, le temps que les robots de Technorati veuillent bien passer. J'espère que ça suffira à me faire pardonner...

PS: oh, en fait je vois que depuis votre message vous avez déjà gagné deux sites référents, donc ça va faire bientôt 10. Plus que 1963, et c'est bon pour le Tpo 100! Faudra arroser ça au Cointreau.

PPS: Ecl... hips!

Libellés :


21 Commentaires:

Blogger Marianne a écrit...

Hahaha :-)
Magnifique !

J'ai observé que quand je fais un billet un peu long et fouillé dont je suis très fière, tout le monde s'en fiche, et des fois, un petit billet écrit en dix minutes (voire en une trente comme celui-ci) suscite beaucoup plus de réactions. Aujourd'hui c'est le ponpon :-) ! Et en plus c'est PARCE qu'il a été écrit trop rapidement qu'il a autant de succès ! Faut vraiment que je réfléchisse à la pertinence de ma ligne éditoriale... :-)

En tout cas merci beaucoup pour ce billet et pour le coup de pouce à mon blog dans les stats qui ne va pas manquer de suivre !

(Bon j'ai relu 10 fois ce commentaire, j'espère que je n'ai pas laissé de coquille... :-) )

04 octobre, 2005 17:29  
Anonymous Sébastien a écrit...

J'ai remarqué que mes billets qui contiennent des fautes d'orthographe on plus de succes que les autres. En effet, je ne suis pas très bien placé dans google, mais lorsque je suis le seul à faire la même faute que la requête google, alors c'est mon blog qui sort...

J'ai beaucoup moins de visites depuis que j'ai corrigé les fautes.

04 octobre, 2005 18:02  
Anonymous Olivier G. a écrit...

Tiens, ça me rapelle l'étude passée un peu partout il y a quelques temps qui disait que la position des lettres à l'intérieur d'un mot fréquent n'avais pas grande importance.

04 octobre, 2005 22:12  
Anonymous Nonal le Chacal a écrit...

Quand c'est dans le titre en plus, c'est vraiment la poisse, parce que Blogger fabrique l'URL du billet avec les mots du titre, et le changer bousille tous les liens...

Marianne devrait utiliser href="http://dotclear.net">dotclear. On peut y corriger ce qu'on veut, y compris les liens, sans casser tout le bouzin...

Dotclear, c'est bon, mangez-en !

04 octobre, 2005 23:13  
Anonymous Nonal a écrit...

...Ah, et les liens marchent, aussi, sous dotclear... ;)

04 octobre, 2005 23:14  
Anonymous Peyu a écrit...

Pour les fautes, une piste à suivre est peut-être le fait que la proportion de pages en anglais écrites par des gens dont l'anglais n'est pas leur langue maternelle est plus importante que pour les pages en français, et donc ils feraient plus de fautes.
Mais je ne suis pas spécialiste !

05 octobre, 2005 01:27  
Blogger Jean Véronis a écrit...

Olivier G.> La fameuse "étude" de Cmabrigde. Tiens il faudra que j'en parle un de ces 4!

05 octobre, 2005 07:13  
Blogger Jean Véronis a écrit...

Peyu> Oui, très bonne piste ! Encore que le fait d'être locuteur natif n'intervient peut-être pas trop sur ce type de faute (les gens savent comment ça s'écrit, ce sont plutôt des fautes d'inattention). A voir!

05 octobre, 2005 07:14  
Anonymous Dominique a écrit...

Les métathèses s'expliquent de plusieurs façons :
a) Difficulté articulatoire d'une séquence phonique ou d'un phonème précis. C'est notammment le cas des métathèses de r en français, cette consonne est instable.
b) Attraction par un autre phonème. Très courant dans les mots en i.
c) Analogie avec d'autres mots. Il me semble que les séquences en -isp (whisp, crisp, lisp, etc.) sont plus fréquentes qu'en français. Si, en outre, le sens de ces mots s'ajoute au premier mot par connotation, le tour est joué !

05 octobre, 2005 07:18  
Blogger Boris New a écrit...

Si Google est souvent épinglé pour l'incohérence de ces résultats: voici une incohérence au niveau de la gestion des accents pour yahoo. Pour les pages en français:
eclipse sort 2 410 000
alors que éclipse sort 2 420 000
et +éclipse 2 390 000
alors que normalement "eclipse" et "éclipse" devrait donner les résultats "eclipse + éclipse"
En revanche "+éclipse" ne devrait donner que les mots correctement accentués ce qui n'est clairement pas le cas.

Google pèche aussi sur le premier problème mais est plus cohérent pour +éclipse...

05 octobre, 2005 10:28  
Anonymous Jérôme k a écrit...

Une petite précision... Pour vérifier les proportions de fautes, il vaut mieux éviter d'utiliser un mot qui est aussi le nom d'un logiciel de programmation Java comme eclipse...

05 octobre, 2005 13:00  
Blogger Jean Véronis a écrit...

Boris> Je ne pense pas que Yahoo fonctionne comme Google en ce qui concerne le + : eclipse et +éclipse représentent la même requête.

Les petites fluctuations que tu oberves (2 420 000 contre 2 410 000, soit 0,4%) sont à mon sens normales et simplement dues au fait que les moteurs ne donnent jamais des chiffres exacts, mais toujours des approximations, qui viennent du fait de l'indexation distribuée. Le moteur n'a nulle part la valeur exacte mais la calcule à chaque requête à partir de différents serveurs. Ca n'est pas du même ordre que certaines aberrations que j'avais observées, qui étaient du genre 200%!

05 octobre, 2005 16:51  
Blogger Jean Véronis a écrit...

jérôme k> Oui, bien vu. Eclipse est aussi un modèle de véhicule "Mitsubishi eclipse" (3 340 000 occurrences sur Yahoo). Dans une étude sérieuse, il faudrait évidemment tout un tas de mots, bien contrôlés pour ce genre de facteur pertubateur...

05 octobre, 2005 16:56  
Blogger Jean Taillère-Marchand a écrit...

J'ai reçu un e-mail qui écrivait les mots avec les lettres internes mélangées et le fait est que le message était entièrement compris avec un petit effort... Du coup votre message sur l'eclispe me parraissait compréhensible et je ne voyais pas l'intérêt du post.
A betniot

05 octobre, 2005 17:12  
Blogger Jean Véronis a écrit...

Jean> Il y a des gens qui m'ont dit qu'ils ne se sont aperçus de la faute qu'à la fin du billet, comme quoi on ne les voit pas.

Le mail ça devait être celui-là?

Sleon une édtue de l'Uvinertisé de Cmabrigde, l'odrre des ltteers dnas un mtos n'a pas d'ipmrotncae, la suele coshe ipmrotnate est que la pmeirère et la drenèire soit à la bnnoe pclae. Le rsete peut êrte dnas un dsérorde ttoal et vuos puoevz tujoruos lrie snas porlblème. C'est prace que le creaveu hmauin ne lit pas chuaqe ltetre elle-mmêe, mias le mot cmome un tuot.

Je pense que c'est ce à quoi Olivier G. faisait allusion plus haut (attention, c'est un canular, il n'y a jamais eu d'étude de cet type à Cambridge - voir ici), mais ça n'en reste pas moins tout à fait étonnant!

05 octobre, 2005 17:22  
Anonymous Papotine a écrit...

L'illustration est lumineuse !!
La métathèse est-elle liée au lapsus révélateur ? je veux dire, ne faut-il y voir qu'une histoire de phonétique et d'inattention ?

05 octobre, 2005 20:37  
Anonymous Ben a écrit...

Tout d'abord félicitation pour la qualité de ce blog que je lis régulièrement depuis près d'un an.
Je suis peut-être hors-sujet, mais dans la série des mystères de Google, j'ai fait une expérience étrange, dont peut-être vous connaissez la réponse (?). Comment expliquer les résultats d'une recherche en mettant http:// dans le champs de recherche de google.fr ?

05 octobre, 2005 20:44  
Blogger Jean Véronis a écrit...

Ben> Merci de votre fidélité! vos compliments me vont droit au coeur.

Comment expliquer les résultats d'une recherche en mettant http:// ?

Vous voulez dire en tapant exactement ces 7 caractères (ou bien une URL complète avec son http:// ?). Si c'est bien ça que vous voulez dire, il me semble que Google fait une simple recherche sur les pages contenant la chaîne "http" (en enlevant les caractères non alphanumériques ://). Comme il y a évidemment plein de pages qui remplissent ce critère, il en trouve 6,5 milliards (mais on sait qu'on ne peut guère ce fier à ce chiffre). Il nous sort les sites par popularité décroissante: Le Monde, Microsoft, WWW Consortium, BnF, etc. Je ne vois rien de particulierement bizarre?

Donc, je n'ai pas dû comprendre la question...

06 octobre, 2005 21:25  
Anonymous Grenadine a écrit...

Bien plus de mots en anglais comprennent la combinaison "sp" en fin de mot, comparativement au français, peut-être?

Gasp, glipse, corpse, et je ne sais quoi d'autre.

Quand un combinaison de lettre (sp) est plus fréquente qu'une autre (ps), c'est facile de taper celle qu'on a l'habitude de faire.

Enfin, c'est une autre explication!

D'après moi, le nombre de pages qui en parle (on parle plus d'éclipses en anglais)est une mauvaise explication, compte tenu du pourcentage de référence.

07 octobre, 2005 22:22  
Anonymous Chaka a écrit...

Le lien sur la page en anglais de "l'étude Cambridge" a été déplacé.

http://www.mrc-cbu.cam.ac.uk/~mattd/Cmabrigde/

J'apprécie votre blog, bonne continuation !

10 octobre, 2005 20:30  
Blogger Fabien a écrit...

hypothese toute simple :les gens ecrivant en anglais bien que ca ne soit pas leur langue maternelle sont beaucoup plus nombreux que les francophones non natifs, en particulier sur le web. Et naturellement, quand on ecrit dans une langue qui n'est pas la sienne, on fait plus de fautes...

01 novembre, 2005 13:27  

Enregistrer un commentaire