Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

samedi, mars 26, 2005

Texte: Le nom du Père

En ce temps de Pâques chétiennes, j'aimerais vous offrir quelques computations lexico-théologiques. Je me suis demandé quel était le mot le plus fréquent dans les Evangiles -- les mots courants étant exclus (articles, etc.). J'ai utilisé mon petit programme Dico, qui permet de calculer la fréquence des mots dans un texte (vous pouvez le télécharger gratuitement ici). Sans grande surprise, c'est le mot Jésus qui est apparu en tête de liste dans chacun des quatre évangiles, Matthieu, Marc, Luc, Jean. C'est plutôt rassurant...

Voici les fréquences que j'ai observées :


Matt.MarcLucJean
Jésus200186221275

Ces fréquences varient d'un Evangile à l'autre, mais le mot Jésus est-il réellement plus fréquent dans un évangile que dans un autre ? Il ne faut pas sauter aux conclusions sur la base du tableau ci-dessus, car les quatre Evangiles ont des tailles différentes :


Matt.MarcLucJean
Nb Mots23723148682557019641

En tout, cela fait 83802 mots. Il y a 882 Jésus dans les quatre Evangiles combinés... Ce n'est pas très difficile de faire une règle de trois et de calculer combien on devrait avoir de Jésus dans chacun des Evangiles si la répartition était équitable. Même les plus cloches d'entre nous devraient y arriver. Par exemple, pour Matthieu, on devrait avoir 882 / 83802 * 23723, soit 249,7. Vous me suivez ?

On peut alors calculer l'écart entre ce qu'on a observé et ce qu'on attendrait si les proportions étaient strictement identiques. Dans Matthieu, j'ai ainsi compté 200 occurrences de Jésus, ce qui fait un déficit de 249,7 - 200 = 49,7 occurrences (evidemment c'est qu'il doit y avoir un excédent dans d'autres Evangiles...).

Il reste encore une petite chose à faire (j'essaie d'y aller mollo, car je ne voudrais pas perdre les trois quarts de mes lecteurs : jusqu'ici nous n'avons pas dépassé le niveau de maths du CM2, mais j'ai un peu l'impression de marcher sur des oeufs...). L'écart que nous avons calculé entre les fréquences réelles et les fréquences attendues ne veut rien dire en soi, car les textes ont des tailles différentes. Il faut donc le transformer en écart relatif, en le divisant simplement par la fréquence attendue dans chaque évangile (ouf -- j'espère que vous êtes toujours là !). Pour Matthieu, par exemple, cela donne 49,7 / 249,7 = 0,17, soit un déficit d'environ 17%.

Je résume tout ça :


Matt.MarcLucJean
observé200186221275
attendu249,7156,5269,1206,7
écart-49,729,5-48,168,3
écart relatif-17%+19%-18%+33%

On peut aussi faire un joli diagramme en bâtons, qui ressemble à ceux que m'avait envoyés Damon Mayaffre à propos de Chirac (Damon utilise un calcul un peu différent, mais tous les chemins mènent à Rome...). Les bâtons dirigés vers le bas indiquent un déficit, ceux dirigés vers le haut un excédent.

Diagramme Jésus
On voit que le mot Jésus est en déficit dans deux des Evangiles, Matthieu et Luc, et en excédent dans les deux autres, Marc et Jean. Je ne veux pas devenir trop technique, mais on peut s'assurer avec un test approprié, le test du khi-deux, que ces différences sont statistiquement significatives, et qu'elles ne résultent pas simplement des petites fluctuations aléatoires que l'on observe dans tout ensemble de textes. Et ici, ce test nous dit même qu'on n'aurait qu'une chance sur 100 millions de se tromper en affirmant qu'il y a une différence de fréquence significative entre les Evangiles pour ce mot Jésus !

Ce résultat tout mathématique prend un certain relief quand on sait que Matthieu et Luc ont été écrits à partir de Marc (sans doute à Rome), qui leur a servi de source. On retrouve d'ailleurs des fragments quasi-identiques entre les trois, qui peuvent être lus côté à côte comme des textes parallèles (c'est pour cela qu'on les appelle Evangiles Synoptiques, du grec συν οψις : voir ensemble. Jean, a quant à lui été écrit dans un autre contexte, sans doute dans une communauté chrétienne héllénistique (Ephèse ?). Les deux Evangiles "directs" parlent plus de Jésus que les deux Evangiles écrits de façon indirecte (je mets des guillemets, car il ne s'agissait quand même pas de témoins oculaires)... Intéressant, non ?

Diagramme Jésus

Jean et les synoptiques se distinguent par bien des aspects de leur vocabulaire. Dans Jean, par exemple, le deuxième mot le plus fréquent après Jésus est Père (avec la majuscule). Il y apparaît 121 fois, alors qu'il apparaît seulement 67 fois dans les trois synoptiques combinés. Je vous épargne les calculs, mais cela fait un excédent de 175% ! A l'inverse, le mot Fils a bien quelques fluctuations entre les différents évangiles, mais le test du khi-deux nous dit que ces différences ne sont pas significatives. Dans l'Evangile de Jean, Jésus réfère constamment à son Père, mais son rôle de Fils ne diffère pas vraiment d'un écrit à l'autre.

Diagramme Jésus
A méditer... En tous cas, je trouve absolument fascinant que des calculs mathématiques aussi simples arrivent à révéler les traces d'une généalogie textuelle vieille de deux millénaires !

Joyeuses Pâques !

7 Commentaires:

Anonymous zid a écrit...

Très intéressant... Quelle traduction avez-vous utilisée ? Il faudrait refaire ce genre d'analyse avec la tradition des Septante, mais il est probable que cela ne change pas grand chose.
Ceci dit, avez-vous déjà essayé d'adapter ces méthodes à l'étude des variantes des différents témoins d'un même texte ? En d'autres termes, peut-on utiliser ces méthodes dans des études stemmatiques ?

26 mars, 2005 23:31  
Blogger Jean Véronis a écrit...

J'ai utilisé la traduction Louis Segond, qui est considérée comme collant d'assez près au texte original. Quoi qu'il en soit, sur ces mots-là, noms propres et mots sacrés, je doute que les traducteurs aient beaucoup improvisé. On aurait bien sûr des divergences de traduction sur d'autres termes, mais peu sur ceux-là. De toutes façon les ordres de grandeur sont si différents que quelques fluctuations ne changeraient pas grand-chose, comme vous le dites. Ceci n'est qu'un amusement pédagogique... Pour des études sérieuses il faudrait travailler sur le texte grec.

Je n'ai pas moi-même travaillé sur le problème des variantes, mais je ne sais pas si des méthodes statistiques aussi brutes seraient appropriées. Les variantes se distinguent souvent les unes des autres par de touts petits changements (et souvent des changements d'ordre), hors de portée de tels calculs. Je crois que les méthodes appropriées sont plutôt à aller chercher du côté de la biologie. Cela ressemble étrangement aux problèmes d'alignement et de repérage dans le génôme...

27 mars, 2005 10:36  
Anonymous zid a écrit...

Absolument d'accord pour le lien avec la génétique: http://www.gena.ucl.ac.be/louvain2004/

Je posais la question malgré tout, dans la mesure où il faut faire flêche de tout bois: peut-être pour "dégrossir" certaines recherches sur plusieurs dizaines voire centaines de manuscrits, en se basant sur des variantes de taille ?

27 mars, 2005 23:24  
Anonymous Quentin a écrit...

Merci Jean de cette étude très intéressante ! Non seulement j'apprécie l'aspect intellectuel de ce travail, mais en plus cela me touche, en temps que catholique, de lire un billet en rapport avec le temps pascal. Cela devient bien rare...

29 mars, 2005 11:38  
Anonymous Kermess Whisper a écrit...

Effectivement, c'est très intéressant. Je me permets néanmoins une petite remarque : il me semble qu'il y a une erreur dans la règle de trois au début. Le calcul à poser est 882/83802*23723, et non pas 200/83802*23723. Mais le résultat, 249.7, est bien correct. Voilà, c'était juste pour chipoter.

29 mars, 2005 17:40  
Blogger Jean Véronis a écrit...

Merci de ce chipotage ! J'ai corrigé, mais heureusement ça n'était qu'une bourde à la rédaction. les calculs sont bons par ailleurs...

29 mars, 2005 18:14  
Anonymous Anonyme a écrit...

Intéressant en effet, mais bizarre que personne ne se soit posé ces deux questions (absurdes?):
-la place du pronom "il", très présent dans la traduction de Segond. Plus compliqué, pour un affinement peut-être nul?
-la place du discours direct de Jésus (la version en ligne l'affiche en rouge), au moins pour calculer la taille respective des textes...

08 avril, 2005 19:28  

Enregistrer un commentaire