Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

lundi, juin 06, 2011

Débat: Langages naturels et artificiels

Je participe ce soir (lundi 6 juin à 19h) à un débat à la Bibliothèque Publique d'Information du Centre Pompidou, sur le thème des langages naturels et artificiels. Voici le texte de présentation :
Nous parlons tous un langage naturel : c'est dans notre ADN, c'est au coeur de notre humanité. Mais l’homme crée aussi des langages artificiels. L’informatique a les siens, comme l’HTML ou le Java, et la fiction n’est pas en reste, puisque des civilisations ont été inventées avec leurs propres langages. Ainsi, Tolkien a créé l’elfique, dans Le Seigneur des anneaux et, plus récemment, Frédéric Werst a écrit tout un livre en « wardwesân », la langue du pays des Wards.
Quels rapports les langages artificiels entretiennent-ils avec le langage naturel ? Peut-on les comparer du point de vue de leurs codifications, de leurs syntaxes, de leurs sémantiques respectives ? En étudiant l’histoire des systèmes de notation, retrouve-t-on des constantes anthropologiques permettant de rapprocher les codes les plus récents de l’informatique et les toutes premières écritures ?
Pour éclairer cette question essentielle de la codification du langage, la Bpi invite des spécialistes d’horizons différents : un développeur web, un écrivain, une anthropologue ainsi qu'un professeur de linguistique et d’informatique.


Le débat est animé par Abeline Majorel, fondatrice du site Chroniques de la rentrée litteraire, consultante et blogueuse.

Avec :

Aurélien Fache : spécialiste du multimédia, ingénieur en développement, co-concepteur technique de la plateforme Dailymotion, directeur technique au sein de la société 22mars, éditeur de médias sociaux.

Frédéric Werst : écrivain, il est l'auteur de Ward Ier et IIe Siècles (Seuil, "Fiction et Cie", 2011). Pour écrire cet ouvrage, il a entièrement inventé une langue, le wardwesân, qu'il a ensuite traduite en français. Son roman est une anthologie des oeuvres qu'auraient écrites un peuple imaginaire — les Wards — pendant les deux siècles correspondant à l'apogée de leur civilisation.

Clarisse Herrenschmidt : Linguiste, philologue et anthropologue, elle travaille sur l'histoire et l'anthropologie des écritures. Chercheuse au CNRS, rattachée au Laboratoire d'Anthropologie sociale du Collège de France, elle est spécialiste de l'Iran perse et élamite ainsi que de la Grèce ancienne.

Jean Véronis : professeur de linguistique et d'informatique à l'université de Provence. Il est aussi consultant auprès de diverses entreprises de technologies et co-auteur de Les mots de Nicolas Sarkozy (Seuil, 2008).

 Le débat sera filmé et retransmis en direct sur le Web (voir site).


PS
  • La bande son est disponible sur le site de la BPI.
  •  
  • Très bon compte-rendu de Rémi Sussan et Hubert Guillaud sur InternetActu.

15 Commentaires:

Anonymous François a écrit...

l'entame du texte me laisse un peu perplexe... poser le langage au cœur de l'humanité, cela me va tout à fait, mais pourquoi le situer "dans notre ADN"?
Car si cela devait être (ce qui n'est pas gagné), il en serait alors de même de l'HTML et du Java qui n'auraient du attendre que la venue des conditions environnementales nécessaires à leurs expressions. De la même manière, le langage "naturel" devrait attendre la condition environnementale d'un contexte culturel, social et familial pour s'élaborer à partir de l'ADN (et non à partir d'un individu en construction, c'est à dire un autre niveau épistémique).
Quand bien même cette inscription dans l'ADN serait métaphorique, je trouverais cela maladroit. Le langage naturel serait alors inscrit dans un code ne tolérant que très peu d'erreurs (à peu près comme le langage informatique, en un peu plus souple peut-être). Cela est évidemment en contradiction avec ce que l'on sait du langage "naturel".
La question sous-jacente au débat est intéressante bien qu'il me semble que Wittgenstein ait déjà abordé la question de manière conceptuelle sans la situer dans le contexte particulier de tel ou tel langage "artificiel". Toutefois, cette question me semble intéressante justement si on l'aborde en conservant les spécificité de chaque "langage" et non en les regroupant sous ce même terme commun. autant je vois une communauté certaine entre le langage "réel" et l'elfique, autant les "langages" informatiques ne m'apparaissent pas comme de véritables langages (basé sur une notion de sens commun propre à un contexte culturel et social, très tolérant à l'erreur, utilisé dans une très large part pour discourir sur le langage lui-même et consolider le sens créé...).

06 juin, 2011 14:52  
Blogger jmdesp a écrit...

Il y a plusieurs langues parlees aujourd'hui qui sont lui d'etre si naturelle que cela : l'allemand moderne a ete cree d'une maniere fortement artificielle par Luther lors de l'ecriture de sa bible, sur la base certes des divers dialectes germaniques existants, mais en reorganisant le tout d'une maniere rigoureuse qui a fait de l'allemand moderne l'une des langues parlees les plus regulieres et avec le moins d'exception, tout simplement du fait de ce caractere artificel. L'hebreu oral a lui aussi un caractere artificiel puisque quoi qu'en pensent les israelien il n'est pas totalement neutre d'avoir du recreer entierement l'oralite d'une langue qui n'existait plus que sous forme ecrite depuis plusieurs millenaires, car je peux me tromper mais il me semble que le corpus existant d'hebreu vernaculaire etait tres reduit et que pour passer d'une langue religieuse ecrite a un language vraiment utilisable dans la vie de tous les jours pas mal d'imagination a ete requise. Meme pour le francais, les grammairiens au XVIeme ont profondement change la nature de la langue, au dela d'un effort de rationalisation a peu pres neutre, ils ont sous pretexte de le raprocher de ses racines latines introduit toutes sortes d'elements purement artificiels. Il y en d'ailleurs une partie qui passe petit a petit a la trappe (reformes de l'orthographe qui supriment de nombreux accents circonflexes sans utilite reelle introduit par les grammairiens, concordance des temps que plus personne n'utilise vraiment telle qu'elle a ete concue).
Bref l'opposition n'est pas si totale qu'on pourrait croire entre languages artificiels et languages naturels car ils sont plus courant qu'on ne pense ceux qui ont deja subi l'outrage d'etre retaille suivant l'idee de quelque theoricien plutot que d'etre le resultat d'une pure evolution naturelle.

06 juin, 2011 21:32  
Anonymous Cochonfucius a écrit...

Sur la prise en main de la langue au dix-septième siècle par des grammairiens et consorts, voir un ouvrage paru naguère aux éditions "La Bibliothèque", et qui offre une excursion dans le monde des lexicographes inspirés.

07 juin, 2011 12:42  
Anonymous Mancko a écrit...

Quel dommage que la vidéo ne soit déjà plus en ligne ! Les limitations du direct sans doute...

@François > Le langage codé dans l'ADN est un joli raccourci journalistique. Cependant les travaux de Chomsky ont montré que le langage était basé sur des structures innées, câblées pourrait-on dire, de certains universaux linguistiques. Les grammaires du HTML et du java n'en font a priori pas partie (la littérature est sauvée : qui pourrait écrire un roman dans un langage de présentation ou un langage compilé ?)

@JMDESP > On pourrait ajouter à la liste des langues artificielles passées au naturel le sanskrit et le nynorsk. Et si on y ajoute les efforts de standardisation comme celui entreprit avec la réforme de l'orthographe du portugais (accord orthographique de 1990) qui rapproche l'écriture de la forme orale, qui pourrait dire combien de langues ont perdu une partie de leur naturalité ?

Félicitations en tout cas à Frédéric Werst pour cette nouvelle langue fictionnelle aux sonorités orientales. Pour celles et ceux qui voudraient apprendre à compter en wardwesân, suivez le lien (une validation par son inventeur serait très appréciée).

07 juin, 2011 20:24  
Anonymous François a écrit...

@ Mancko> je ne suis pas vraiment d'accord avec ce commentaire mais je le trouve intéressant. En effet un des principaux problèmes que je voyais dans cette utilisation du terme ADN consistait justement à poser le débat dans un paradigme inné/acquis dont on sait depuis au moins une trentaine d'années qu'il est dépassé. Le terme de "cablé" va également dans ce sens. Cela contribue à inscrire le sujet dans un cadre très mécaniste peu compatible avec la souplesse et le caractère protéiforme du langage. Les sciences cognitives ont, elles aussi, connu ce cadre dans leur début et avec un succès (en terme de chercheurs impliqués) qui commence à peine à s'émousser. Toutefois dans le cadre des sciences cognitives la nécessité de sortir d'un cadre mécaniste s'est faite sentir comme cela avait déjà été le cas en philo avec l'émergence de la phénoménologie au début du 20ème siècle. Merleau-Ponty a justement contribué à clarifier l'usage des termes comme "cablé" et de leur heuristique. L'homme est le seul être vivant à utiliser un langage et à pouvoir le développer (en tous cas pour l'instant), il y a donc effectivement des "structures" propres à notre espèces qui permettent son apparition. Toutefois sans le contexte idoine, pas de langage (et vraisemblablement un développement cognitif radicalement différent).

08 juin, 2011 09:29  
Blogger Jean Véronis a écrit...

François> Je ne suis pas l'auteur du texte de présentation... Comme le dit Mancko, "codé dans l'ADN" est un raccourci journalistique. Mais je ne le trouve pas vraiment erroné : la faculté de langage de l'homme est bien génétique (je parle bien de la faculté de langage, et non pas telle ou telle langue particulière, bien sûr !).

Java ou HTML n'entrent pas dans ce champ, car il leur manque surtout un autre élément (je l'ai souligné lors du débat) : les langues "naturelles" sont sociales, ce sont des outils de communication entre humains. Or il est impossible de se parler en langage informatique, donc il est impossible pour l'enfant d'apprendre (spontanément), etc.

L'autre différence fondamentale à mon sens (que j'ai aussi mentionnée dans le débat), c'est l'ambiguïté qui semble inhérente aux langues naturelles (tout mot a plusieurs sens, par exemple), alors qu'elle est par construction absente des langages informatiques. J'en viens à penser que cette ambiguïté, qui a gêné bien des gens (et non des moindres: Descartes, Leibnitz...) est une propriété NECESSAIRE des langues humaines, sans laquelle la communication (l'aspect social donc) serait impossible. Il faudrait des pages pour développer, mais c'est une piste absolument fascinante...

08 juin, 2011 09:32  
Blogger Jean Véronis a écrit...

François> Nous étions probablement en train d'écrire nos réponses en même temps ! "Sans le contexte, pas de langage" : bien entendu. Les enfants qui grandissent totalement en dehors d'un contexte langagier n'ont aucun langage (pour peu qu'on arrive à déméler le vrai du faux dans les histoires d'enfants sauvages, l'expérience de Frédéric II, etc.).

08 juin, 2011 09:45  
Anonymous Claude Roux a écrit...

Fascinant. Je travaille moi-même depuis quelques années sur une langue artificielle, j'avais proposé un article à TALN sur le sujet, mais il avait été refusé.
A ce propos, j'ai retrouvé un article de Mc-Carthy sur ce sujet:
MCCARTHY J. (1976). An example for natural language understanding and the AI problems it raises. Formalizing Common Sense: Papers by John McCarthy. Ablex Publishing Corporation, 355.

Je suis intimement persuadé comme McCarthy qu'une telle démarche est plus que nécessaire. La langue que j'ai construite permet d'expliciter nombre de problèmes spécifiques à l'analyse des langues "naturelles".
Je suis très surpris (et heureux) de découvrir que cette démarche est aujourd'hui prise au sérieux.

08 juin, 2011 10:40  
Blogger Jean Véronis a écrit...

Jmdesp> Oui, il y a divers exemples de l'intervention de l'homme sur les langues. Je connais moins bien le cas de l'allemand, donc je ne m'aventurerai pas trop, mais en ce qui concerne le français, l'intervention a été surtout liée au domaine de l'orthographe (en particulier par rapport à des étymologies latines, réelles ou supposées). Or l'orthographe ce n'est pas la langue, c'est un code conventionnel sur lequel il est plus facile d'intervenir, d'autant que dans les siècles passés, l'écrit était l'affaire d'un nombre réduit de clercs et de lettrés. C'est beaucoup plus difficile de toucher à la langue proprement dite. Comme j'ai coutume de dire : les langues ne se décrètent pas (et fort heureusement, sinon on tombe dans Orwell). Le cas pitoyable de notre "Ministère de la Langue" (la Commission générale de terminologie et de néologie) en fait la démonstration.. Qui utilise "bloc" pour parler d'un blog (voir ici)?

Les modifications profondes de langues sont très peu nombreuses. Elles demandent des circonstances sociales extrêmement spéciales, comme la création d'un Etat, ce qui a été le cas pour Israël. Il s'est alors agi de "restaurer" une langue qui n'était plus parlée dans la vie courante (un peu comme notre latin liturgique, si l'on veut), de lui créer tout un vocabulaire du temps présent... Le travail de Ben Yehouda est tout à fait étonnant. Mais c'est un cas unique à ma connaissance, en tout cas dans son ampleur (même si d'autres langues comme le gallois s'en sont inspirées).

Mais on est toujours dans l'adaptation, le "bricolage" (parfois génial) sur des langues existantes. L'adoption par un groupe social d'une langue totalement artificielle est rarissime. Il y a bien sûr quelques exemples comme l'espéranto, voire le klingon, mais ils interviennent quasi exclusivement dans des cas de bilinguisme (la langue artificielle étant langue seconde, bien entendu). On évalue à peut-être un millier le nombre de personnes qui auraient l'espéranto comme véritable langue maternelle...

08 juin, 2011 11:30  
Anonymous François a écrit...

@ Jean> Je suis d'accord avec le terme "génétique". Toutefois je le restreindrais à son acception "propre au développement" telle qu'a pu l'employer Piaget dans son "épistémologie génétique". Mais cela n'a évidemment rien à voir avec l'ADN. Il est intéressant d'ailleurs de jeter un oeil à l'histoire du terme "gène" qui a été construit bien avant la découverte de l'ADN (vers 1905) sur la base du grec "genetykos" (propre à la génération (et pourrait-on dire au phénomène de développement)). Cela relève ainsi d'un processus dynamique et non comme la biologie moléculaire l'a construit par la suite d'un programme rigide.

merci pour ces réponses et pour ce blog toujours aussi sympathique et intéressant

08 juin, 2011 11:42  
Anonymous temps a écrit...

Bonjour,
Je ne pense pas que nous puissions différencier un langage naturel et un langage artificiel. Je pense qu'il existe des langues vivantes, des langues mortes, des langues de conventions en d'autres termes, et des techniques de communication demandant moins de pré-requis même s'ils demandent un peu de connaissances des lois physiques. Ainsi gnome est intuitif, le langage C est intuitif, la grimace est intuitive, la transpiration est aussi intuitive, mais pas java car actuellement java est construit sur des "class" incohérentes qui ne reproduisent pas l'observation.
Cordialement

09 juin, 2011 02:23  
Anonymous Mancko a écrit...

Pour celles et ceux qui auraient manqué la diffusion vidéo en direct, vous pouvez retrouver la bande sonore à l'adresse suivante : http://archives-sonores.bpi.fr/index.php?urlaction=doc&id_doc=3403

13 juin, 2011 14:58  
Blogger Jean Véronis a écrit...

Très bon compte-rendu de Rémi Sussan et Hubert Guillaud sur InternetActu.

14 juin, 2011 20:44  
Blogger Curare- a écrit...

Combien l'analyse s'enlise constatait Lyse émulsionnée par
la danse des mots et la densité dans sa diversification syntaxique du langage écrit sans les cris aux abois ..
Le langage sms ou syllabique est en cours d'appropriation par notre jeunesse fougueuse -
Tronquer les mots pour raccourcir les maux-
L'émotion par les émoticones -cette rage de lire à 100 à l'heure
sans se heurter à la difficulté..d'écrire -sourire
Combien de générations 'sacrifiées ?' ingurgitant la méthode globale?
Fécondes circonvolutions des mots tomberont ils dans l'oubli des écrans ravageurs des portables ?
Resteront ils la nourriture intacte de quelques initiés perclus de solitude dans l'infernale machine ?
Les mots s'oublient se changent et puis se renouvellent tout conte fée -
Cela a toujours été -

-Usul parle moi de ton monde Natal-

F. Herbert a prédit 1 messie qui tuera avec ses mots-
Je m'y suis entraînée qelquefois ...
Mais ce n'est que le futur..et demain n'existe pas.

20 juin, 2011 19:50  
Anonymous Anonyme a écrit...

Bonjour, je préfère le terme langue construite que langue artificielle, parce que, comme remarqué par divers commentateurs, de nombreuses langues ont été remaniées, profondément ou superficiellement : hébreu, allemand, mais aussi indonésien, italien (Dante), russe par Lomonossov.
« L'adoption par un groupe social d'une langue totalement artificielle est rarissime. Il y a bien sûr quelques exemples comme l'espéranto, voire le klingon,(...) » 
L'espéranto n'est pas une langue « totalement artificielle » (à l'inverse, peut-être, du Volapuk) car la totalité de son vocabulaire, du moins pour les racines de base, est issue des langues dites naturelles, de même que sa grammaire est inspirée des principes de base communs à diverses langues – c'est la synthèse qui est totalement originale et géniale. D'ailleurs, tout ce qui est issu du cerveau humain est finalement artificiel – ou naturel, selon le raisonnement.
Par ailleurs, j'ai toujours trouvé étrange qu'au cours de ces débats savants, un fait majeur soit systématiquement occulté ou minimisé : l'incommunicabilité entre les humains - une seule espèce - autrement dit la barrière des langues qui nous sépare tous à l'échelle de la planète. Avec la mondialisation, la planète a rétréci, et pourtant, nous refusons (inconsciemment ?) de débattre d'un moyen de communication, comme si nous niions la réalité de cette incompréhension mutuelle, ou que nous en remettions à l'espérance de la traduction automatique, illusoire pour l'instant – le débat rappelle d'ailleurs honnêtement que l'informatique est très très loin des performances du cerveau humain
L'autre moyen de discussion, le truchement d'une armada d'interprètes – ne peut être envisagé que par de grandes organisations type ONU – même l'UE a dû admettre son échec en la matière...

23 août, 2011 19:43  

Enregistrer un commentaire