Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

dimanche, janvier 08, 2006

Traduction: Systran ou Reverso?


Il est de bon ton chez les linguistes de se moquer des traducteurs automatiques. Il est vrai qu'ils nous offrent parfois un florilège de phrases mal construites et de contresens qui frisent le surréalisme. Pourtant les premières recherches en traduction automatique remontent au tout début des années 1950: plus d'un demi-siècle d'efforts n'ont pas réussi à casser le code. Incroyable difficulté du langage! Dans le même temps on aura réussi à décrypter le génome humain (la découverte de la structure en double hélice de l'ADN en 1953 est contemporaine des débuts de la traduction automatique)...



Pour autant, les choses progressent -- trop lentement, bien sûr, à mon goût, mais il ne faut pas être injuste. Si la traduction automatique ne peut absolument pas rivaliser avec un traducteur humain (même mauvais!), cela ne veut pas dire qu'elle soit totalement dénuée d'intérêt. Voici une petite expérience que je soumets chaque année à mes étudiants dans mon cours d'introduction aux Technologies du Langage. Prenons une des nouvelles du jour sur un journal grec, Kathimerini:

Δύο νέα κρούσματα στην Τουρκία του θανατηφόρου ιού της γρίπης των πτηνών

Ο Παγκόσμιος Οργανισμός Υγείας ανακοίνωσε σήμερα στη Γενεύη ότι δυο παιδιά που νοσηλεύονται στην Τουρκία έχουν προσβληθεί από το θανατηφόρο στέλεχος Η5Ν1 του ιού της γρίπης των πτηνών.

Εκπρόσωπος του Οργανισμού δήλωσε ότι τα παιδιά, ηλικίας 5 και 8 ετών, προέρχονται από την ίδια περιοχή με τα τρία αδέλφια που πέθαναν από τη γρίπη των πτηνών αυτήν την εβδομάδα.

Σημειώνεται πως 32 άτομα νοσηλεύονται σε νοσοκομείο της πόλης Βαν με ύποπτα συμπτώματα, ενώ τουλάχιστον πέντε περιοχές της ανατολικής Τουρκίας έχουν τεθεί σε καραντίνα.


Cela ne vous dit probablement pas grand chose... Je prends toujours volontairement une langue que peu de gens connaissent. Le grec est idéal parce qu'on ne peut même pas deviner de quoi il s'agit d'après la forme des mots (alors qu'on peut déchiffrer de l'anglais, de l'espagnol ou de l'allemand même si on ne connaît pas ces langues). Le chinois ou le japonais seraient aussi de bons candidats!

Comparons maintenant avec la version traduite par Babelfish:

Deux nouveaux cas en Turquie du virus mortel de la grippe des oiseaux

L'organisme mondial de santé a communiqué aujourd'hui à Genève que deux enfants qui nosiley'ontaj en Turquie ils ont été attaqués par le cadre I5N1 mortel du virus de la grippe des oiseaux.

Représentant de l'organisme a déclaré que les enfants, de l'âge 5 et de 8 années, proviennent de la même région que les trois frères qui sont morts de la grippe des oiseaux cette la semaine.

Il est marqué que 32 individus nosiley'ontaj à hôpital de la ville Van grâce à des symptômes suspects, tandis qu'au moins cinq régions de la Turquie orientale ont été posées à quarantaine.

Cette traduction reflète parfaitement l'état de l'art dans le domaine: on comprend le thème général (la grippe aviaire en Turquie), et l'on peut même lister les faits principaux: deux enfants de 5 et 8 ans sont morts de la grippe aviaire en Turquie, 32 individus ont été hospitalisés avec des symptomes suspects, cinq régions sont en quarantaine, etc. Certaines des erreurs sont stupides: H5N1 est traduit par I5N1, νοσηλεύονται (hospitalisés) est absent du dictionnaire. On pourrait améliorer les choses à peu de frais.

Il est hors de question d'utiliser de telles traductions comme documents finaux, et je suis toujours très perplexe quand des étudiants (ou collègues!) m'annoncent fièrement qu'ils ont traduit automatiquement leur résumé en anglais pour une conférence! Mais la traduction automatique a passé le cap qui lui permet d'être un véritable outil de déchiffrage, utile pour prendre connaissance rapidement du thème et du contenu global de pages en langues étrangères, dans des situations où il serait inconcevable de payer un traducteur. C'est la cas par exemple des spécialistes de veille économique, mais aussi de l'internaute lambda: alors que la grande majorité des documents du web sont écrits en anglais, moins de 30% des internautes sont anglophones (voir étude de Byte Level), et cette proportion ne cesse de décroître.

Il n'est donc pas étonnant que la plupart des moteurs de recherche offrent une fonction permettant de traduire les pages retournées. Mais dans un contexte où le marché potentiel est aussi considérable, il est par contre surprenant de voir à quel point l'offre est limitée: Google et Yahoo utilisent la même technologie, le système Systran, qui est aussi derrière Babelfish (Altavista). Le moteur français Voila utilisait au départ Reverso de Softissimo, mais s'est finalement mis aussi à Systran... Les portails comme AOL et Wanadoo le proposent aussi. Systran fait d'ailleurs désormais la plus grande partie de son chiffre d'affaire avec les opérateurs internet.

Dans ce contexte de systrannisation, Ask Jeeves surprend, puisque la firme a annoncé récemment son association avec Reverso [via DSI], disponible aussi sur la version beta francophone du moteur.

Alors, mauvais choix? Pour en avoir le coeur net, nous avons demandé à 58 étudiants de première année de licence d'étudier la question. Le projet consistait à traduire un texte de leur choix, d'au moins 500 mots, de leur langue seconde vers leur langue maternelle (de façon à pouvoir juger correctement du résultat), à l'aide à la fois de Reverso et de Systran (site Babelfish). Chaque étudiant devait faire une étude détaillée des erreurs et de leurs causes probables (mot absent du dictionnaire, etc.); je vous passe les détails. La dernière question demandait à chacun de choisir parmi Reverso et Systran quel était le système qui fournissait la traduction la plus lisible.

Les résultats sont sans appel:

SourceCibleReversoSystran
AllemandFrançais20
AnglaisFrançais155
ItalienFrançais81
EspagnolFrançais206
FrançaisAnglais01
Total
4513

Quelle que soit la langue, la préférence va massivement à Reverso.



Alors... Ask Jeeves aurait-il eu du flair? En tous cas, Systran, qui est en désamour avec sa "vache à lait" historique, la Commission Européenne [voir Le Monde, Systran], a sans doute intérêt à serrer quelques boulons pour survivre dans le monde plus impitoyable des opérateurs internet.

Merci à Estelle pour le dépouillement de l'enquête!

46 Commentaires:

Anonymous Anonyme a écrit...

les intellectuels ont choisis aussi

http://nouvelobs.reverso.net/textonly/default.asp

08 janvier, 2006 17:46  
Blogger Denis a écrit...

Le lien pour le site Internet international de Systran est systransoft.com et non systran.com ;-)

L'avantage que Systran a sur Reverso est d'être capable de traduire entre plus de langues. Par exemple : en plus de l'anglais vers et depuis l'allemand, l'italien, le français ou l'espagnol comme Reverso, Systran peut traduire vers et depuis le chinois, l'arabe, le néerlandais, le russe, le coréen, le japonais, le portugais et le suédois.

08 janvier, 2006 18:33  
Blogger Jean Véronis a écrit...

Anonymous> NouvelObs -- merci pour le lien, je n'avais pas remarqué.

08 janvier, 2006 18:35  
Blogger Jean Véronis a écrit...

Denis> lien -- merci: en fait je voulais mettre systran;fr, mais mon doit a fourché!

plus de langues -- tout à fait vrai (le grec en particulier, n'est pas sur Reverso).

08 janvier, 2006 18:38  
Blogger Denis a écrit...

Avec le nombre d'étudiants que vous avez ce serait intéressant de demander à certains groupes de traduire chacun un même texte, et de calculer le score BLEU ou NIST des deux traducteurs automatiques pour celui-ci.

08 janvier, 2006 19:01  
Blogger all a écrit...

νοσηλεύονται = hospitalisés ; vous êtes sur ?

Hôpital se dit nosokoméïo (comme dans maladies nosocomiales)

08 janvier, 2006 19:23  
Anonymous Anonyme a écrit...

Si les traductions proposées par Systran de l'allemand vers le français sont effectivement si nulles qu'on peine souvent à dégager même le sens général du texte, par contre, il fait un excellent travail dans le sens français --> allemand, peu de retouches sont nécessaires pour parvenir à un texte qui, aux dires de mes nombreux correspondants allemands, est parfaitement compréhensible.

08 janvier, 2006 19:47  
Anonymous Anonyme a écrit...

Pour digresser un peu sur le sujet de la traduction, humaine cette fois-ci, et des moteurs de recherche : ces derniers se révèlent aussi de précieux outils pour obtenir la "bonne" traduction d'une tournure en langue étrangère. Lorsque j'hésite sur une construction idiomatique en anglais, ou en allemand, je la tape entre guillemets dans Google, sous une ou plusieurs formes, et je compare les résultats : nombre de pages renvoyées, contexte dans lesquels le mot ou l'expression est employé.

08 janvier, 2006 19:59  
Blogger Jean Véronis a écrit...

Denis> BLEU et NIST -- excellente suggestion!

08 janvier, 2006 20:05  
Blogger Jean Véronis a écrit...

All> hôpital -- absolument, c'est νοσοκομείο.

νοσηλευτής c'est l'infirmier... je ne crois pas qu'on ait un verbe exactement correspondant (admettre en soins?).

08 janvier, 2006 20:17  
Blogger TOMHTML a écrit...

Le meilleur traducteur, peut être existera-t-il dans le futur, serait celui qui traduirait un texte de la langue A vers la langue B, puis le résultat serait traduit de la langue B vers la langue A pour donner EXACTEMENT le texte d'origine (la traduction par des mots synonymes importe peu, tant que la structure de la phrase et son sens reste).

exemple avec le traducteur de google :
texte :
Jean Véronis est un excellent professeur, et il rédige de bons articles qui font le bonheur de ses lecteurs.
le même texte traduit en anglais, puis le résultat traduit en français donne (presque) EXACTEMENT le même texte.
Par contre quand on passe par l'allemand ça devient
Jean Véronis est un professeur remarquable, et il écrit les bons articles qui font la chance de ses lecteurs.
ça change un peu le sens, mais on comprend encore.
idem en passant par le portugais
Jean Véronis est un excellent enseignant, et écrit de bons articles qui font le bonheur de leurs lecteurs.



en commençant ce commentaire j'étais persuadé que les résultats allaient être très loin de la réalité, j'en suis le premier surpris
Comme quoi, c'est pas si pourri que ça les traducteurs automatique ;)

08 janvier, 2006 20:31  
Anonymous Anonyme a écrit...

Pascal Grouselle> C'est une technique que j'utilise moi aussi très souvent pour vérifier des tournures étrangères. Et même françaises! : c'est souvent bien plus rapide que de consulter le Grand Robert, qui est pourtant actif en résident sur mon pc!

08 janvier, 2006 20:32  
Anonymous Anonyme a écrit...

Il est exact que Reverso a une longueur d'avance sur Systran.
Petit exemple d'une simple traduction du français vers l'anglais:
Julie mange des avocats.
Reverso: Julia eats lawyers(avocados).
Systran 5: Julia eats lawyers.
Notre pauvre Julie risque une fameuse indigestion sauf à choisir des "avocados.

08 janvier, 2006 22:10  
Anonymous Anonyme a écrit...

Il m’arrive de poster quelques photos sur un site anglophone. Il s’agissait en l’occurrence d’un panorama. Je ne résiste pas à l’envie de vous donner la traduction d’un commentaire que j’ai reçu :

“Brilliant pan. One of the best "WOWs" I've had for ages, good one!”

Traduit par WorldLingo:

« Casserole brillante. Un des meilleurs "défauts de la reproduction sonore" que j'ai pris pour des âges, le bon ! »

Sans autre commentaire…

08 janvier, 2006 23:40  
Anonymous Anonyme a écrit...

Google développe son propre outil de traduction, qui semble prometteur puisqu'il a emporté un récent concours, loin devant Systran pour les langues où les deux participaient (Arabe -> Anglais et Chinois -> Anglais).

Bien sûr cela ne veut pas dire que le système de Google est prêt pour fonctionner à grande échelle. La qualité du résultat peut varier considérablement en fonction du temps machine disponible.

09 janvier, 2006 01:01  
Anonymous Anonyme a écrit...

Richard, comment as-tu trouvé ces résultats? Avec la version en ligne de Reverso (http://www.reverso.net/), il ne propose pas avocados...

09 janvier, 2006 09:49  
Anonymous Anonyme a écrit...

Bonjour. Vous faites un intéressant parallèle entre le développement de la traduction automatique et de la biologie moléculaire. Historiquement, ça se tient, mais conceptuellement, c'est très différent.

Le séquençage des génomes, c'est une technique très linéraire : il suffit de lire une longue séquence très simple, puisque constituée seulement de quatre paires de bases (agtcggcg...). La conséquence de cette simplicité, c'est qu'un génome, même de trois milliards de paires de bases, est très facile à numériser, à quantifier, et à manipuler par ordinateur. Par exemple, le génome humain tient plus ou moins sur un CD-Rom sans compression (3.10^9 x 2 bits). Il y a des milliers de sites qui permettent de faire des comparaisons de séquence, de la recherche de gènes, de la traduction de gènes en protéines, etc. En fait, c'est presque trivial, tellement c'est bien adapté au fonctionnement d'un ordinateur, qui n'est à la base qu'une machine à manipuler des chiffres.

La traduction automatique, par contre, c'est une autre paire de manches, et je ne vous apprend sans doute rien. Je vais répéter une partie du commentaire que j'ai fait sur Embruns, mais pour traduire un texte, il faut tenir compte d'un nombre considérable de variables toutes liées, et qui ne sont pas quantifiables, donc très difficiles à gérer pour un ordinateur, par exemple : le sens explicite ou implicite des mots, le style d'écriture, les connotations, le contexte, la culture, la grammaire, le niveau de langage, etc. Le cerveau humain est une très mauvaise machine pour le calcul, mais pour ce genre d'associations cognitives immédiates, il est imbattable. Pour reprendre un exemple ci-dessus, il est évident pour nous que quand un anglophone écrit "pan" sur un site de photos, il parle de panoramique, et pas de casserole. Qu'un fan-club n'a rien à voir avec un ventilateur. Qu'un avocat dans une phrase représente un fruit ou une personne (et encore, ce n'est pas forcément lié au verbe qui le précède, on pourrait imaginer quelque chose du genre "Au cours de sa plaidoirie, le procureur a dévoré tout cru cet avocat impertinent"). On sait différencier le sens des deux mots identiques dans une phrase comme "les poules du couvent couvent".

En résumé, je dirais que la traduction automatique est conceptuellement très liée non pas à la biologie moléculaire, mais à la neurobiologie. Savoir comment fonctionne le cerveau. Qui est aussi une science qui progresse très lentement, parce que circulaire : le seul outil que l'on a pour comprendre le fonctionnement du cerveau humain, ce sont nos cerveaux humains. D'ailleurs, je dirais que la traduction automatique est un des exemples les plus avancés de ce que l'on appelle "l'intelligence artificielle". On fantasme là-dessus depuis les années 50 aussi, la cybernétique, les robots, mais même aujourd'hui, les robots de conversation (il y en a en démo sur le net) sont très très mauvais, et ne passent quasiment jamais le test de Turing.

C'est pour cela que, malgré les bonnes rigolades que procurent souvent les traducteurs automatiques, j'admire fortement les gens qui se lancent dans de tels projets très complexes, et je trouve que ces logiciels commencent réellement aujourd'hui à devenir intéressants et surtout utilisables, malgré le fait que leur fonctionnement n'est pas du tout adapté à la mécanique interne d'un ordinateur. Comprendre le sens d'un texte en grec ou en japonais, je trouve ça complètement fascinant et presque incroyable, à côté de cette prouesse, les petites erreurs sont vraiment peu importantes.

Euh, j'ai été un peu long je crois. Désolé :)

09 janvier, 2006 11:33  
Anonymous Anonyme a écrit...

Le projet 'Rosetta Stone' de Google semble effectivement etre un des futurs produits majeurs de ce marche.
A lire l'article sur ce nouveau Google Translator : http://blog.outer-court.com/archive/2005-05-22-n83.html

Il faut savoir que celui ci repose sur un systeme type 'pierre de rosette' (comme le suggere son titre), utilisant
un enorme corpus de documents traduits. Lesquels ?

"Google relies on a large corpus of texts which are available in multiple languages."

Devinez.. :)

09 janvier, 2006 11:37  
Anonymous Anonyme a écrit...

allez, je donne la solution, disponible sur cet article (entres autres) "Will Google Kill the Translation Industry" :
http://www.corante.com/goingglobal/archives/2005/05/28/will_google_kill_the_translation_industry.php

"Google used the United Nations Documents to train their machine, and all in fed 200 billion words. This is brute force AI, if you want – it works on statistical learning theory only and has not much real “understanding” of anything but patterns."

Je ne sais pas s'il est tres juste qu'une societe commerciale reutilise le travail collossal des traducteurs des Nations Unies.
Disons que ca me choque un peu.

09 janvier, 2006 11:49  
Anonymous Anonyme a écrit...

Je ne connais aucun des deux traducteurs automatiques. Mais je remarque que la seule traduction vers l'anglais donne l'avantage a Systran. Effet d'une statistique trop faible ou bien Systran est-il meilleur dans un sens que dans l'autre (ce qui ne serait pas inconcevable : cela permettrait a tous les internautes anglophones, une cible riche et nombreuse, d'acceder a quasi l'ensemble des textes publies sur le web) ?

09 janvier, 2006 15:00  
Blogger Loran a écrit...

Bonjour,
ce n'est pas vraiment dans le sujet (pertinence de la traduction), mais ce traducteur tres 2.0 ( ;o) ) fait de la traduction à la volée, c'est (techniquement) impressionnant.
http://ajax.parish.ath.cx/translator/

Bonne journée.

09 janvier, 2006 16:25  
Blogger Marianne a écrit...

Merci pour le tuyau ! Je crois que je vais passer quelques jours sur reverso pour voir ce que ça donne !
Ce que je trouve un peu dommage chez Systran, c'est que la présentation du résultat est uniquement centrée sur le texte en langue cible. Pour un traducteur qui l'utilise pour du déchiffrage, il serait plus pratique que les deux langues soient montrées en parallèle (droite / gauche). Enfin, je crois qu'on peut brancher systran sur trados, mais à ma connaissance ce n'est pas très utilisé.

10 janvier, 2006 09:15  
Blogger Jean Véronis a écrit...

Merci pour tous ces commentaires excellents! J'ai fait cours hier après midi et du coup je suis dépassé...

Pascal Grouselle> Lorsque j'hésite sur une construction idiomatique en anglais, ou en allemand, je la tape entre guillemets dans Google -- oui, je fais ça aussi. C'est souvent plus efficace qu'un dictionnaire, parce qu'on a accès au contexte. nous sommes même en train de faire une expérience avec une de mes étudiantes pour essayer de voir comment utiiliser le web pour générer des traduction d'expressions qui ne sont pas dans les dicos. J'en reparlerai peut-être si ça donne de bons résultats...

10 janvier, 2006 10:37  
Blogger Jean Véronis a écrit...

TomHtml> Oui, les traducteurs sont loins d'être parfaits, mais ils sont beaucoup plus stables. Je me servais de votre système (traduire de la langue A vers la langue B puis vers la langue C puis vers la langue A à nouveau) pour amuser les étudiants il y a quelques années: on avait ainsi à peu de frais un générateur de poésie surréaliste. Mais c'est beaucoup moins spectaculaire ces temps-ci...

10 janvier, 2006 10:39  
Anonymous Anonyme a écrit...

Suite à un post de guillermito, qui m'a interpellé, cela m'a fait repenser à quelque chose qui est en cours de développement et qui pourra d'ici quelques années je suppose aider dans pas mal de domaines comme celui mentionné dans cet excellent billet. En effet lors d'une discussion avec un prof de méthodes numériques l'année passé, après avoir vu comment fonctionnait l'ordinateur et du binaire entre autres, il m'a parlé de recherches qui utilisaient des nombres générés aléatoirement comme langage, ces nombres permettant une rapidité et flexibilité dans les caculs très prometteurs (plus rapides, plus grandes capacités). Et justement je suppose quesi un tel système se développait, il est fort à parier que cela permmettrait de faire exécuter à l'ordinateur des choses plus "humaines", puisque celui-ci ne serait plus formaté dans un langage basique, mais plutôt aléatoirement contrôlé. Bref cela pourrait donner des résultats passionants ce y compris dans les domaine cités ici.
Mais pour en revenir plus au sujet, je me demandais si il existait un traducteur automatique du latin vers le français? Cela me semblerait beaucoup plus concevable, le latin proposant une structure beaucoup plus à même d'être interprêté "mécaniquement" (cela dépendant cependant des auteurs, car je vois mal comment appliquer cela pour Lucrèce et ses textes sur l'atomitisque qui me semblent bien compliqué même pour un latiniste émérite).
Et peut-être même pour d'autres langues anciennes (mas là je m'avance car je ne connais pas leurs constructions grammaticales)?

Ps: à propos des robots de discussion, en existent-ils en démo sur le net qui ont pu passé le test de Turing (si cela existe)?
PPs: j'en ai déjà testé des mauvais et le truc pour les confondre c'est de leurs dire "je parle Français".... "Quelle est la langue que j'emploie?" Les réponses sont surprenantes ;)

11 janvier, 2006 20:59  
Anonymous Anonyme a écrit...

En ce qui concerne la performance des traducteurs automatiques, il ne faut pas seulement voir lea qualité de traduction d'un texte, mais aussi la nature du texte.
Si vous essayez de traduire une oeuvre qui est passée dans le domaine public (et deja traduite par des êtres humains), il y a de grandes chances pour que la traduction soit très bonne (même si ce n'est pas toujours le cas).
Par contre, si vous tentez la même expérience avec un livre on ne peut plus quelconque, vous avez des chances d'arriver sur une littérature d'un autre genre.
Personnellement, j'utilise parfois le traducteur systran pour traduire de l'anglais vers le francais (fainéantise, quand tu nous tiens) des textes techniques, et la plupart du temps, je suis agréablement surpris par la qualité de la traduction et par le vocabulaire employé (a par "the web" traduit par "la toile", même dans un texte a très forte connotation informatique)
En ce qui concerne le traducteur de google,si j'ai bonne mémoire, les tests ont été faits sur des textes de droit ou approchant. Ce qui biaise forcément les résultats, compte tenu que google ne s'est basé que sur ce genre de textes. Si on tentait la même expérience avec un autre style de texte, je ne serais pas étonné de voir apparaître un certain nombre de contre sens...

12 janvier, 2006 13:38  
Anonymous Anonyme a écrit...

Suite à la remarque d'Hermes sur les techniques statistiques de Google, je me demandais si une des retombées collatérale du projet de Google Print visant à numériser un nombre considérable de livres, n'était pas de disposer d'une base la plus large possible de textes validés par ailleurs afin de les traiter automatiquement. On peut imaginer ainsi si on dispose de livres et de leurs traductions dans diverses langues pouvoir traduire des textes "à la manière de" tel ou tel auteur, ou de façon "littéraire" ou "technique".
En poussant plus loin l'idée, on pourrait même générer automatiquement le style d'un auteur sur n'importe quel texte de base, le réécrire comme Flaubert ou comme Houellebecq. Et pour pousser plus loin encore la SF, grâce à la reconnaissance de l'écriture graphique, générer de faux manuscrits..
Pour revenir sur terre, je crois que l'on n'a pas assez porté d'attention à l'importance pour ces firmes de disposer de corpus validés.

12 janvier, 2006 17:28  
Anonymous Anonyme a écrit...

Je passe par un autre traducteur assez puissant et proposant pas mal de choix de langues

http://www.worldlingo.com/fr/products_services/computer_translation.html

Bravo pour votre blog, un plaisir

27 janvier, 2006 22:36  
Anonymous Anonyme a écrit...

Les traducteurs persistent et signent : le cas signalé sur le forum de la plateforme pour professionnels de la traduction ProZ est en effet grave ... et hilarant :
Certaines personnes n'apprendront jamais que la traduction automatique ne donne rien... (fil de discussion initié le 16/02/2006)

17 février, 2006 10:56  
Blogger Jean-François MASSERON a écrit...

Très intéressants ce blog et cette disccussion.

Je voudrais juste signaler qu'il existe une conférence de l'Université de tous les savoirs sur la question de la traduction automatique par Laurence Danlos. On peut l'écouter ici : http://www.canal-u.education.fr/canalu/chainev2/utls/programme/20_linguistique_et_informatique_la_traduction_automatique_/

On me demande souvent de mettre en forme du français traduit par des Japonais. Et j'ai recours à la traduction automatique pour gagner du temps et comprendre l'original quand le résultat est trop obscur.
A ma connaissance, on ne trouve pas de traducteur gratuit japonais-français sur le Net. Je viens, grâce a cette discussion, de découvrir que Worldlinguo propose cette option. Franchement, à éviter ! Voici ce qu'il me propose quand je lui donne un paragraphe en japonais extrait de la newsletter de Yahoo Japan que je viens de recevoir :

le "témoin appellent" et ainsi de suite, la terminologie politique qui avec des nouvelles est faite à l'oreille. "sachant ? intention ", étant entendu chez la personne, vous démuni pu avoir expliqué ? En outre, quant à la personne que nous voudrions connaître, si le membre du régime de l'extrémité locale a fait ce qui beaucoup d'espérance. Nouveau service

Je le soupçonne de traduire d'abord en anglais, puis de l'anglais au français, multipliant ainsi les ambiguités.

La meilleure solution, à partir du japonais, me semble être le traducteur proposé par Yahoo Japan. Il est ici : http://honyaku.yahoo.co.jp/

Il propose, dans les deux sens, japonais anglais, japonais chinois, japonais coréen.

Voici ce qu'il m'a donné pour le même texte :
A politics term to hear in "summons of a witness" news. Is what "an intention knowing" is asked by a person and was not able to explain not?  In addition, there should be many people to want to know what a local Diet member does. etc...

A peine plus éclairant, certes, mais son avantage est de permettre de cliquer sur chaque mot japonais et d'avoir en surligné l'équivalent anglais. En cliquant deux fois, on ouvre une batterie de dictionnaires (japonais-japonais, japonais-anglais, angais-anglais).

Grâce à cette fonction, avec quelques rudiments de japonais et d'anglais, j'arrive à comprendre ceci :
On entend souvent dans les informations politiques le terme de "....". Vous ne connaisez pas cette expression et vous aimeriez certainement savoir de quoi il s'agit. Vous aimeriez également savoir... etc."

Encore une expérience avec Worldlinguo. J'ai tapé ceci en japonais : 'il fait beau aujourd'hui, hein. Qu'est-ce qu'on pourrait (/que vous pourriez) bien faire ? Aller se promener, faire des courses ? Qu'est-ce qui est le mieux (/que vous préférez) ?

Voici la traduction de Worldlinguo :
Il est rapide ! Ne pensez-vous pas ? aujourd'hui est bon survivent à. Il fera quelque chose, la marche ou faire des emplettes ? Le kana où l'un ou l'autre un est bon.

Et celle du traducteur Yahoo :
Good morning! It is a fine day today. Is it a walk or shopping what you will make it? Which is good?

J'ai été un peu long, gomen nasai (=excusez-moi) !

JFM

02 mars, 2006 04:27  
Anonymous Anonyme a écrit...

Bravo, blog excessivement intéressant... Déjà que j'ai pa sle temps de faire mon travail, c'est mon patron qui va pas être content !!
Maintenant, je sais que Reverso est mieux !!
PS : Continuez comme ça ;-D

28 avril, 2006 14:28  
Anonymous Anonyme a écrit...

Mais à ce que j'ai compris, Reverso Translator est destiné au grand public alors que Reverso Pro/Expert est destiné à ceux qui font un usage "intensif" d'une solution de traduction automatique (avec notamment la possibilité de créer ses propres dictionnaires pour améliorer la qualité de la traduction).

05 septembre, 2006 16:46  
Anonymous Anonyme a écrit...

Ok, j'entend parler que de systran et de reverso, mais Promt n'est pas également un des leaders sur le marché? (www.translate.ru)
Je croyais que Reverso se basait souvent sur une plate-forme Promt justement.

Est ce parce qu'il ne sont pas présent sur le marché français qu'ils sont peu utilisés, ou est ce parce que le produit s'est fait distancé ?

27 septembre, 2006 16:17  
Anonymous Anonyme a écrit...

Ce commentaire a été supprimé par un administrateur du blog.

21 novembre, 2006 15:33  
Blogger Jean Véronis a écrit...

Pascal L.> J'ai retiré votre commentaire. C'est très rare, je ne l'ai fait qu'une fois sur ce blog (quelqu'un avait pété un boulon).

Ce n'est pas de la censure. Votre message commence ainsi :

||Pensant que le moteur Reverso avait connu des améliorations
||depuis les versions Pro et Expert datées de 2001, j'ai décidé
||d'essayer Reverso Translator 10. Une très mauvaise idée,
||et une vraie déception à la clé !
||Car pour moi, les problèmes avec Reverso Translator 10 ont commencé
||dès l'installation qui, sur mon PC...

Et vous expliquez vos problèmes d'installation, la lenteur que vous remarquez dans le système, etc.

C'est très sain d'analyser un logiciel et d'en décrire les failles éventuelles, et vous semblez le faire de façon très précise.

Néanmoins, je suis pénalement responsable de ce blog, au titre de la loi sur la presse du 29 juillet 1881 (je ne me trompe pas de siècle). Et c'est moi qui devrai assumer les éventuelles poursuites juridiques de la société que vous mettez en cause.

Comme vous êtes anonyme vous ne risquez rien (et d'ailleurs, qui prouve que vous n'êtes pas un concurrent ?).

Donc je crois qu'il faut 1) lever votre anonymat 2) publier sur un site qui vous est propre.

Ce sera une façon d'assumer vos propos et votre analyse. Je les ai entendus (ou plutôt lus), mais je ne suis pas moi-même en mesure d'en assumer le bien-fondé, n'ayant pas pu effectuer les tests adéquats.

Tout ceci sans aucune amertume et aucune agressivité. Je suis heureux de compter des lecteurs comme vous !

22 novembre, 2006 13:17  
Anonymous Anonyme a écrit...

Vous avez peut-être raison, il est vrai que ma présentation de Reverso Translator 10 pouvait parfaitement faire penser à un torpillage en règle organisé par un concurrent... Si j'ai choisi de ne pas révéler mon identité, c'était entre autres pour appuyer le fait qu'il s'agissait de l'opinion d'un utilisateur lambda mais aussi parce j'ai déjà fait l'objet de pressions (voire de menaces) pour avoir "osé dire" la vérité sur certains logiciels à une époque où j'étais journaliste-pigiste pour des magazines de micro-informatique. Le retrait de mon commentaire élimine de facto toute conséquence potentiellement fâcheuse comme celle-ci... Amicalement, Pascal L.

22 novembre, 2006 18:05  
Blogger Jean Véronis a écrit...

Merci de votre compréhension, Pascal.

22 novembre, 2006 18:07  
Anonymous Anonyme a écrit...

Softissimo continue de commercialiser une version qui s'appelle Reverso Promt (en téléchargement notamment), mais aussi pour Intranet et qui offre les mêmes fonctionnalités que Reverso Pro. Softissimo offre gratuitement à ses utilisateurs enregistrés des dictionnaires complémentaires qui permettent une traduction plus précise. Les dictionnaires de spécialité téléchargeables en option permettent une adaptation encore meilleure à des domaines de spécialité.

Reverso Promt reste la référence pour les traductions de qualité. Un service gratuit Reverso.net permet de tester cela

Reverso Promt a été conçu par Softissimo en collaboration avec Promt et porte un copyright conjoint. Les spécifications linguistiques ont été faites par Softissimo et les dictionnaires, composant essentiel de l'outil portent le copyright Softissimo.

Reverso Translator est un produit grand public, qui offre un grand nombre de paires de langues, une fonction de prononciation naturelle, à un prix très abordable. La technologie sous-jacente pour le français-anglais notamment est différente de celle de Reverso Promt. Le produit a été vendu à des milliers d'exemplaires et correspond à son descriptif. Il n'y a eu quasiment aucune plainte ou demande de retour.

Pour le reste, vous pouvez regarder gratuitement les innovations de Softissimo sur www.reverso.net : dictionnaires bilingues en ligne, grammaire, et bientôt conjugaison ...

07 mars, 2007 20:37  
Anonymous Anonyme a écrit...

Il est toujours intéressant de constater à quel point les usages et les opinions diffèrent sur les traducteurs en ligne. Surtout de la part de gens qui les utilisent peu mais qui en ont une approche ludique ou intellectuelle. J'utilise personnellement Systran 4 pour réaliser des rapports qui me sont malheureusement demandés en langue anglaise. J'ai donc, sur les 18 derniers mois, rédigé plusieurs centaines de pages avec l'assistance d'un traducteur logiciel. C'est vraiment au bout de plusieurs mois que j'ai pris l'habitude de faire des phrases simples assorties d'un vocabulaire personnel que j'ai progressivement injecté dans le logiciel qui est fait pour cela. Il s'agit donc bien d'un apprentissage mutuel, l'utilisateur se conformant à l'ergonomie du logiciel, et le logiciel intégrant progressivement les habitudes et le vocabulaire spécialisé de l'utilisateur. Les débats péremptoires sur la traduction en ligne que je lis régulièrement ne tiennent aucun compte des gains énormes de productivité que j'ai pu réaliser dans l'émission de ces rapports pour lesquelles je suis payé. Je n'ai eu aucune réflexion désagréable des destinataires du rapport. Il est bien entendu que la taduction qui est proposée est systématiquement corrigée tout en affinant parallèlement et systématiquement mon dictionnaire personnel. Ceci me fait penser, dans un tout autre domaine quoique, à la dictée vocale au moyen de laquelle je viens de rédiger ce petit texte en effectuant simplement quatre corrections à la main et qui, elle aussi, m'apporte des gains de productivités monumentaux sans lesquelles je passerai mes week-ends à cultiver la tendinite que j'ai acquise au bras droit à force de taper sur un clavier en dehors de mes heures de travail. Si nous étions assez malins pour partager les dictionnaires et collaborer à la mise en place de dictionnaire par domaines spécialisés, les traducteurs automatiques progresseraient à pas de géant. Je souhaite ainsi encourager tous ceux qui sont rebutés par les dissections intellectuelles des utilisateurs très occasionnels. L'important est dans la pratique.

07 avril, 2007 20:14  
Anonymous Anonyme a écrit...

je trouve que parfois la tracduction n'est pas toujours approprié.

20 mai, 2007 13:58  
Anonymous Anonyme a écrit...

Pour en revenir à la guerre Systran/ reverso, Free a beaucoup perdu en crédibilité en passant de Réverso à Systran. Là où je pouvais traduire un courrier entier, il faut avec Systran le couper en "X" morceaux. De plus, le résultat s'efface rapidement. Systran, aucun intérêt pour une traduction rapide et simple.
D'autre part, je cherche partout une traduction Franco/ Polonaise. Je trouve du chinois partout, mais pas de Polonais. Otez-moi un doute :la Pologne, c'est bien en Europe?
C. LABBE

30 novembre, 2007 18:22  
Anonymous Anonyme a écrit...

En tant que traducteur professionnel, je trouve que la gueguerre est un peu anticipée.
Il faut savoir qu'à ce jour, en juillet 2008, AUCUN éditeur de logiciel de traduction n'est capable de réaliser quelque chose de correct. Les dépôts de brevets se multiplient et chacun amène sa propre pierre, mais on n'empêchera pas un système même heuristique de chercher la traduction avec les premiers termes qu'il va trouver dans le dictionnaire.
De plus, par exemple, l'anglais est une langue subtile :
Quelle est la définition de "number", de "array", de "device" etc. si le contexte n'est pas présent.
Pour revenir aux brevets dont je connais un peu le contenu (1400 traduits à ce jour), ils deviennent de plus en plus compliqués sur ce sujet. Cela veut donc dire que les applications seront de plus en plus incompréhensibles pour les néophytes qui vont perdre de plus en plus de temps à comprendre le logiciel proposé qu'à faire traduire réellement leur texte (à moins qu'ils connaissent la langue source et puissent faire leurs corrections.

03 juillet, 2008 14:25  
Blogger Jean Véronis a écrit...

Anonyme> Nous sommes bien d'accord. Aucun logiciel de traduction ne peut rivaliser avec le plus mauvais des traducteurs humains.

Mais là n'est pas le but à mon avis. Les logiciels de traductions me semblent utiles pour certaines tâches, par exemple pour déchiffrer rapidement des informations dans d'autres langues (sur le Web par exemple), là où il serait impossible, trop lent, trop coûteux de faire appel à des traducteurs humains (par exemple pour des particuliers qui surfent sur le Web, ou même des cadres d'entreprises qui font de la veille quotidienne). C'est à peu près le niveau qu'on les traducteurs automatiques aujourd'hui : permettre le déchiffrage des grandes lignes et de la thématique d'un texte. C'est déjà beaucoup.

03 juillet, 2008 15:09  
Anonymous Anonyme a écrit...

Un logiciel de traduction ne comprend pas le document et ne saura pas traduire à coup sûr un mot hors de son contexte. En revanche, il peut avoir un vocabulaire technique largement plus étendu que celui du meilleur traducteur humain.

Aujourd'hui Reverso offre plus de 6 langues d'interface et plus de 20 directions de traduction en ligne.

Il est complété par des dictionnaires en ligne gratuits, un outil de conjugaison, une grammaire. Il ne faut pas hésiter à revisiter Reverso.net et y laisser vos commentaires, suggestions... qui sont toujours prises en compte lorsqu'elles sont réalistes.

06 octobre, 2008 23:01  
Anonymous Anthony a écrit...

Je trouve que les traducteurs automatiques progressent énormément depuis une poignée d'années. Pour ceux qui s'en servent à titre personnel, c'est très utile. Par contre pour les entreprises, il faut claiement continuer à faire appel à des pros.

30 avril, 2010 04:00  
Anonymous Kévin a écrit...

Merci pour toutes vos merveilleuses explications !! Vous êtes vraiment un prof génial !!! J'aimerais vous avoir comme prof... Un grand MERCI et un grand BRAVO à vous ! Cordialement.

18 août, 2010 14:42  

Enregistrer un commentaire