Jean Véronis
Aix-en-Provence
(France)


Se connecter à moi sur LinkedIn Me suivre sur Twitter Facebook RSS

mercredi, décembre 08, 2004

Document: Reconnaissance de l'écriture manuscrite

Dans un numéro spécial de La Recherche de 1986 sur l'Intelligence Artificielle, un article entier était consacré à la reconnaissance de l'écriture manuscrite. Le problème apparaissait déjà comme difficile, et la situation n'a guère changé, bien que les recherches sur le sujet se soient faites beaucoup plus clairsemées. La saisie sur tablette graphique a beaucoup progressé, mais elle nécessite encore un jeu de signes particulier, ou, sinon, un grand soin dans la formation des lettres (toubibs, évitez !). La reconnaissance en différé, de documents écrits tout bonnement à l'encre sur du papier, est bien plus délicate, puisqu'une information importante manque, celle de la dynamique du tracé. Il ne reste que l'image finale, qu'il faut analyser. Pour l'instant, la technique est surtout appliquée, avec un bon taux de réussite, aux codes postaux ou aux chèques bancaires. Le projet de l'Université du Massachussets Amherst est donc ambitieux. Il ne s'agit pas moins que de numériser les 140 000 pages des écrits de George Washington, conservés à la librairie du Congrès. La presse a largement relayé la dépêche du service de presse de l'université (voir par exemple ici). Comme trop souvent, toute prudence est oubliée et le problème est présenté comme résolu : il y a même une démonstration en ligne ! Cette démonstration est d'ailleurs très intéressante : on peut interroger un échantillon de 1000 pages en direct, et c'est une visite à conseiller à nos étudiants. En lisant plus en détail les travaux des chercheurs du projet (par exemple leur papier à ACM SIGIR'2004), on s'aperçoit cependant que les résultats sont encore modestes. Sur l'échantillon de 1000 pages, ils obtiennent un taux de précision de 40 à 50%, ce qui est honnête dans l'état actuel des choses, mais guère plus. La méthode est intéressante, en tous cas, et c'est de la bonne recherche. L'Université du Massachussets Amherst aurait simplement pu mentionner les performances dans sa dépêche. Mais il est vrai que cela aurait eu sans doute moins d'effet auprès des trustees et autres bailleurs de fonds...

0 Commentaires:

Enregistrer un commentaire