Traduzione aumentata

La quête du langage universel

Le 17 juillet, c'est la journée mondiale des émojis. Cette année, je n'ai pas pu m'empêcher de penser que les emoji sont ce langage universel tant recherché par les êtres humains. Dernièrement, cette quête éternelle a donné vie au traitement automatique du langage et à la traduction automatique, que les chercheurs essaient d'améliorer depuis plus de 50 ans. Dans cet article, je partage un extrait d'un des premiers chapitres du Guide de la traduction automatique et de la post-édition qui fait référence à cette quête éternelle.


L'Éternel Dieu forma de la terre tous les animaux des champs et tous les oiseaux du ciel, et il les fit venir vers l'homme, pour voir comment il les appellerait, et afin que tout être vivant portât le nom que lui donnerait l’homme. (Genèse 2:19)

Dans l’Europe du 17e siècle, plusieurs intellectuels à la recherche de la signification du langage croyaient que celui-ci avait été créé par Adam au jardin d’Éden, et associaient cette création à la perfection d’un langage commun et universel. Toutefois, les intellectuels les plus notables considéraient que cette perfection avait été perdue avec la Tour de Babel.

Toute la terre avait alors la même langue et les mêmes mots. Ils dirent : « Allons ! bâtissons-nous une ville, avec une tour dont le sommet soit dans les cieux. Faisons-nous un nom, pour ne pas être disséminés sur toute la surface de la terre. » Le Seigneur descendit pour voir la ville et la tour que les hommes avaient bâties. Et le Seigneur dit : « Ils sont un seul peuple, ils ont tous la même langue : s’ils commencent ainsi, rien ne les empêchera désormais de faire tout ce qu’ils décideront. Allons ! descendons, et là, embrouillons leur langue : qu’ils ne se comprennent plus les uns les autres. » De là, le Seigneur les dispersa sur toute la surface de la terre. Ils cessèrent donc de bâtir la ville. C’est pourquoi on l’appela Babel, car c’est là que le Seigneur embrouilla la langue des habitants de toute la terre ; et c’est de là qu’il les dispersa sur toute la surface de la terre. (Genèse 11:1,4-9)

Dans ce contexte, plusieurs grands penseurs voulurent retrouver une langue universelle qui pourrait remplacer celle d’Adam. Ils commencèrent à envisager une langue basée sur un concept unique d’écriture qui utiliserait des symboles pour représenter des choses ou des notions, plutôt que des lettres ou des mots, exactement comme les caractères chinois. Nombreuses furent les propositions de langage universel, mais aucune ne vit le jour, car l’association parfaite d’une notion à un mot unique est, en elle-même, limitée par les imperfections des nuances d’une langue.


Néanmoins, cette exploration sémiotique a jeté les fondements des futures structures sémantiques, où tout schéma linguistique se base sur un certain ordre : les tableaux ou les taxonomies des langages universels représentent un aspect crucial de la création d’un langage universel. Au 20e siècle, nous constatons que les tentatives d'élaboration d'une interlingua pratique pour les systèmes de traduction automatique sont étroitement liées aux efforts de création d'un langage universel datant du 17e siècle.


[...]


Le mémorandum de Warren Weaver

Inspiré par le succès du déchiffrement des codes pendant la Seconde Guerre mondiale et par les avancées récentes en théorie de l'information, Warren Weaver, un des pionniers de la traduction automatique, rédige un mémorandum intitulé tout simplement « Traduction », qui suggère la possibilité d’utiliser les ordinateurs électroniques modernes pour faire de la traduction. Weaver reconnaît que la traduction mécanique de textes littéraires peut être trop difficile, mais qu’une traduction automatique basique pourrait toujours être utile pour les documents techniques. Weaver conclut son mémorandum par une comparaison du langage humain à une « série de tours fermées, toutes érigées sur une fondation commune », d'où les personnes pourraient descendre vers un sous-sol commun, où la communication serait plus facile ; cette image sert d'analogie aux approches de traduction qui utilisent la sémantique profonde et les principes linguistiques universels. Cet appel au « socle commun de la communication humaine » utilisant « le langage universel réel mais non encore découvert » est très semblable à la recherche d’un langage universel du 17e siècle. Warren espère que son mémorandum encouragera les personnes dotées des techniques et des connaissances nécessaires à en faire quelque chose. Deux ans après sa publication, quatre groupes de chercheurs au Royaume-Uni et aux États-Unis débutent les premières recherches sur la traduction automatique (TA).


[...]


Une décennie d’optimisme

C’est ainsi qu'a été décrite la période suivant cette première conférence sur la traduction automatique. Grâce aux avancées technologiques, de nombreux chercheurs s'attendaient à des progrès substantiels dans un laps de temps relativement court.

En 1954, le public assiste au Georgetown Experiment, première démonstration de traduction automatique réalisée par un système utilisant un ensemble de règles artisanales et un vocabulaire réduit afin de traduire un ensemble de phrases du russe à l’anglais. La presse considère cette expérience comme une réussite et les fonds pour la recherche augmentent aux États-Unis. Un peu plus tard cette même année, le premier titre de Docteur en traduction automatique est attribué et 1955 marque la publication du premier livre sur la traduction automatique regroupant toutes les recherches et présentations existantes, mais aussi de nouvelles publications. Tous les chercheurs sont désormais engagés dans l'érection d'une nouvelle tour d’Anti-Babel.


[...]


Vers la fin des années 1960, les approches principales de la traduction automatique se basent sur le triangle de Vauquois, qui décrit un processus de traduction automatique divisé en trois phases : l’analyse du texte source, le transfert et la génération du texte cible. Au niveau informatique, l’interprétation du triangle de Vauquois a donné naissance à trois méthodes de traduction automatique à base de règles adoptées jusqu’au début du 21e siècle, c’est-à-dire le transfert direct, l’analyse-transfert-génération et l’interlingua. Ce n'est que plus tard que seront proposées des méthodes alternatives basées sur l’analyse automatique de corpus pour arriver enfin à l’actuelle « traduction automatique neuronale » et à l’« apprentissage profond ».

Città

Lione, Francia

Contatto / Collaborazione

Social

  • LinkedIn
  • YouTube
  • Twitter
  • Strava

© 2020, Enrico Antonio Mion – Mentions Légales