Israël - Intelligence artificielle (IA)

Une IA traduit la langue la plus ancienne du monde

Par Louise Wagon · lejournaldesarts.fr

Le 29 juillet 2023 - 595 mots

ISRAËL

Des ingénieurs ont créé une Intelligence artificielle pouvant traduire des fragments de textes akkadiens vieux de 5 000 ans. 

Intelligence artificielle, Circuit imprimé, Vagues. © PGerd Altmann Pixabay License
Intelligence artificielle, Circuit.

Des scientifiques ont développé un programme informatique capable de traduire en anglais un texte en akkadien cunéiforme, une langue ancienne parlée en Mésopotamie (l’actuel Irak) à partir du IIIe millénaire avant J.-C. Le programme fonctionne comme Google Traduction et permet de traduire « instantanément » en anglais, un texte numérisé en akkadien. Cependant, sa fiabilité n’est pas toujours garantie.

L’akkadien, comme le sumérien, est une langue écrite avec des signes cunéiformes, que l’on a retrouvée gravée sur des centaines de milliers de tablettes d’argile, découvertes par les archéologues au cours des 200 dernières années. Peu de tablettes ont été traduites, en raison du peu d’experts capables de lire la langue et de sa complexité. L’akkadien est une langue « polyvalente », dont les signes cunéiformes peuvent avoir plusieurs lectures différentes selon le contexte. 

Cette difficulté entraîne un processus de traduction en deux étapes. D’abord, il faut associer chaque signe à une consonance de notre langue actuelle, dans un processus appelé translittération, comme on le ferait pour transformer l’alphabet grec en alphabet latin. Ensuite, il faut traduire l’ensemble dans une langue moderne. Ce travail est chronophage, laborieux et complexe. 

Pour simplifier ce processus, des chercheurs et linguistes des universités de Tel Aviv (TAU) et Ariel ont créé un programme d’intelligence artificielle (IA) capable de traduire l’akkadien cunéiforme vers l’anglais. Les résultats ont été publiés en mai dans la revue scientifique PNAS Nexus  et leurs recherches sont disponibles sur GitHub, à Akkademia. 

Ce logiciel d’intelligence artificielle utilise la même technique que celle utilisée par Google Traduction, à savoir des réseaux de neurones artificiels. L’équipe de chercheurs a formé le modèle d’IA avec un corpus de textes cunéiformes déjà bien étudiés et annotés. Ensuite, le logiciel a été entraîné à faire deux choses : passer de l’akkadien cunéiforme en alphabet latin – avec une précision de 97 % pour cette translittération – et traduire directement l’akkadien vers l’anglais – une traduction « raisonnable », mais parfois entachée d’erreurs.

Pour la traduction directe de l’akkadien vers l’anglais, le modèle d’IA a excellé dans la traduction de textes comportant jusqu’à 118 caractères et de documents tels que des décrets royaux ou des prophéties. En revanche, le programme a rencontré plus de difficultés avec des textes poétiques et littéraires, qui nécessitent plus de « nuances », générant alors des « hallucinations », c’est-à-dire des phrases en anglais grammaticalement correctes, mais sans rapport avec le texte original en akkadien. 

Le modèle d’IA a été évalué avec Understudy 4 (BLEU4), un algorithme qui mesure l’exactitude et la précision des traductions réalisées par des machines. Pour son test de translittération en anglais, le modèle d’IA a obtenu 37,47, tandis que la traduction cunéiforme/anglais a obtenu le score de 36,52. Deux scores supérieurs dans la fourchette d’une traduction de « haute qualité »

L’étude souligne également la surprise des chercheurs qui ont observé que le programme de traduction est capable de capturer le style ou le rythme des différents genres de textes, permettant aux chercheurs de déterminer – sur la base du style de la traduction – s’il s’agissait d’un document juridique conventionnel, d’un écrit astrologique ou d’une lettre rédigée par un érudit.

L’akkadien est la langue de la plus ancienne civilisation connue, la Mésopotamie. Elle a commencé à être parlée vers 3 000 avant J.-C. Contrairement aux Égyptiens, il s’agissait de pictogrammes de formes pointues, tracés à l’aide d’une pointe de roseau appelée un calame. Au fil du temps, l’akkadien s’est fractionné en dialectes assyriens et babyloniens, avant d’être supplantée par l’araméen au début du premier millénaire avant notre ère. Aucune langue actuelle ne descend de l’akkadien. 

Tous les articles dans Patrimoine

Le Journal des Arts.fr

Inscription newsletter

Recevez quotidiennement l'essentiel de l'actualité de l'art et de son marché.

En kiosque