Pas encore un match parfait

Des chercheurs utilisent un ordinateur quantique pour identifier un candidat

: De plus en plus d’articles paraissent sur les possibilités offertes par l’intelligence artificielle pour rechercher des documents dans les écritures les plus anciennes, depuis la traduction de textes anciens jusqu’au remplissage des parties manquantes de tablettes d’argile. Mais vaut-il mieux laisser désormais aux ordinateurs le déchiffrement des textes anciens ?

Le professeur associé Alwin Kloekhorst, spécialiste du hittite, n’est pas convaincu. « Cet été, les médias ont appris que l’IA pouvait scanner des tablettes d’argile et les traduire immédiatement. Je ne peux pas vraiment imaginer que cela soit vrai », dit-il. « Le hittite est écrit en cunéiforme, et quand vous voyez des textes en hittite, ils semblent être écrits avec de très jolis caractères droits, mais en pratique, ce sont des gravures 3D. Cela rend très difficile leur numérisation et leur reconnaissance par un ordinateur.  »

De plus, les 30 000 fragments de textes hittites qui ont survécu sont en réalité trop peu nombreux pour entraîner correctement un ordinateur à traduire le hittite, pense Kloekhorst. « Si vous tapez tous les fragments de tablettes d’argile, vous vous retrouvez avec environ trois mille A4. Il est difficile de faire fonctionner un système avec ceux-ci, notamment parce que des parties importantes des fragments manquent parfois. Vous voyez également que les chercheurs qui qui y travaillent actuellement ont souvent de faibles pourcentages de fiabilité pouvant atteindre 70 %. »

Comparaison plus rapide

Même si les ordinateurs ne peuvent pas pour l’instant prendre le relais du travail de Kloekhorst, il voit des opportunités pour l’IA dans d’autres domaines. « Il y a quinze jours, des chercheurs allemands ont mis en ligne un corpus numérique de tous les textes existants en hittite. J’en suis très heureux, car le fait que cela n’existait pas auparavant a laissé une énorme lacune dans notre domaine. »

Entre autres choses, cette évolution facilite l’analyse statistique des textes. « En hittite, l’orthographe n’est pas complètement figée », explique Kloekhorst. « Si vous disposez du corpus sous forme numérique, vous pouvez comparer l’orthographe utilisée à chaque endroit beaucoup plus rapidement que si vous deviez vous rendre à la bibliothèque à chaque fois pour rechercher la transcription d’une tablette d’argile. »

Des contrôles humains

C’est pourquoi des investissements considérables ont déjà été réalisés ces dernières années dans la numérisation des tablettes d’argile. « Il reste peut-être relativement peu de choses du hittite, mais nous disposons peut-être d’un demi-million de tablettes dans d’autres langues anciennes », explique Kloekhorst. « Certains d’entre eux s’effondrent désormais dans les dépôts des musées. Avec un nouveau scanner 3D, nous pouvons les numériser. C’est incroyablement cool, également parce qu’en tant que scientifique, vous pouvez travailler de manière beaucoup plus ciblée en vous concentrant immédiatement sur le texte lui-même, sans tout le travail manuel de collecte de données. Il y a même eu des tentatives pour scanner des tablettes d’argile à l’intérieur d’enveloppes d’argile.

Et peut-être, espère Kloekhorst, que dans quelques années l’IA pourrait alors réellement aider à déchiffrer le contenu de ces tablettes numérisées. « Peut-être qu’un ordinateur peut analyser quels fragments vont ensemble en comparant les lignes de rupture des tablettes », réfléchit-il. « Cela aiderait énormément, même si je pense que nous continuerons à avoir besoin d’êtres humains pour vérifier les résultats. »

Fourni par l’Université de Leiden

ph-tech