Une ancienne énigme grammaticale résolue après 2 500 ans

Une equipe de recherche internationale cree des composes azotes jusque la

Un problème grammatical qui a vaincu les érudits sanskrits depuis le 5ème siècle avant JC a finalement été résolu par un docteur indien. étudiant à l’Université de Cambridge. Rishi Rajpopat a fait la percée en décodant une règle enseignée par « le père de la linguistique », Pāṇini.

Cette découverte permet de « dériver » n’importe quel mot sanskrit – de construire des millions de mots grammaticalement corrects, y compris « mantra » et « gourou » – en utilisant la « machine à langage » vénérée de Pāṇini, qui est largement considérée comme l’une des grandes réalisations intellectuelles en l’histoire.

D’éminents experts sanskrits ont décrit la découverte de Rajpopat comme « révolutionnaire » et cela pourrait maintenant signifier que la grammaire de Pāṇini peut être enseignée aux ordinateurs pour la première fois.

Pendant ses recherches de doctorat. thèse, publiée aujourd’hui, le Dr Rajpopat a décodé un algorithme vieux de 2 500 ans qui permet, pour la première fois, d’utiliser avec précision la « machine à langage » de Pāṇini.

Le système de Pāṇini – 4 000 règles détaillées dans son plus grand ouvrage, l’ Aṣṭādhyāyī , qui aurait été écrit vers 500 avant JC – est censé fonctionner comme une machine : introduisez la base et le suffixe d’un mot et cela devrait les transformer en grammaticalement correct mots et phrases à travers un processus étape par étape.

Jusqu’à présent, cependant, il y avait un gros problème. Souvent, deux règles de Pāṇini ou plus sont applicables simultanément à la même étape, laissant les érudits se demander laquelle choisir.

Résoudre les soi-disant « conflits de règles », qui affectent des millions de mots sanskrits, y compris certaines formes de « mantra » et de « gourou », nécessite un algorithme. Pāṇini a enseigné une métarule pour nous aider à décider quelle règle doit être appliquée en cas de « conflit de règles », mais au cours des 2 500 dernières années, les chercheurs ont mal interprété cette métarule, ce qui signifie qu’ils se sont souvent retrouvés avec un résultat grammaticalement incorrect.

Pour tenter de résoudre ce problème, de nombreux chercheurs ont laborieusement développé des centaines d’autres métarègles, mais le Dr Rajpopat montre qu’elles ne sont pas seulement incapables de résoudre le problème en question – elles ont toutes produit trop d’exceptions – mais aussi complètement inutiles. Rajpopat montre que la « machine linguistique » de Pāṇini est autosuffisante.

Rajpopat a déclaré: « Pāṇini avait un esprit extraordinaire et il a construit une machine sans égal dans l’histoire humaine. Il ne s’attendait pas à ce que nous ajoutions de nouvelles idées à ses règles. Plus nous tripotons la grammaire de Pāṇini, plus elle nous échappe. »

Traditionnellement, les érudits ont interprété la métarule de Pāṇini comme signifiant qu’en cas de conflit entre deux règles de force égale, la règle qui vient plus tard dans l’ordre sériel de la grammaire l’emporte.

Rajpopat rejette cela, arguant à la place que Pāṇini voulait dire qu’entre les règles applicables respectivement aux côtés gauche et droit d’un mot, Pāṇini voulait que nous choisissions la règle applicable au côté droit. En utilisant cette interprétation, Rajpopat a découvert que la machine à langage de Pāṇini produisait des mots grammaticalement corrects sans presque aucune exception.

Prenez « mantra » et « gourou » comme exemples. Dans la phrase « Devāḥ prasannāḥ mantraiḥ » (« Les dieux [devāḥ] sont satisfaits [prasannāḥ] par les mantras [mantraiḥ] ») nous rencontrons un « conflit de règles » lors de la dérivation du mantraiḥ « par les mantras. » La dérivation commence par « mantra + bhis. » Une règle est applicable à la partie gauche, « mantra' », et l’autre à la partie droite, « bhis ».  » Nous devons choisir la règle applicable à la partie droite,  » bhis « , qui nous donne la forme correcte,  » mantraiḥ « .

Dans la phrase « Jñānaṁ dīyate guruṇā » (« Connaissance [jñānaṁ] est donnée [dīyate] par le gourou [guruṇā] ») nous rencontrons un conflit de règles lors de la dérivation de guruṇā « par le gourou ». La dérivation commence par « guru + ā. » Une règle est applicable à la partie gauche, « guru » et l’autre à la partie droite. « ā ». Nous devons choisir la règle applicable à la partie droite, « ā », qui nous donne la forme correcte, « guruṇā ».

Moment Eurêka

Six mois avant que Rajpopat ne fasse sa découverte, son superviseur à Cambridge, Vincenzo Vergiani, professeur de sanskrit, lui a donné un conseil prémonitoire : « Si la solution est compliquée, vous vous trompez probablement. »

Rajpopat a déclaré: « J’ai eu un moment d’eureka à Cambridge. Après 9 mois à essayer de résoudre ce problème, j’étais presque prêt à arrêter, je n’allais nulle part. Alors j’ai fermé les livres pendant un mois et j’ai juste profité de l’été, nager, faire du vélo , cuisiner, prier et méditer. Puis, à contrecœur, je suis retourné au travail, et en quelques minutes, alors que je tournais les pages, ces modèles ont commencé à émerger, et tout a commencé à avoir un sens. Il y avait encore beaucoup de travail à faire, mais je’ j’ai trouvé la plus grande partie du puzzle. »

« Au cours des semaines suivantes, j’étais tellement excité que je ne pouvais pas dormir et que je passais des heures à la bibliothèque, y compris au milieu de la nuit, pour vérifier ce que j’avais trouvé et résoudre les problèmes connexes. Ce travail a pris encore deux ans et demi années. »

Importance

Le professeur Vincenzo Vergiani a déclaré : « Mon élève Rishi a réussi à le résoudre – il a trouvé une solution extraordinairement élégante à un problème qui a laissé perplexe les chercheurs pendant des siècles. Cette découverte va révolutionner l’étude du sanskrit à une époque où l’intérêt pour la langue est en hausse. . »

Le sanskrit est une langue indo-européenne ancienne et classique d’Asie du Sud. C’est la langue sacrée de l’hindouisme, mais aussi le moyen par lequel une grande partie de la plus grande science, philosophie, poésie et autre littérature profane de l’Inde a été communiquée pendant des siècles. Bien qu’il ne soit parlé en Inde que par environ 25 000 personnes aujourd’hui, le sanskrit a une importance politique croissante en Inde et a influencé de nombreuses autres langues et cultures à travers le monde.

Rajpopat a déclaré: « Certaines des sagesses les plus anciennes de l’Inde ont été produites en sanskrit et nous ne comprenons toujours pas pleinement ce que nos ancêtres ont accompli. Nous avons souvent été amenés à croire que nous ne sommes pas importants, que nous n’avons pas J’espère que cette découverte insufflera aux étudiants indiens la confiance, la fierté et l’espoir qu’eux aussi pourront accomplir de grandes choses.

Une implication majeure de la découverte du Dr Rajpopat est que maintenant que nous avons l’algorithme qui exécute la grammaire de Pāṇini, nous pourrions potentiellement enseigner cette grammaire aux ordinateurs.

Rajpopat a déclaré: « Les informaticiens travaillant sur le traitement du langage naturel ont abandonné les approches basées sur des règles il y a plus de 50 ans … Donc, enseigner aux ordinateurs comment combiner l’intention du locuteur avec la grammaire basée sur des règles de Pāṇini pour produire la parole humaine serait une étape majeure dans l’histoire de l’interaction humaine avec les machines, ainsi que dans l’histoire intellectuelle de l’Inde. »

La recherche est publiée dans la revue Apollo – Dépôt de l’Université de Cambridge.

Plus d’information:
Rishi Rajpopat, In Pāṇini We Trust: Discovering the Algorithm for Rule Conflict Resolution in the Aṣṭādhyāyī, Apollo – Dépôt de l’Université de Cambridge (2022). DOI : 10.17863/cam.80099

Fourni par l’Université de Cambridge

ph-tech