Journée internationale de la langue maternelle

Journee internationale de la langue maternelle

L’Académie de la langue aragonaise maintient son travail souterrain Dans un contexte politique qui ne semble pas être très pour le travail dans les célébrations de la Journée de la langue maternelle. L’institution, en œil sur la révolution numérique de l’algorithme, fonctionne depuis novembre avec le Fondation Mozilla Pour créer un corpus parallèle parallèle-Voz dans les aragonés qui inclut toutes les variétés aragonais. Le directeur de l’institution, Juan Pablo Martínez, souligne que cet ensemble de données « contribuera à renforcer La présence numérique d’Aragonais dans les technologies basées en interaction avec les machines et l’intelligence artificielle (AI) ».

Le projet est inclus dans l’initiative Voix commune, qui cherche à créer un corpus ouvert d’enregistrements vocaux dans plusieurs langues. Cet corpus ou ensemble de données est nécessaire pour développer des outils numériques tels que les assistants virtuels (type Siri), RÉconomie de la voix (Pour pouvoir dicter ou prendre des notes automatiques d’un discours ou d’une réunion, ou de faire des sous-titres automatiques), des synthétiseurs vocaux (afin que les machines génèrent des textes vocaux ou lus) et même des traducteurs qui Ils travaillent directement de la voix.

Ce travail vise à améliorer la présence du langage dans les réseaux. En fait, ils expliquent, Bien que l’Aragonais ait des outils technologiquesceux-ci sont ancrés dans les structures du passé. À l’heure actuelle, le plus moderne, basé sur l’apprentissage en profondeur (ce que nous appelons généralement l’intelligence artificielle) nécessite l’existence de données qui peuvent être utilisées pour former ces modèles ou s’adapter à l’Aragonais modèles qui fonctionnent actuellement Avec d’autres langues.

Le réseau social bluesky apprend également à Charr

Ce n’est pas la première collaboration de l’Académie aragonaise de la langue (AAA) dans le domaine des technologies pour l’Aragonais. Au cours de la dernière année, l’Académie a collaboré avec deux équipes de l’Université d’Alacant et de l’Université d’Oberta de Catalogne dans la préparation d’un ensemble de données pour former et évaluer les avantages automatiques des traducteurs. Avec ces données, une compétition scientifique a été organisée, pour encourager les équipes de recherche du monde entier à développer des traducteurs automatiques entre l’espagnol et trois langues ibériennes avec peu de ressources (aragonais, aranés et asturiens). Les résultats et les conclusions de la compétition ont été présentés en novembre 2024 à Miami, lors des prestigieuses méthodes du Congrès empirique dans le traitement du langage naturel.

De plus, ces dernières semaines, de nombreux utilisateurs du réseau social X vont au réseau Bluesky. De nombreux nouveaux utilisateurs de ce réseau social de mode ont été surpris que le logiciel permette à l’Aragonais d’être sélectionné comme langue de l’application, date à laquelle tous les menus et textes du logiciel apparaissent dans Aragon.

Dans la première phase du projet, de novembre à la mi-janvier, il a été collecté Un corpus textuel de 10 000 phrases Dans toutes les variétés aragonais que les locuteurs liront plus tard. Les phrases entrées dans la base de données, une fois validées par au moins deux utilisateurs, seront publiées à la fin du projet.

Par conséquent, selon Martínez, en plus des phrases que tout utilisateur peut télécharger sur la plate-forme, une vidange de certaines œuvres des auteurs décédés a été faite il y a plus de 80 ans, comme les comédies en aragones C celles de Domingo Miral ou les histoires Dans les histoires en aragonais Ribagorzano de Dámaso Carrera, ainsi que des œuvres attribuées par des auteurs contemporains tels que Elena Worm, Marta Marín, Juan Carlos Marco, Feliciano González, José María Satué, Manuel Castán, ainsi que des universitaires tels que Chabier Lozano, Fernando Blas ou Fernando Romans. D’autres auteurs ont également exprimé leur intérêt et ont donné la permission d’utiliser leurs travaux et seront incorporés dans les extensions futures.

La deuxième phase du projet est en cours depuis le milieu de janvier et ici la collaboration des orateurs est nécessaire. C’est pourquoi l’Académie exige que les participants volontaires« Plus, mieux c’est »enregistrez certaines de ces phrases avec un mobile, une tablette ou un ordinateur. « L’objectif est d’avoir une collection d’audio aussi large et variée que possible, avec la participation de bénévoles de toutes les gammes d’âge, le sexe et aussi de toutes les variétés de l’aragonais, également de la neo-sing », explique Martínez. Ceci est important pour que les machines apprennent à comprendre tous les accents et les prononciations possibles qui se produisent dans Aragon, les deux parmi ceux qui l’ont comme langue maternelle Comme ceux qui l’ont appris des adultes.

Pour ce faire, l’Académie a lancé une campagne sur les réseaux sociaux pour rechercher la collaboration des conférenciers de l’ensemble du territoire. Cette campagne a connu un grand succèscar en moins d’un mois depuis ses débuts, 12 heures d’audio ont été réalisées, enregistrées par 36 conférenciers (dans la planification qui avait été effectuée à l’Académie, il devait atteindre 10 heures fin mars). Les orateurs ont participé de 18 à 84 ans et toutes les variétés de l’Aragonais.

«Chacun participe à son rythme et peut le faire à tout moment, chaque fois qu’il a une connexion Internet, il y a ceux qui ont participé en lisant une cinquante phrases une seule fois, tandis que d’autres utilisateurs ont plus de mille phrases, ou se connectent à Lisez des phrases presque tous les jours », dit-il. Martínez se souvient que pour le momentde nombreuses technologies basées sur l’intelligence artificielle de So-Salled ne fonctionnent que bien dans les grandes langues et que l’enregistrement de ces voix contribue « à renforcer l’avenir numérique de l’aragonais ».

L’établissement universitaire prévoit de dépasser 20 heures en mars, qui publiera la première version de l’ensemble de données déjà dans ce premier semestre. Cependant, le projet restera indéfiniment ouvert à la participation de quiconque veut contribuer sa voix ou apporter des phrases à lire.

La mise en œuvre numérique des ressources dans Aragon aura son impact sur la société. Dans le cours en cours, selon les données du ministère de l’Éducation de la DGA, 649 étudiants apprennent les aragonses. Jusqu’à 3 564 font de même avec le catalan. De l’exécutif autonome, bien que seulement 50 000 euros aient été dédiés dans le budget de 2024 et les modalités linguistiques d’Aragon, conformément aux dispositions du statut d’autonomie »

fr-03