La traduction automatique pourrait rendre la science uniquement en anglais accessible à tous

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Alors qu’il était encore au lycée, Xinyi Liu a travaillé brièvement dans un laboratoire de l’Université Beihang à Pékin et a été surpris de voir des chercheurs chinois utiliser régulièrement Google Traduction pour générer le premier brouillon d’articles scientifiques en anglais. La traduction est indispensable si les scientifiques veulent soumettre des articles à des revues de haut niveau, presque toutes en anglais.

« Il était normal que les post-doctorants utilisent simplement Google Traduction pour d’abord tout traduire, puis pour le modifier et le peaufiner. Mais après la première traduction, tout l’article n’avait plus de sens », a déclaré Liu, un jeune étudiant à l’Université de Californie. , Berkeley, qui se spécialise en biologie moléculaire et cellulaire. « Littéralement, tous les mots, tous les termes ont été collés ensemble juste au hasard. »

Il devait y avoir un meilleur moyen, pensa-t-elle.

Ainsi, l’année dernière, lorsqu’elle a vu un nouveau séminaire donné par Rebecca Tarvin sur la suppression des barrières linguistiques en sciences, elle s’est inscrite.

Cette classe, qui sera enseignée à l’UC Berkeley pour la troisième fois au printemps 2023, était un ballon d’essai pour Tarvin, professeur adjoint de biologie intégrative. Avec un intérêt renouvelé à l’échelle du campus pour la diversité, l’équité et l’inclusion, elle et des groupes de travail au sein de son département ont pensé que la classe pourrait aider l’UC Berkeley à résoudre un problème scientifique de longue date : l’anglais, la langue dominante de la science, est un obstacle majeur à scientifiques dont la langue maternelle n’est pas l’anglais.

Les étudiants et les scientifiques étrangers ne sont pas les seuls à être désavantagés lorsque la science est communiquée principalement en anglais. Il en va de même pour de nombreux étudiants nés aux États-Unis. À l’automne 2020, environ 40% des étudiants de première année à l’UC Berkeley étaient des étudiants de première génération, et dans le système de 10 campus de l’Université de Californie, 39% des étudiants de première génération ont grandi avec une langue autre que l’anglais comme première langue.

« Beaucoup de nos étudiants de Californie ont grandi en traduisant pour leurs parents », a déclaré Tarvin. « La traduction fait partie de leur vie depuis qu’ils sont très jeunes. »

Pour Tarvin, le cours – Briser les barrières linguistiques dans l’évolution et l’écologie – était une « opportunité à la fois d’enseigner aux étudiants des compétences en littératie en traduction et d’encourager les étudiants à être des militants dans ce domaine du changement structurel. Et en fait, j’ai vu un réception vraiment positive de ce type d’activisme de la part des étudiants, car ils semblent tous convenir qu’il est vraiment important de surmonter les barrières linguistiques après avoir suivi le cours. »

La classe a conduit Tarvin et certains étudiants diplômés de l’UC Berkeley, ainsi que des collaborateurs au Canada, en Israël et en Hongrie, à rédiger un article scientifique évaluant de nouveaux outils de traduction automatique pouvant être utilisés par des personnes du monde entier pour rendre leurs articles scientifiques accessibles aux non-anglophones. . L’article est paru en ligne ce mois-ci dans la revue Bioscience. Les traductions en espagnol, français, portugais et hongrois, les langues des co-auteurs, sont également en ligne.

« L’idée ici est que nous essayons de donner aux gens les outils et la motivation nécessaires pour traduire leurs propres recherches scientifiques », a déclaré Tarvin. « La science n’a pas besoin d’être basée sur une seule langue. Et il y a beaucoup d’avantages supplémentaires qui découlent de l’intégration d’approches multilingues dans chaque phase de la science. Par exemple, publier dans plusieurs langues profitera à la société en raison d’une meilleure communication scientifique. »

« La langue peut être un obstacle, ainsi qu’un outil fantastique, pour rassembler les gens », a souligné Emma Steigerwald, qui est la première auteure de l’article et une étudiante diplômée de l’UC Berkeley en sciences, politiques et gestion de l’environnement. « C’est un obstacle que nous pouvons surmonter en utilisant cette nouvelle technologie. Nous expliquons la technologie et comment elle peut être mise en œuvre et les choses dont nous devons être conscients lorsque nous utilisons la technologie, et toutes les façons merveilleuses et positives que la communication scientifique peut être transformé en mettant à profit cette nouvelle technologie. »

Vers un réseau scientifique multilingue

Jusqu’à récemment, la traduction informatique était la cible de blagues. Les gens ont partagé des exemples amusants d’erreurs de traduction, semblant souvent dénigrer des langues autres que l’anglais et, par implication, d’autres cultures.

Mais l’apprentissage automatique, ou intelligence artificielle, a considérablement augmenté la précision de la traduction dans la mesure où les touristes utilisent des services Internet comme Google Translate pour communiquer avec les gens dans les pays qu’ils visitent.

Mais pour les textes qui contiennent beaucoup de jargon – en grande partie scientifique, mais également de nombreux autres domaines académiques – Google Traduction est terriblement inadéquat.

« La qualité de la traduction n’est pas pour une revue », a déclaré Ixchel Gonzalez Ramirez, l’un des mentors des étudiants diplômés pour le cours. « Souvent, les gens doivent payer pour faire traduire leur travail par un traducteur professionnel, et cela coûte très cher. »

Le nouvel article met en lumière certains des nombreux services, pour la plupart gratuits, qui peuvent convertir l’écriture scientifique anglaise dans d’autres langues. Outre la plate-forme Google Translate bien connue, il s’agit notamment de DeepL, qui utilise des réseaux de neurones et prétend être beaucoup plus précis que ses concurrents lors de la traduction de l’anglais vers le chinois, le japonais, les langues romanes ou l’allemand, et vice versa ; Baidu Translate, un service de la société Internet chinoise Baidu qui se concentrait initialement sur la traduction entre l’anglais et le chinois ; Naver Pagago, un traducteur multilingue créé par une société en Corée du Sud ; et Yandex.Translate, qui utilise la traduction automatique statistique et se concentre principalement sur le russe et l’anglais.

« La traduction devient de plus en plus à la portée de n’importe qui. Que vous soyez un expert ou non, et que vous soyez même bilingue ou non, la capacité de traduire est tellement accélérée par tant de technologies dont nous disposons aujourd’hui », dit Steigerwald. « Et alors, comment pouvons-nous intégrer cela dans notre flux de travail en tant que scientifiques, et comment cela change-t-il les attentes qui entourent la communication scientifique? »

L’anglais est la lingua franca de la science

L’intérêt de Tarvin pour la traduction est né de l’une de ses étudiantes diplômées, Valeria Ramírez Castañeda, qui en 2020 publié un article décrivant les frais engagés par ses camarades doctorants colombiens qui souhaitaient publier ou interagir avec des collègues dans un monde dominé par l’anglais.

En tant que biologiste de l’évolution intéressée par la façon dont certains animaux en sont venus à utiliser du poison, Tarvin a décidé de concentrer son nouveau séminaire sur la traduction d’articles dans les domaines de l’évolution et de l’écologie, bien que les étudiants qui se sont inscrits aient finalement tracé leurs propres cours. Elle a particulièrement recherché des étudiants, comme Liu, et des mentors, comme Gonzalez Ramirez, qui sont bilingues ou multilingues.

« Tout le monde dans la classe a eu une sorte de relation familiale avec la langue », a déclaré Tarvin.

Tarvin a également demandé à Mairi-Louise McLaughlin, professeur de français et de linguistique à l’UC Berkeley et experte en traduction journalistique et littéraire, de parler à la classe de la façon dont les professionnels abordent la traduction et comment la traduction affecte le sens. Ce sujet a touché les étudiants lorsqu’ils se sont essayés à la traduction de résumés scientifiques et parfois d’articles entiers.

Ruoming Cui, un étudiant en deuxième année qui a suivi le cours au printemps 2022, a choisi Baidu pour traduire des résumés scientifiques. Elle a immédiatement découvert que les phrases longues et complexes de l’anglais et l’utilisation de plusieurs mots pour décrire un concept semblaient redondantes lorsqu’elles étaient traduites en chinois.

« Nous ne faisons généralement pas cela en chinois car cela rend chaque phrase très longue et c’est très fastidieux », a-t-elle déclaré.

Liu a ajouté que sans un polissage considérable, de nombreuses traductions anglaises sont brouillées, a-t-elle déclaré.

« J’ai entendu dire que même si votre résultat est incroyable, si vous écrivez un article déroutant à cause de la traduction, les gens seront ennuyés parce qu’ils ne peuvent pas comprendre ce que vous faites », a déclaré Liu. « Et cela affectera grandement la façon dont les gens valideront la recherche ou même s’ils la liront. Je pense que c’est un gros obstacle dans le monde scientifique. »

Steigerwald, Tarvin et leurs co-auteurs ont également réalisé que la rédaction d’articles scientifiques dans un anglais plus simple – ce que les non-scientifiques encouragent depuis longtemps – profite aussi bien aux anglophones qu’aux non-anglophones.

« Si votre langue maternelle n’est pas l’anglais et que vous essayez simplement de lire la version anglaise de l’article, cela semblera beaucoup moins ambigu et beaucoup plus lisible lorsque l’auteur aura utilisé un langage clair », a déclaré Steigerwald. « Mais aussi, ce qui est très important, lorsque vous allez traduire ce morceau de texte, les outils d’apprentissage automatique auront beaucoup plus de facilité à traduire quelque chose qui est écrit en langage clair. Donc, c’est une sorte de pérennité de votre écriture, donc que si quelqu’un veut le traduire dans un million de langues, il aura beaucoup plus de facilité quand il sera écrit de cette façon. »

Il reste des obstacles à la traduction généralisée des articles scientifiques, y compris où les rendre disponibles et comment gérer les droits d’auteur. La plupart des revues n’acceptent même pas les articles qui ne sont pas en anglais, et peu autorisent explicitement la copublication d’articles avec une traduction. Tarvin a constaté que peu de revues ont des politiques sur les traductions et, en raison des restrictions générales du droit d’auteur, de nombreux éditeurs facturent des frais exorbitants pour publier une traduction en ligne après la publication.

« Il est assez étonnant de voir combien de revues ne vous permettent pas de publier librement des traductions après publication, et combien peu ont un support de plate-forme où vous pourriez avoir même juste un résumé dans une deuxième ou troisième langue », a déclaré Tarvin. « Je pense qu’un obstacle majeur à cela réside dans les plates-formes Web ; pas seulement les règles de publication et de droit d’auteur, mais également la fonctionnalité de la plate-forme. »

Avec le séminaire Breaking Barriers et maintenant le Bioscience papier, Tarvin et ses collègues espèrent changer progressivement la norme en science pour par défaut traduire les articles dans d’autres langues, en particulier la langue du pays où la recherche a été effectuée et les langues des co-auteurs.

Et plus il y a de traductions, plus il y a de matériel pour entraîner les systèmes de traduction automatique à faire un meilleur travail, augmentant progressivement la qualité de la traduction scientifique.

« Dans mon laboratoire, nous traduisons une grande partie de nos recherches, et maintenant, les gens du laboratoire d’Emma le font aussi », a-t-elle déclaré. « Je pense que le fait de partager notre attitude positive à ce sujet et la façon dont cela peut faire une différence pour les gens a influencé un groupe restreint, mais croissant, de personnes qui commencent à intégrer la traduction dans leur flux de travail scientifique. »

D’autres co-auteurs du Bioscience l’article comprend les doctorantes Valeria Ramírez-Castañeda et Débora Brandt de l’UC Berkeley ; András Báldi de l’Institut d’écologie et de botanique du Centre de recherche écologique de Vácrátót, Hongrie ; la boursière postdoctorale Julie Teresa Shapiro de l’Université Ben Gourion du Néguev à Be’er Sheva, Israël; et Lynne Bowker, professeur de traduction et d’interprétation à l’Université d’Ottawa au Canada.

Plus d’information:
Emma Steigerwald et al, Surmonter les barrières linguistiques dans le milieu universitaire : outils de traduction automatique et vision d’un avenir multilingue, Bioscience (2022). DOI : 10.1093/biosci/biac062

Fourni par Université de Californie – Berkeley

ph-tech