La linguistique peut nous aider à comprendre certaines « étrangetés » du code génétique

Des chercheurs utilisent un ordinateur quantique pour identifier un candidat

Les linguistes ont développé la comparaison du code génétique avec le langage où les nucléotides font office de lettres, et ont introduit le concept de « nucléotide sémiotique » – l’élément minimal qui permet de distinguer les codons – unités codantes de l’ADN. Selon cette approche, les caractéristiques biochimiques de l’ADN fonctionnent comme des informations.

La flexibilité de l’approche informationnelle permet aux chercheurs de mettre en évidence des faits qui ne sont pas expliqués par des caractéristiques biochimiques et qui sont généralement considérés comme des écarts par rapport aux régularités universelles du code génétique. La recherche est publiée dans la revue Biosystèmes.

Le code génétique a une double caractéristique : il contient non seulement des propriétés biochimiques, mais il a également une dimension sémiotique ou sémantique. La sémiotique est une science qui étudie les régularités générales du traitement de l’information par les signes. Les chercheurs trouvent des analogies entre un texte et le code génétique, par exemple dans le fait que les gènes portent un programme de développement de l’organisme, et ce programme ressemble à des textes écrits selon certaines règles.

La théorie sémiotique permet de considérer les nucléotides non pas comme des molécules biologiques mais comme des supports d’information. Les processus génétiques cruciaux peuvent être décrits du point de vue des opérations sur le texte : lecture, transcription, traduction, relecture, édition.

Les chercheurs de l’Université fédérale balte Emmanuel Kant et de l’Institut d’information scientifique sur les sciences sociales de l’Académie des sciences de Russie ont attiré l’attention sur le fait qu’un même nucléotide dans l’ADN, selon sa position, a une valeur différente dans le traitement de l’information génétique.

Ainsi, lorsque les protéines sont synthétisées dans une cellule selon une « recette », écrite dans les gènes, des « machines » cellulaires spéciales – les ribosomes – lisent les nucléotides trois par trois, et pour chacun de ces triplets, appelés codons, elles choisissent un acide aminé particulier. Dans 32 cas parmi 64 combinaisons possibles de nucléotides « A », « T », « G » et « C », la troisième position peut être occupée par n’importe lequel d’entre eux et cela n’affecte pas le résultat : l’acide aminé reconnu. Cela se produit parce que le même acide aminé peut être codé par plusieurs triplets différents de nucléotides.

Ainsi, afin de comprendre quel acide aminé est nécessaire, un ribosome, lors de la lecture de chaque lettre, se concentre d’abord sur la « signification » de sa combinaison au sein des triplets. C’est ce qu’on appelle l’oscillation, en raison de la position « oscillation » du dernier nucléotide dans les codons. Afin de le décrire du point de vue de la transmission des données, les linguistes ont introduit le terme « nucléotide sémiotique », élément minimal qui leur permet de distinguer un triplet de nucléotides d’un autre.

À cet égard, au lieu de comparer les nucléotides avec des lettres comme cela se fait habituellement, les scientifiques ont proposé de les corréler avec d’autres entités du langage : les sons, ou plus précisément les phonèmes (un élément du langage qui comprend uniquement les caractéristiques nécessaires à la distinction des signes). Une lettre n’est pas une unité linguistique ; il ne sert qu’à désigner le son dans l’écriture.

L’analogie avec les phonèmes permet d’expliquer comment deux caractéristiques distinctives d’un nucléotide sont en corrélation avec leur signification variable en fonction de la position du nucléotide dans un codon.

Cela présuppose que les unités minimales du code génétique ne sont pas des nucléotides mais leurs traits distinctifs. Ces caractéristiques ont une pertinence différente selon leur position au sein d’un triplet : maximale en deuxième position et minimale, jusqu’à zéro, en troisième. Un nucléotide en troisième position est présent au sens physique mais il peut être absent au sens sémiotique (du point de vue de sa valeur distinctive).

Chaque nucléotide possède deux caractéristiques distinctives : le nombre de liaisons hydrogène (deux ou trois) et de cycles carbonés (un ou deux). Ces caractéristiques sont pertinentes pour lier les nucléotides les uns aux autres. Ainsi, les nucléotides qui possèdent deux cycles correspondent à ceux qui possèdent un seul cycle (et vice versa) mais avec le même nombre de liaisons hydrogène. Cependant, cette régularité peut être transformée en ce qui concerne la troisième position d’un codon.

« L’utilisation de l’approche sémiotique permet d’identifier le rôle que joue chacun des nucléotides dans la distinction des codons et de considérer l’oscillation comme un mode de lecture particulier. En tant que produit de l’évolution, le code génétique est sémiotiquement hétérogène – dans la moitié des codons (32 ) la troisième position n’a pas d’importance, dans trente cas elle agit dans sa demi-force (un seul trait, le nombre d’anneaux est pertinent) ; et ce n’est que dans le cas du tryptophane que les deux traits participent de manière égale. »

« L’approche informationnelle-sémiotique permet [us] pour compléter la description commune du code génétique. Le premier Francis Crick, parlant des déviations par rapport aux régularités du code génétique liées à la troisième position, les qualifiait de « hors du sens évident ». Cependant, du point de vue de la sémiotique, la position particulière du nucléotide peut avoir une explication significative, car sa fonction première est de séparer un codon d’un autre, et seule sa deuxième fonction est de distinguer les codons », explique Suren Zolyan, docteur des sciences philologiques, professeur, chercheur en chef de l’Université fédérale balte Immanuel Kant, Institut des sciences humaines.

Plus d’information:
Suren Zolyan, Sur les éléments minimaux du code génétique et leurs fonctions sémiotiques (dégénérescence, complémentarité, oscillation), Biosystèmes (2023). DOI : 10.1016/j.biosystems.2023.104962

Fourni par l’Université fédérale balte Emmanuel Kant

ph-tech