Une stratégie « intelligente » pour concevoir des protéines personnalisées

L’ingénierie des protéines pour obtenir des caractéristiques désirables est le Saint Graal de la biotechnologie moderne. Par exemple, l’industrie alimentaire peut bénéficier d’enzymes modifiées qui ont la capacité d’améliorer les réactions biochimiques à des températures plus élevées, par rapport aux enzymes naturelles. Cela peut permettre d’économiser des ressources précieuses telles que la main-d’œuvre, l’argent et le temps. Cependant, le processus d’obtention d’une protéine fonctionnelle d’intérêt avec la caractéristique souhaitée présente des défis importants.

Les approches actuelles d’ingénierie des protéines, telles que l’évolution dirigée, s’appuient largement sur le hasard pour affiner les variantes idéales de la protéine d’intérêt. L’évolution dirigée utilise des introductions répétées de modifications de séquences protéiques appelées mutations (mutagenèse itérative), suivies d’un criblage rapide d’un grand nombre de protéines variantes (criblage à haut débit). Il n’est pas surprenant que cette méthode soit laborieuse et inefficace.

Pour surmonter ces limites, un groupe de chercheurs chinois dirigé par le Dr Huifeng Jiang de l’Institut de biotechnologie industrielle de Tianjin de l’Académie chinoise des sciences et du Centre national d’innovation technologique pour la biologie synthétique, a développé une stratégie d’ingénierie des protéines basée sur l’intelligence artificielle appelée « DeepEvo. »

Expliquant plus en détail, le Dr Jiang déclare : « DeepEvo utilise une stratégie d’évolution profonde, combinant les principes de l’apprentissage profond (un processus qui imite le fonctionnement du cerveau vivant) et la biologie évolutive. » Le étude a été publié en ligne dans Recherche en BioDesign le 20 mars 2024.

Les chercheurs ont appliqué DeepEvo pour concevoir une tolérance aux températures élevées dans une enzyme appelée glycéraldéhyde-3-phosphate déshydrogénase (G3PDH). Le G3PDH décompose le glucose pour générer de l’énergie pendant la glycolyse dans les cellules vivantes. Lorsque l’équipe a validé expérimentalement les résultats de DeepEvo, elle a atteint un taux de réussite prometteur de plus de 26 %.

Dans l’étude, les données utilisées pour DeepEvo impliquaient des séquences d’organismes présentant différentes températures de croissance optimales (OGT) et des séquences naturelles dotées des fonctions souhaitées. La stratégie DeepEvo développée comprenait un sélecteur (Thermo-selector) et un générateur de variantes (Variant-generator) pour produire des séquences protéiques fonctionnelles incorporant le trait souhaité.

Alors que le sélecteur agissait comme une pression sélective pour enrichir les séquences protéiques souhaitées, le générateur de variants produisait ces séquences, dans ce cas, des variants G3PDH avec une tolérance aux températures élevées. Les séquences marquées avec OGT ont entraîné le thermo-sélecteur, tandis que celles ayant la fonction souhaitée ont entraîné le générateur de variantes. Le Thermo-sélecteur a filtré les séquences, guidant le Variant-générateur.

Notamment, un modèle de langage protéique – un type de modèle d’apprentissage profond – a constitué la base du thermo-sélecteur utilisé dans cette étude. Ces modèles sont formés sur de grandes quantités de données de séquences protéiques réelles pour apprendre les modèles et les caractéristiques inhérents à ces séquences. Ce sélecteur développé utilise une représentation apprise de séquences protéiques pour guider la génération et la sélection de séquences présentant le trait souhaité.

De plus, les chercheurs ont accumulé des traits de tolérance aux températures élevées dans les séquences protéiques grâce à un processus itératif impliquant le générateur et le sélecteur. Le raffinement itératif des séquences prédites comme tolérantes aux températures élevées a formé un cycle de génération de séquences.

Le Dr Jiang ajoute : « Le processus itératif impliqué dans DeepEvo imite le processus de sélection naturelle, où les séquences fonctionnelles sont favorisées et accumulées au fil des générations successives, conduisant finalement au développement de variantes protéiques possédant les propriétés souhaitées. »

Les chercheurs ont ensuite vérifié les séquences protéiques tolérantes aux hautes températures prédites et conservant les motifs fonctionnels au moyen d’expériences en laboratoire humide. À partir des 30 séquences générées, ils ont obtenu huit variantes, soulignant ainsi la grande efficacité de DeepEvo dans l’ingénierie des protéines tolérantes aux hautes températures.

À l’avenir, DeepEvo pourrait faciliter la sélection de divers traits d’intérêt, et pas seulement de la tolérance aux températures élevées. À cet égard, le Dr Jiang remarque : « Nous pourrions appliquer l’approche DeepEvo pour concevoir d’autres propriétés protéiques telles que la tolérance acido-basique, l’activité catalytique et l’affinité antigénique, facilitant ainsi la génération de nouvelles protéines dotées de multiples propriétés souhaitées.

DeepEvo a ainsi ouvert la voie à une ingénierie efficace des protéines, tout cela grâce aux efforts du Dr Jiang et de son groupe de recherche. La production simple et efficace de protéines adaptées aux caractéristiques souhaitées pourrait bientôt devenir une réalité.

Plus d’information:
Huanyu Chu et al, Ingénierie des protéines de tolérance à haute température grâce à une évolution profonde, Recherche en BioDesign (2024). DOI : 10.34133/bdr.0031

Fourni par l’Université agricole de Nanjing

ph-tech