Les oligonucléotides sont de courts brins simples d’ADN ou d’ARN synthétiques. Bien qu’elles soient petites, ces molécules jouent un rôle important dans les applications de biologie moléculaire et synthétique. Un type d’oligonucléotide, les aptamères, peut se lier sélectivement à des cibles spécifiques telles que des protéines, des peptides, des glucides, des virus, des toxines, des ions métalliques et même des cellules vivantes. Comme ils sont similaires aux anticorps, ils ont une variété d’utilisations dans les domaines des biocapteurs, de la thérapeutique et du diagnostic. Cependant, contrairement aux anticorps, les aptamères n’induisent pas de réaction immunitaire dans notre corps et sont faciles à synthétiser et à modifier. De plus, la structure de pliage tridimensionnelle d’un aptamère lui permet de se lier à un plus large éventail de cibles.
Les aptamères sont généralement générés par une technologie de sélection et d’amplification in vitro appelée évolution systématique des ligands par enrichissement exponentiel, ou SELEX. En bref, SELEX est basé sur des cycles répétés de liaison, de séparation et d’amplification de nucléotides. Ce processus aboutit à un pool enrichi de séquences nucléotidiques qui est ensuite analysé pour la sélection des candidats. Le SELEX à haut débit (HT-SELEX) peut générer un grand nombre de candidats aptamères, mais le séquençage actuellement applicable dans la pratique ne nous permet d’évaluer qu’un nombre limité de ces candidats (environ 106). Par conséquent, les processus informatiques sont essentiels pour optimiser la découverte de nouveaux aptamères.
Il a été rapporté que les conceptions de composés basés sur l’auto-encodeur variationnel (VAE, un type d’approche d’apprentissage automatique) étaient bénéfiques dans la découverte d’autres petites molécules. Maintenant, une équipe de chercheurs dirigée par le professeur Michiaki Hamada de la Graduate School of Advanced Science and Engineering de l’Université Waseda, au Japon, a présenté RaptGen, un VAE qui peut être utilisé pour la génération d’aptamères. Dans leur article publié en Science computationnelle de la nature le 2 juin 2022, ils décrivent comment RaptGen utilise un VAE avec un décodeur de modèle de Markov caché pour créer des espaces latents dans lesquels des séquences peuvent former des clusters. En utilisant cette représentation latente, RaptGen a pu générer des aptamères qui n’étaient même pas inclus dans les données de séquençage d’origine ou dans l’ensemble de données HT-SELEX.
Lorsqu’on lui a demandé comment exactement RaptGen pourrait stimuler la découverte d’aptamères, le professeur Hamada a déclaré : « RaptGen visualise d’abord un espace latent avec un motif de séquence, puis génère plusieurs nouvelles séquences d’aptamères via cet espace latent. Par exemple, il recherche des séquences d’aptamères optimisées dans l’espace latent. en considérant des informations supplémentaires après avoir analysé l’activité d’un sous-ensemble de séquences. De plus, RaptGen permet la conception de séquences d’aptamères raccourcies (ou tronquées).
L’équipe a également évalué avec succès les performances de RaptGen à l’aide de données du monde réel, en les soumettant à des données provenant de deux ensembles de données HT-SELEX indépendants. RaptGen pourrait générer des dérivés d’aptamères de manière guidée par l’activité et offrir des opportunités d’optimiser leurs activités. « C’est important car cela signifie que RaptGen peut générer des séquences ayant des propriétés souhaitées, telles que l’inhibition de certaines enzymes ou des interactions protéine-protéine », explique le professeur Hamada. L’application de ces molécules pourrait ouvrir de nombreuses portes dans le futur.
À l’avenir, l’équipe prévoit de mener des études approfondies pour évaluer si des modèles alternatifs peuvent améliorer les performances de RaptGen et si RaptGen pourrait faire progresser la génération d’aptamère d’ARN en utilisant des séquences d’ARN. Les seuls inconvénients de l’utilisation de RaptGen sont le coût de calcul élevé et l’augmentation du temps de formation, qui peuvent tous deux être améliorés dans des études ultérieures.
Le professeur Hamada déclare : « À notre connaissance, RaptGen est la seule méthode basée sur les données capable de concevoir et d’optimiser des aptamères tronqués directement à partir des données HT-SELEX. Nous pensons qu’en temps voulu, RaptGen sera reconnu comme un outil clé pour découverte efficace d’aptamères. »
Natsuki Iwano et al, Découverte générative d’aptamères à l’aide de RaptGen, Science computationnelle de la nature (2022). DOI : 10.1038/s43588-022-00249-6