Deux nouvelles approches pourraient aider les scientifiques à utiliser la technologie de séquençage existante pour mieux distinguer les modifications de l’ARN qui affectent la lecture du code génétique.
Les scientifiques de l’Université de Kyoto se rapprochent de trouver des moyens d’identifier les changements dans les séquences d’ARN qui ont un impact sur la formation des protéines et peuvent provoquer des maladies. Leur approche, publiée dans la revue Génomiqueutilise des algorithmes de probabilité avec un dispositif de séquençage de poche déjà disponible.
« Les modifications que l’on trouve dans tous les types d’ARN biologique influencent la régulation des gènes, qui décide en fin de compte du fonctionnement des différentes cellules dans notre corps », explique Ganesh Pandian Namasivayam de l’Institut pour la science intégrée des matériaux cellulaires (WPI-iCeMS) de l’Université de Kyoto. « Des anomalies dans ces modifications peuvent entraîner des maladies graves, comme le diabète, des troubles du développement neurologique et le cancer. Savoir comment et où se trouvent ces modifications de l’ARN est d’une importance primordiale d’un point de vue clinique », ajoute Soundhar Ramaswamy, le premier auteur de l’étude.
Il existe déjà des moyens d’identifier les modifications de l’ARN, mais ils sont insuffisants. Les approches biophysiques telles que la chromatographie et la spectrométrie de masse ne peuvent traiter que de petites quantités d’ARN à la fois. Les méthodes de séquençage à haut débit, qui peuvent traiter de grandes quantités d’ARN, impliquent une préparation laborieuse des échantillons, ne peuvent pas cartographier simultanément plusieurs modifications et sont sujettes aux erreurs.
Namasivayam, Hiroshi Sugiyama et leurs collègues de l’Université de Kyoto ont testé et trouvé deux approches qui peuvent distinguer avec un succès relatif une modification d’ARN bien connue et abondante impliquant le remplacement de la base nucléotidique uracile par une autre appelée pseudouridine.
Semblable à l’ADN, l’ARN est formé d’un brin de combinaisons variables de quatre bases nucléotidiques différentes : uracile, cytosine, adénine et guanine. La façon dont ces bases sont disposées détermine le code qui signale quelle protéine doit être fabriquée. Lorsque la pseudouridine remplace l’uracile dans le squelette de l’ARN, cela peut entraîner une augmentation de la production de protéines ou le changement du code de celui qui signale l’interruption de la traduction de l’information à celui qui signale la formation d’acides aminés.
L’approche de l’équipe consiste à utiliser une plateforme de séquençage direct d’ARN déjà disponible développée par Oxford Nanopore Technologies. Dans cette plate-forme, les brins d’ARN traversent de minuscules pores dans une membrane. Des perturbations sont provoquées dans le courant traversant la membrane en fonction de l’ordre des différentes bases d’ARN. Cela permet aux scientifiques de « lire » la séquence. Mais les scientifiques utilisant cette approche ont souvent du mal à distinguer les différents types de modifications les uns des autres.
Shubham Mishra, co-auteur de cette étude, a développé des algorithmes pour identifier une forte probabilité d’existence d’une substitution de pseudouridine par rapport à la possibilité qu’il s’agisse d’un type différent de changement de base.
L’une de leurs stratégies compare de courtes séquences d’ARN de cinq bases nucléotidiques dans lesquelles l’uracile, la pseudouridine ou la cytosine sont entourées de part et d’autre par les mêmes bases. Les lectures passent ensuite par des algorithmes qui calculent la probabilité que la base médiane soit l’une des trois. Ils ont utilisé leur stratégie, appelée Indo-Compare (Indo-C), sur des séquences d’ARN modifiées, puis sur de la levure et de l’ARN humain et ont trouvé qu’elle était efficace pour distinguer les substitutions de pseudouridine des autres.
Ils ont également pu identifier des substitutions de pseudouridine en mélangeant une sonde chimique avec des échantillons d’ARN, qui s’y attache ensuite sélectivement. Cela a changé les lectures de séquence d’une manière qui identifie la modification.
« Nous pensons que nos travaux rendront les méthodes basées sur le séquençage des nanopores moins laborieuses pour détecter les modifications de l’ARN et plus capables de caractériser les impacts de ces modifications sur le développement et la maladie », déclare Namasivayam.
L’équipe vise ensuite à optimiser l’utilisation des deux approches ensemble pour identifier plus précisément les modifications de l’ARN et de l’ADN. Il s’agira de fabriquer de nouvelles sondes chimiques correspondant à des modifications spécifiques. Ils prévoient également de développer davantage des algorithmes avancés d’apprentissage automatique qui complètent les approches de séquençage direct d’ARN basées sur des sondes chimiques.
Soundhar Ramasamy et al, Une approche informatique pour distinguer les modifications d’ARN dans le séquençage direct d’ARN nanopore, Génomique (2022). DOI : 10.1016/j.ygeno.2022.110372