Des biologistes découvrent des séquences de protéines répétitives

Tous tels nach Plastik Mit zunehmendem Abfall augmente auch das

Environ 70 % de toutes les protéines humaines comprennent au moins une séquence constituée d’un seul acide aminé répété plusieurs fois, avec quelques autres acides aminés saupoudrés. Ces « régions de faible complexité » se retrouvent également dans la plupart des autres organismes.

Les protéines qui contiennent ces séquences ont de nombreuses fonctions différentes, mais les biologistes du MIT ont maintenant trouvé un moyen de les identifier et de les étudier en tant que groupe unifié. Leur technique leur permet d’analyser les similitudes et les différences entre les LCR de différentes espèces, et les aide à déterminer les fonctions de ces séquences et les protéines dans lesquelles elles se trouvent.

Grâce à leur technique, les chercheurs ont analysé toutes les protéines présentes dans huit espèces différentes, des bactéries aux humains. Ils ont découvert que même si les LCR peuvent varier entre les protéines et les espèces, ils partagent souvent un rôle similaire : aider la protéine dans laquelle ils se trouvent à rejoindre un assemblage à plus grande échelle tel que le nucléole, un organite présent dans presque toutes les cellules humaines.

« Au lieu d’examiner des LCR spécifiques et leurs fonctions, qui peuvent sembler distinctes parce qu’elles sont impliquées dans des processus différents, notre approche plus large nous permet de voir des similitudes entre leurs propriétés, ce qui suggère que les fonctions des LCR ne sont peut-être pas si disparates après tout. « , déclare Byron Lee, un étudiant diplômé du MIT.

Les chercheurs ont également trouvé des différences entre les LCR de différentes espèces et ont montré que ces séquences LCR spécifiques à l’espèce correspondent à des fonctions spécifiques à l’espèce, telles que la formation de parois cellulaires végétales.

Lee et l’étudiant diplômé Nima Jaberi-Lashkari sont les principaux auteurs de l’étude, qui paraît aujourd’hui dans eVie. Eliezer Calo, professeur adjoint de biologie au MIT, est l’auteur principal de l’article.

Étude à grande échelle

Des recherches antérieures ont révélé que les LCR sont impliqués dans une variété de processus cellulaires, y compris l’adhésion cellulaire et la liaison à l’ADN. Ces LCR sont souvent riches en un seul acide aminé tel que l’alanine, la lysine ou l’acide glutamique.

Trouver ces séquences puis étudier leurs fonctions individuellement est un processus qui prend du temps. L’équipe du MIT a donc décidé d’utiliser la bioinformatique – une approche qui utilise des méthodes informatiques pour analyser de grands ensembles de données biologiques – pour les évaluer en tant que groupe plus large.

« Ce que nous voulions faire, c’est prendre du recul et au lieu de regarder les LCR individuellement, essayer de les examiner tous et voir si nous pouvions observer certains modèles à plus grande échelle qui pourraient nous aider à comprendre ce que le ceux qui ont des fonctions assignées font, et nous aident également à en savoir un peu plus sur ce que font ceux qui n’ont pas de fonctions assignées », dit Jaberi-Lashkari.

Pour ce faire, les chercheurs ont utilisé une technique appelée matrice dotplot, qui est un moyen de représenter visuellement des séquences d’acides aminés, pour générer des images de chaque protéine étudiée. Ils ont ensuite utilisé des méthodes informatiques de traitement d’images pour comparer des milliers de ces matrices en même temps.

En utilisant cette technique, les chercheurs ont pu catégoriser les LCR en fonction des acides aminés les plus fréquemment répétés dans le LCR. Ils ont également regroupé les protéines contenant la LCR en fonction du nombre de copies de chaque type de LCR trouvé dans la protéine. L’analyse de ces traits a aidé les chercheurs à en savoir plus sur les fonctions de ces LCR.

À titre de démonstration, les chercheurs ont choisi une protéine humaine, connue sous le nom de RPA43, qui possède trois LCR riches en lysine. Cette protéine est l’une des nombreuses sous-unités qui composent une enzyme appelée ARN polymérase 1, qui synthétise l’ARN ribosomal. Les chercheurs ont découvert que le nombre de copies de LCR riches en lysine est important pour aider la protéine à s’intégrer dans le nucléole, l’organite responsable de la synthèse des ribosomes.

Assemblages biologiques

Dans une comparaison des protéines trouvées dans huit espèces différentes, les chercheurs ont découvert que certains types de LCR sont hautement conservés entre les espèces, ce qui signifie que les séquences ont très peu changé au cours des échelles de temps évolutives. Ces séquences ont tendance à se trouver dans des protéines et des structures cellulaires qui sont également hautement conservées, comme le nucléole.

« Ces séquences semblent être importantes pour l’assemblage de certaines parties du nucléole », explique Lee. « Certains des principes connus pour être importants pour l’assemblage d’ordre supérieur semblent être en jeu car le nombre de copies, qui pourrait contrôler le nombre d’interactions qu’une protéine peut faire, est important pour que la protéine s’intègre dans ce compartiment. »

Les chercheurs ont également trouvé des différences entre les LCR observés dans deux types différents de protéines impliquées dans l’assemblage du nucléole. Ils ont découvert qu’une protéine nucléolaire connue sous le nom de TCOF contient de nombreux LCR riches en glutamine qui peuvent aider à échafauder la formation d’assemblages, tandis que les protéines nucléolaires avec seulement quelques-uns de ces LCR riches en acide glutamique pourraient être recrutées comme clients (protéines qui interagissent avec l’échafaudage ).

Une autre structure qui semble avoir de nombreux LCR conservés est le speckle nucléaire, qui se trouve à l’intérieur du noyau cellulaire. Les chercheurs ont également trouvé de nombreuses similitudes entre les LCR qui sont impliqués dans la formation d’assemblages à plus grande échelle tels que la matrice extracellulaire, un réseau de molécules qui fournit un support structurel aux cellules des plantes et des animaux.

L’équipe de recherche a également trouvé des exemples de structures avec des LCR qui semblent avoir divergé entre les espèces. Par exemple, les plantes ont des séquences LCR distinctives dans les protéines qu’elles utilisent pour échafauder leurs parois cellulaires, et ces LCR ne sont pas observées dans d’autres types d’organismes.

Les chercheurs prévoient maintenant d’étendre leur analyse LCR à d’autres espèces.

« Il y a tellement de choses à explorer, car nous pouvons étendre cette carte à pratiquement toutes les espèces », déclare Lee. « Cela nous donne l’opportunité et le cadre pour identifier de nouveaux assemblages biologiques. »

Plus d’information:
Byron Lee et al, Une vision unifiée des régions de faible complexité (LCR) à travers les espèces, eVie (2022). DOI : 10.7554/eLife.77058

Informations sur la revue :
eVie

Fourni par le Massachusetts Institute of Technology

Cette histoire est republiée avec l’aimable autorisation de MIT News (web.mit.edu/newsoffice/), un site populaire qui couvre l’actualité de la recherche, de l’innovation et de l’enseignement au MIT.

ph-tech