Les chercheurs développent une nouvelle représentation des données pour les séquences de liaison aux facteurs de transcription

Des chercheurs utilisent un ordinateur quantique pour identifier un candidat

Les diverses caractéristiques des différentes cellules du corps humain se reflètent dans leurs modèles d’expression génétique. La régulation de cette expression génique repose sur des facteurs de transcription qui se lient à des séquences spécifiques du génome.

L’élucidation des séquences uniques de liaison aux facteurs de transcription pour chaque type de cellule est essentielle pour élucider les mécanismes de régulation régissant l’expression des gènes au sein de ces types de cellules. Néanmoins, une compréhension globale des séquences de liaison aux facteurs de transcription, englobant les points communs et les variations entre les types de facteurs de transcription et les types de cellules, reste insaisissable.

Utilisant des données concernant les sites de liaison de nombreux facteurs de transcription humains, des chercheurs de l’Université de Tsukuba ont développé des « profils MOCCS », une nouvelle représentation des données pour les séquences de liaison aux facteurs de transcription et ont analysé les séquences de liaison à travers divers facteurs de transcription et types de cellules. Le travail est publié dans la revue Génomique BMC.

Leurs résultats révèlent qu’environ la moitié des facteurs de transcription examinés possèdent des séquences de liaison distinctes pour des types de cellules spécifiques. De plus, en utilisant les profils MOCCS, les chercheurs ont développé un indice pour prédire l’effet des polymorphismes mononucléotidiques (SNP) sur la liaison à l’ADN des facteurs de transcription et ont montré que l’effet des SNP liés à la maladie sur la liaison des facteurs de transcription peut être évalué de manière appropriée du point de vue des facteurs de transcription et des types de cellules.

Les profils MOCCS recèlent un vaste potentiel pour diverses applications, telles que la combinaison avec des données épigénomiques pour déchiffrer les mécanismes de régulation de l’expression génique spécifiques à un type de cellule et l’évaluation de l’impact des mutations somatiques dans les cellules cancéreuses sur la liaison des facteurs de transcription.

Plus d’information:
Saeko Tahara et al, L’analyse k-mer de liaison au facteur de transcription clarifie la dépendance du type de cellule des spécificités de liaison et des SNP cis-régulateurs chez l’homme, Génomique BMC (2023). DOI : 10.1186/s12864-023-09692-9

Fourni par l’Université de Tsukuba

ph-tech