Une nouvelle technique statistique développée par un chercheur de l’École de santé publique de l’Université Texas A&M et ses collègues d’ailleurs offre de nouvelles perspectives sur la façon dont les maladies affectent les cellules individuelles. Cette méthode innovante, connue sous le nom d’inférence bayésienne hybride, combine différentes approches statistiques pour mieux comprendre des maladies complexes comme la fibrose pulmonaire idiopathique, qui a longtemps intrigué les scientifiques en raison de sa nature insaisissable.
Cette technique a été développée au cours de la dernière décennie par le Dr Gang Han et d’autres chercheurs pour être utilisée lorsque des informations préalables sont disponibles pour certains paramètres mais pas pour d’autres. Cette approche ouvre la voie à des découvertes médicales plus précises dans de nombreux domaines.
« Cette approche hybride est meilleure que l’inférence fréquentiste car elle inclut des informations antérieures et également meilleure que l’inférence bayésienne car elle réduit le problème de biais résultant de priors non informatifs, qui peuvent être importants avec des échantillons de petite taille », a déclaré Han, qui est professeur à l’École de santé publique.
La technologie actuelle de séquençage d’ARN à cellule unique est confrontée au même défi lorsqu’il s’agit d’identifier les gènes d’intérêt. Les gènes exprimés de manière différentielle peuvent être identifiés en regroupant le séquençage d’ARN à cellule unique dans les mêmes répliques biologiques, mais la petite taille de l’échantillon réduit leur puissance. D’autre part, l’acquisition de tailles d’échantillon importantes est difficilement possible en raison du coût élevé et du recrutement prolongé de patients atteints de certaines maladies.
Pour leur courant étude dans Génomique humaineHan et ses collègues de la société pharmaceutique Eli Lilly and Company ont appliqué le cadre hybride bayésien-fréquentiste à une étude de cas portant sur la fibrose pulmonaire idiopathique. À l’aide d’une source de données semi-synthétiques de séquençage d’ARN monocellulaire de l’hypothalamus de souris, les chercheurs ont étudié la puissance statistique et le taux de fausses découvertes de l’inférence hybride bayésienne-fréquentiste par rapport à d’autres méthodes d’analyse.
Ils ont ensuite utilisé les trois méthodes (inférence hybride fréquentiste bayésienne, méthodes fréquentiste et bayésienne) pour analyser les données d’expression génétique à partir d’un ensemble de données de tissus pulmonaires. Plus précisément, ils ont étudié l’association entre la fibrose pulmonaire idiopathique et le facteur de croissance transformant bêta 1, en ajustant la probabilité que les cellules soient des cellules macrophages alvéolaires.
Les chercheurs ont constaté que l’inférence hybride fréquentiste bayésienne permettait d’identifier davantage de gènes d’intérêt à condition qu’il existe une information préalable appropriée et que ces gènes soient raisonnables sur la base des connaissances actuelles sur la fibrose pulmonaire idiopathique. Lorsque l’inférence fréquentiste et l’inférence bayésienne étaient utilisées, aucun gène exprimé différemment, ou seulement un petit nombre, n’était trouvé.
« Notre découverte la plus inhabituelle est que notre méthode peut déclencher une analyse complète des voies pour l’identification des gènes associés à l’état pathologique d’un type de cellule spécifique », a déclaré Han. « Cela signifie qu’elle peut identifier des gènes significatifs dans un type de cellule spécifique qui sont pertinents pour une maladie particulière compte tenu de la taille limitée de l’échantillon. »
Cette étude s’appuie sur une étude de 2022 papier sur le calcul de l’inférence hybride. Dans cette étude, Han et d’autres collègues ont appliqué l’inférence hybride fréquentiste bayésienne à la conception d’un implant de genou en ingénierie biomécanique et à une étude de la relation entre l’emplacement et le type de mélanome lentigineux acral (une forme de cancer de la peau) et l’approche chirurgicale choisie pour le traiter. Dans les deux cas, l’approximation a surpassé les inférences fréquentistes et bayésiennes avec des tailles d’échantillon allant de 20 à 500.
Ensuite, Han prévoit de mener des études sur l’analyse bayésienne hybride multivariée qui intègrent davantage d’informations sur la démographie des patients dans le modèle et disposent d’autres sources d’informations comme les variables environnementales.
« En fin de compte, l’inférence hybride fréquentiste bayésienne ajoute non seulement des informations précieuses sur la fibrose pulmonaire idiopathique, mais constitue également un cadre unique et flexible pour de nombreuses autres analyses futures de séquençage d’ARN unicellulaire », a déclaré Han.
Plus d’informations :
Gang Han et al, Cadre d’inférence hybride bayésien-fréquentiste pour les analyses d’ARN-seq à cellule unique, Génomique humaine (2024). DOI : 10.1186/s40246-024-00638-0