Eine neue statistische Technik, die von einem Forscher der Texas A&M University School of Public Health und Kollegen an anderen Orten entwickelt wurde, bietet neue Einblicke in die Auswirkungen von Krankheiten auf einzelne Zellen. Diese innovative Methode, bekannt als hybride Bayesianische Inferenz, kombiniert verschiedene statistische Ansätze, um komplexe Krankheiten wie die idiopathische Lungenfibrose besser zu verstehen, die Wissenschaftler aufgrund ihrer schwer fassbaren Natur seit langem vor Rätsel stellt.
Die Technik wurde im letzten Jahrzehnt von Gang Han, Ph.D., und anderen entwickelt und kommt zum Einsatz, wenn für einige Parameter bereits Informationen verfügbar sind, für andere jedoch nicht. Dieser Ansatz ebnet den Weg für präzisere medizinische Entdeckungen in vielen Bereichen.
„Dieser hybride Ansatz ist besser als die frequentistische Inferenz, weil er Vorabinformationen mit einbezieht, und auch besser als die Bayes’sche Inferenz, weil er das Problem der Verzerrung durch nichtinformative Vorabinformationen reduziert, das bei kleinen Stichproben erheblich sein kann“, sagte Han, der Professor an der School of Public Health ist.
Die aktuelle Technologie zur Einzelzell-RNA-Sequenzierung steht vor der gleichen Herausforderung, wenn es darum geht, die Gene von Interesse zu identifizieren. Differenziell exprimierte Gene können durch die Zusammenführung von Einzelzell-RNA-Sequenzierungen in denselben biologischen Replikaten identifiziert werden, aber die geringe Probengröße reduziert ihre Aussagekraft. Andererseits ist die Erfassung großer Probenmengen aufgrund der hohen Kosten und der langwierigen Ansammlung von Patienten mit bestimmten Krankheiten kaum möglich.
Für ihre aktuelle Studie In Menschliche GenomikHan und Kollegen vom Pharmaunternehmen Eli Lilly and Company haben das bayesianisch-frequentistische Hybrid-Framework auf eine Fallstudie zu idiopathischer Lungenfibrose angewendet. Mithilfe einer halbsynthetischen Datenquelle aus Einzelzell-RNA-Sequenzierung des Hypothalamus von Mäusen untersuchten die Forscher die statistische Aussagekraft und die Falschentdeckungsrate der bayesianisch-frequentistischen Hybrid-Inferenz im Vergleich zu anderen Analysemethoden.
Anschließend verwendeten sie alle drei Methoden – die bayesianische frequentistische Hybridinferenz sowie frequentistische und bayesianische Methoden –, um Genexpressionsdaten aus einem Lungengewebe-Datensatz zu analysieren. Insbesondere untersuchten sie den Zusammenhang zwischen idiopathischer Lungenfibrose und dem transformierenden Wachstumsfaktor Beta 1 und passten die Wahrscheinlichkeit an, dass es sich bei den Zellen um Alveolarmakrophagen handelt.
Die Forscher stellten fest, dass die frequentistische hybride Bayes-Inferenz mehr interessante Gene identifizierte, solange eine entsprechende informative Vorgeschichte vorlag und diese Gene auf Grundlage des aktuellen Wissens über idiopathische Lungenfibrose sinnvoll waren. Bei Verwendung der frequentistischen und der bayesischen Inferenz wurden entweder keine oder nur eine geringe Anzahl differentiell exprimierter Gene gefunden.
„Unsere ungewöhnlichste Entdeckung war, dass unsere Methode eine umfassende Pfadanalyse zur Identifizierung von Genen auslösen kann, die mit dem Krankheitsstatus eines bestimmten Zelltyps in Zusammenhang stehen“, sagte Han. „Das bedeutet, dass sie bei einer begrenzten Stichprobengröße signifikante Gene in einem bestimmten Zelltyp identifizieren kann, die für eine bestimmte Krankheit relevant sind.“
Diese Studie basiert auf einer Studie aus dem Jahr 2022 Papier zur Berechnung der hybriden Inferenz. In dieser Studie wendeten Han und andere Kollegen die bayesianische frequentistische hybride Inferenz auf ein biomechanisches Knieimplantatdesign und eine Studie über die Beziehung zwischen Ort und Art des akrolentiginösen Melanoms – einer Form von Hautkrebs – und dem gewählten chirurgischen Behandlungsansatz an. In beiden Fällen übertraf die Näherung sowohl frequentistische als auch bayesianische Inferenzen bei Stichprobengrößen von 20 bis 500.
Als nächstes plant Han, Studien zur multivariablen hybriden Bayes-Analyse durchzuführen, die mehr Informationen zur Patientendemografie in das Modell einbeziehen und andere Informationsquellen wie Umgebungsvariablen haben.
„Unter dem Strich lässt sich sagen, dass die bayesianische frequentistische Hybridinferenz nicht nur wertvolle Erkenntnisse zur idiopathischen Lungenfibrose liefert, sondern auch einen einzigartigen und flexiblen Rahmen für viele andere zukünftige Einzelzell-RNA-Sequenzierungsanalysen darstellt“, sagte Han.
Weitere Informationen:
Gang Han et al., Bayesianisch-frequentistisches hybrides Inferenz-Framework für Einzelzell-RNA-Sequenzanalysen, Menschliche Genomik (2024). DOI: 10.1186/s40246-024-00638-0