Das Verständnis der Struktur von Proteinen ist entscheidend für die Entmystifizierung ihrer Funktionen und die Entwicklung von Medikamenten, die auf sie abzielen. Zu diesem Zweck hat ein Forscherteam der Brown University eine Möglichkeit entwickelt, maschinelles Lernen zu nutzen, um mehrere Proteinkonfigurationen schnell vorherzusagen und so das Verständnis der Proteindynamik und -funktionen zu verbessern.
A Studie Die Beschreibung des Ansatzes wurde in veröffentlicht Naturkommunikation am Mittwoch, 27. März.
Die Autoren sagen, dass die Technik genau, schnell und kosteneffektiv ist und das Potenzial hat, die Arzneimittelforschung zu revolutionieren, indem sie viel mehr Angriffspunkte für neue Behandlungen aufdeckt.
Bei der gezielten Krebstherapie beispielsweise zielen die Behandlungen auf Proteine ab, die das Wachstum, die Teilung und die Ausbreitung von Krebszellen steuern. Eine der Herausforderungen für Strukturbiologen bestehe darin, Zellproteine gründlich genug zu verstehen, um Ziele zu identifizieren, sagte Studienautor Gabriel Monteiro da Silva, ein Ph.D. Kandidat für Molekularbiologie, Zellbiologie und Biochemie bei Brown.
Monteiro da Silva nutzt rechnerische Methoden zur Modellierung der Proteindynamik und sucht nach Möglichkeiten, Methoden zu verbessern oder neue Methoden zu finden, die für verschiedene Situationen am besten funktionieren. Für diese Studie arbeitete er mit Brenda Rubenstein, einer außerordentlichen Professorin für Chemie und Physik, und anderen Brown-Forschern zusammen, um mit einer bestehenden KI-gestützten Berechnungsmethode namens AlphaFold 2 zu experimentieren.
Während Monteiro da Silva sagte, dass die Genauigkeit von AlphaFold 2 die Vorhersage der Proteinstruktur revolutioniert habe, weist die Methode Einschränkungen auf: Sie ermöglicht es Wissenschaftlern, Proteine nur in einem statischen Zustand zu einem bestimmten Zeitpunkt zu modellieren.
„Bei den meisten zellulären Prozessen ändern Proteine ihre Form dynamisch“, sagte Monteiro da Silva.
„Um Proteinziele auf Medikamente zur Behandlung von Krebs und anderen Krankheiten abzustimmen, benötigen wir ein genaueres Verständnis dieser physiologischen Veränderungen. Wir müssen über 3D-Formen hinausgehen und 4D-Formen verstehen, wobei die vierte Dimension die Zeit ist. Das haben wir getan.“ mit diesem Ansatz.“
Monteiro da Silva nutzte die Analogie eines Pferdes, um Proteinmodelle zu erklären. Durch die Anordnung der Muskeln und Gliedmaßen des Pferdes entstehen unterschiedliche Formen, je nachdem, ob das Pferd steht oder galoppiert; Proteinmoleküle nehmen aufgrund der Bindungsanordnungen ihrer Atombestandteile unterschiedliche Formen an.
„Stellen Sie sich vor, dass das Protein ein Pferd ist“, sagte Monteiro da Silva. Frühere Methoden wurden verwendet, um ein Modell eines stehenden Pferdes vorherzusagen. Es war genau, aber es sagte nicht viel darüber aus, wie sich das Pferd verhielt oder wie es aussah, wenn es nicht stand.
In dieser Studie konnten die Forscher die Evolutionssignale des Proteins manipulieren, um mithilfe von AlphaFold 2 schnell mehrere Proteinkonformationen sowie die Häufigkeit der Besiedlung dieser Strukturen vorherzusagen.
Anhand der Pferdeanalogie ermöglicht die neue Methode den Forschern, schnell mehrere Schnappschüsse eines galoppierenden Pferdes vorherzusagen, was bedeutet, dass sie sehen können, wie sich die Muskelstruktur des Pferdes während der Bewegung verändern würde, und diese strukturellen Unterschiede dann vergleichen können.
„Wenn man die vielfältigen Momentaufnahmen versteht, die die Dynamik dessen ausmachen, was mit dem Protein vor sich geht, dann kann man mehrere verschiedene Möglichkeiten finden, die Proteine mit Medikamenten anzugreifen und Krankheiten zu behandeln“, sagte Rubenstein, dessen Forschung sich auf elektronische Struktur und Biophysik konzentriert.
Rubenstein erklärte, dass es sich bei dem Protein, auf das sich das Team in dieser Studie konzentrierte, um ein Protein handelte, für das verschiedene Medikamente entwickelt wurden. Doch viele Jahre lang konnte niemand verstehen, warum einige der Medikamente erfolgreich waren oder scheiterten, sagte sie.
„Alles lief auf die Tatsache hinaus, dass diese spezifischen Proteine mehrere Konformationen haben, und auch auf das Verständnis, wie die Medikamente an die verschiedenen Konformationen binden, statt an die eine statische Struktur, die diese Techniken zuvor vorhergesagt hatten; die Kenntnis der Konformationsreihe war unglaublich.“ wichtig, um zu verstehen, wie diese Medikamente tatsächlich im Körper wirken“, sagte Rubenstein.
Beschleunigung der Entdeckungszeit
Die Forscher stellten fest, dass bestehende Berechnungsmethoden kosten- und zeitintensiv sind.
„Sie sind teuer in Bezug auf Material und Infrastruktur, sie nehmen viel Zeit in Anspruch und man kann diese Berechnungen nicht wirklich mit hohem Durchsatz durchführen – ich bin sicher, dass ich einer der Top-Benutzer war.“ von GPUs in Browns Computercluster“, sagte Monteiro da Silva.
„In größerem Maßstab ist dies ein Problem, da es in der Proteinwelt viel zu erforschen gibt: wie Proteindynamik und -struktur bei kaum verstandenen Krankheiten, bei Arzneimittelresistenzen und bei neu auftretenden Krankheitserregern eine Rolle spielen.“
Die Forscher beschrieben, wie Monteiro da Silva zuvor drei Jahre damit verbrachte, die Physik zu nutzen, um die Dynamik und Konformation von Proteinen zu verstehen. Mit ihrem neuen KI-gestützten Ansatz verkürzte sich die Entdeckungszeit auf nur noch wenige Stunden.
„Sie können sich also vorstellen, was für einen Unterschied das im Leben eines Menschen machen würde: drei Jahre statt drei Stunden“, sagte Rubenstein. „Und deshalb war es sehr wichtig, dass die von uns entwickelte Methode einen hohen Durchsatz und eine hohe Effizienz aufweist.“
Was die nächsten Schritte betrifft, verfeinert das Forschungsteam seinen maschinellen Lernansatz, um ihn sowohl genauer als auch verallgemeinerbarer und für eine Reihe von Anwendungen nützlicher zu machen.
Mehr Informationen:
Hochdurchsatzvorhersage von Proteinkonformationsverteilungen mit unterabgetastetem AlphaFold2, Naturkommunikation (2024). DOI: 10.1038/s41467-024-46715-9