„Wörterbücher“ machen fluoreszenzbasierte Daten zugänglich

Ein Forschungsteam aus Deutschland und den USA unter der Leitung der Heinrich-Heine-Universität Düsseldorf (HHU) hat eine Datenbeschreibung entwickelt, die Ergebnisse aus Fluoreszenzmessungen für die strukturelle und dynamische Modellierung großer Biomoleküle liefern kann.

Die Autoren erklären im Tagebuch Naturmethoden dass erstmals auch andere Forscher über Datenbanken auf fluoreszenzbasierte integrative Strukturmodelle und deren Dynamik zugreifen können. Dadurch werden experimentelle Trainingsdaten für die nächste Generation von KI-Tools zur dynamischen Strukturmodellierung bereitgestellt.

Proteine ​​und Nukleinsäuren sind die zentralen Bausteine ​​des Lebens in allen Organismen. Diese Biomoleküle bestehen aus vielen einzelnen Bausteinen, bei Proteinen beispielsweise aus Aminosäuren.

Beim Zusammenbau der einzelnen Bausteine ​​in den Zellen entstehen die Biomoleküle als komplexe, dreidimensionale Gebilde. Ihre spezifische Form wird durch die Konfiguration und die Kräfte zwischen den Bausteinen bestimmt. Um die Funktion von Biomolekülen zu verstehen, ist es jedoch wichtig, nicht nur ihre dreidimensionale Struktur zu berücksichtigen, sondern auch die Anzahl verschiedener Strukturzustände und die Austauschdynamik zwischen ihnen.

Lange Zeit war es sehr komplex und zeitaufwändig, die 3D-Struktur von Biomolekülen mit klassischen biophysikalischen Methoden zu bestimmen. Um diese Arbeit Schritt für Schritt zu vereinfachen und zu systematisieren, werden seit 1971 alle diese dreidimensionalen Strukturen in der „Protein Data Bank“ (PDB) gesammelt. Diese über 220.000 Strukturen werden von KI-basierten Tools wie „AlphaFold“ genutzt „ – für deren Entwicklung in diesem Jahr der Nobelpreis für Chemie verliehen wurde – als Trainingsdaten für neuronale Netze.

KI-Systeme machen bereits gute Vorhersagen über biomolekulare Strukturen. Aufgrund fehlender experimenteller Daten sind die Tools jedoch derzeit nicht in der Lage, die Dynamik vorherzusagen.

Daher ist es wichtig, leistungsstarke experimentelle Methoden wie die Fluoreszenzspektroskopie einzusetzen, die kombinierte Informationen über die Dynamik und Struktur komplexer Biomoleküle liefern. Bei Fluoreszenzexperimenten werden bestimmte interessante Teile der Biomoleküle mit kleinen Farbstoffmolekülen markiert, die bei äußerer Anregung aufleuchten und so ihre Position verraten. Integrative Modellierungsansätze kombinieren solche experimentellen Daten mit rechnerischen Methoden, um eine höhere Strukturauflösung zu erreichen und Dynamiken zu berücksichtigen.

Dr. Christian Hanke, Postdoktorand am Institut für Molekulare Physikalische Chemie der HHU und Erstautor des Artikels, betont: „Fluoreszenzexperimente liefern detaillierte Informationen und sind daher eine hervorragende Datenquelle für integrative Modellierung. Um diese Fülle an Informationen jedoch voll auszuschöpfen, muss Es muss einer breiten wissenschaftlichen Gemeinschaft zugänglich und nutzbar gemacht werden.“

In der Publikation präsentiert das Forschungsteam der HHU, der Rutgers State University of New Jersey und der University of California in San Francisco eine standardisierte Datenbeschreibung in Form von drei verknüpften „Wörterbüchern“, die in einer gemeinsamen Bibliothek organisiert sind.

Prof. Dr. Claus Seidel von der HHU, einer der beiden korrespondierenden Autoren, sagt: „Dieses Organisationsprinzip mit kombinierten Wörterbüchern ermöglicht es Forschern erstmals, integrative Strukturmodelle auf Basis von Fluoreszenzdaten zusammen mit kinetischen Informationen zu speichern. Gleichzeitig wird das Allgemeine.“ Definitionen können auch von anderen Methoden verwendet werden, um dynamische Eigenschaften von Biomolekülen neben ihrer Struktur in der Datenbank zu dokumentieren.“

Dieser Ansatz ist notwendig, um statische Strukturmodelle mit der zugrunde liegenden Energielandschaft – also den Energieunterschieden zwischen verschiedenen dreidimensionalen Anordnungen der Bausteine ​​innerhalb des Biomoleküls – zu verknüpfen. Prof. Seidel sagt: „Diese Informationen ermöglichen es, die nächste Generation KI-basierter Programme zur Vorhersage dynamischer biomolekularer Strukturen zu entwickeln und zu trainieren. Hier können die aus Fluoreszenzexperimenten gewonnenen Daten zur funktionsrelevanten Dynamik einen sehr wichtigen Beitrag leisten.“

Weitere Informationen:
Christian A. Hanke et al., Fluoreszenzbasierte integrative Strukturen und zugehörige kinetische Informationen zugänglich machen, Naturmethoden (2024). DOI: 10.1038/s41592-024-02428-x

Bereitgestellt von der Heinrich-Heine-Universität Düsseldorf

ph-tech