Eine neue ungarische Methode könnte die Proteinforschung unterstützen

In einem kürzlich erschienenen Artikel veröffentlicht In NaturkommunikationDie HUN-REN-ELTE Protein Modeling Research Group (Institut für Chemie) hat die Grundlagen für eine mathematische Methode gelegt, die den computergestützten Vergleich der dreidimensionalen Strukturen von Proteinen ermöglicht. Die Methode ist insofern einzigartig, als dass die bisher verfügbaren Alternativen nur die Position der Atome berücksichtigten, während die neue Technik namens LoCoHD (Local Composition Hellinger Distance) auch die chemischen Informationen der Atome berücksichtigt.

Proteine ​​sind molekulare Maschinen, die für die Funktion von Zellen notwendige Prozesse ausführen. Sie fungieren als molekulare Schalter, übertragen Informationen von der DNA, transportieren kleine und große Moleküle und regulieren chemische Reaktionen, die mit dem Stoffwechsel zusammenhängen. Damit all dies gelingt, muss das betreffende Protein jedoch die richtige räumliche Konformation aufweisen, also seine eigene, korrekte 3D-Anordnung.

Es stehen mehrere experimentelle Methoden zur Verfügung (Röntgenkristallographie, Kernspinresonanzspektroskopie, Kryo-Elektronenmikroskopie), um die Anordnung der Atome in einem Protein zu bestimmen. In den letzten Jahrzehnten haben Proteinforscher die Form von fast 220.000 Proteinen entdeckt. Diese Ergebnisse erfordern zunehmend die Entwicklung von Computermethoden, mit denen diese Anordnungen analysiert werden können.

Eine solche Methode ist der Algorithmus LoCoHD, der von Zsolt Fazekas entwickelt wurde, einem Doktoranden an der ELTE Hevesy György School of Chemistry und Forscher in der Forschungsgruppe von Dr. András Perczel. Der Algorithmus vergleicht lokale Umgebungen um Aminosäuren in Proteinen basierend auf ihrer chemischen Natur (z. B. Elementzusammensetzung, Ladung, Hydrophobie usw.).

Die Methode ermittelt auf einer einfachen Skala von 0 bis 1, wie sehr sich die untersuchten Strukturen voneinander unterscheiden. Werte nahe 0 deuten auf eine hohe Ähnlichkeit zwischen Atomanordnungen und chemischen Eigenschaften hin, während Werte nahe 1 darauf hinweisen, dass die verglichenen Proteine ​​möglicherweise sehr unterschiedliche Eigenschaften haben. Der daraus resultierende numerische Wert (eine sogenannte Metrik) kann also dazu verwendet werden, neue Informationen über das untersuchte System zu erhalten.

Der Algorithmus verwendet ein mehrstufiges Protokoll, um die Zahlen zu generieren, die die strukturellen Unterschiede darstellen. Im ersten Schritt wandelt er reale Atome im Protein in sogenannte primitive Atome um. Diese können als virtuell markierte Positionen dargestellt werden, deren Markierungen die chemische Natur des ursprünglichen Atoms verraten.

So kann ein primitives Atom beispielsweise ein „positiv geladener Stickstoff“, ein „negativ geladener Sauerstoff“, ein „neutral geladener Sauerstoff“, ein „aromatischer Kohlenstoff“ usw. sein. Die Bezeichnungen werden nach einem sogenannten primitiven Typisierungsschema generiert, das uns in tabellarischer Form erklärt, wie wir reale Atome in primitive Atome umwandeln. Der Benutzer kann diese Tabelle frei angeben und so die chemische Auflösung der Methode festlegen.

Der zweite Schritt besteht darin, die Referenzpunkte des Vergleichs zu bestimmen, indem eine Teilmenge primitiver Atome ausgewählt wird. Diese ausgewählten speziellen primitiven Atome werden Ankeratome genannt. Für jedes ausgewählte Ankeratompaar führt der Algorithmus einen Vergleichsschritt durch, dessen Ergebnis das gewünschte Maß für die Unähnlichkeit ergibt. Diese Zahlen können auf lokaler Ebene verwendet oder zu einem einzigen Deskriptor gemittelt werden, der das gesamte Protein charakterisiert.

In der Studie hoben die Forscher hervor, dass die Methode auch bei den zweijährlich stattfindenden CASP-Wettbewerben (Critical Assessment of Protein Structure Prediction) eingesetzt werden kann, einem bekannten Wettbewerb auf dem Gebiet der Proteinforschung. Bei dieser Veranstaltung verwenden die Teilnehmer verschiedene Algorithmen, um die Form von Proteinen mit noch unveröffentlichten Strukturen zu modellieren. Die CASP-Juroren verwenden eine Reihe von Strukturvergleichsmethoden, um die Teilnehmer zu bewerten, aber keine davon berücksichtigt die Chemie der lokalen Aminosäureumgebungen.

Anhand der Daten des CASP14-Wettbewerbs 2020 haben die Forscher nun eine vergleichende Analyse mehrerer modellierter Proteine ​​durchgeführt, darunter auch der Strukturen, die mit der auf künstlicher Intelligenz basierenden AlphaFold2-Methode vorhergesagt wurden. Unter diesen hoben sie die Analyse eines Proteins des SARS-CoV-2-Virus namens ORF8 hervor. In den modellierten Strukturen dieses Proteins wurden Aminosäureumgebungen identifiziert, die sich in ihren Interaktionsmustern erheblich von den in der experimentellen Struktur gefundenen Umgebungen unterscheiden.

Neben der Untersuchung statischer Strukturen testeten die Forscher auch, ob sich die Methode zur Analyse der internen Bewegung von Proteinen eignet. Sie nutzten Simulationen, die Molekülbewegungen reproduzieren können, und Daten, die aus Strukturensembles extrahiert wurden. Eines der untersuchten Systeme war das Protein Podocin, das in der Niere lebenswichtige Funktionen erfüllt und dessen Mutationen schwere, oft tödliche Erkrankungen verursachen können.

Mit der LoCoHD-Methode wurden Aminosäuren im Protein identifiziert, die während der Bewegung von Podocin großen chemischen und umweltbedingten Veränderungen unterliegen, die sowohl seine Struktur als auch seine Funktion beeinflussen können. Ebenso wurde die LoCoHD-Methode erfolgreich bei der Untersuchung des HIV-1-Kapsidproteins eingesetzt, bei der eine Aminosäure identifiziert wurde, die für die Bildung der Virushülle entscheidend ist.

Diese Ergebnisse sind nicht nur wissenschaftliche Kuriositäten. Durch eine effektivere Untersuchung der Proteinstrukturen kommen wir auch einem besseren Verständnis der Erreger schwerer Krankheiten und der Entwicklung wirksamer Medikamente und Therapeutika näher.

Mehr Informationen:
Zsolt Fazekas et al, LoCoHD: eine Metrik zum Vergleich lokaler Umgebungen von Proteinen, Naturkommunikation (2024). DOI: 10.1038/s41467-024-48225-0

Zur Verfügung gestellt von der Eötvös Loránd Universität

ph-tech