Ein einfacher und robuster experimenteller Prozess für das Protein-Engineering

Laut einer neuen Studie von Forschern der University of Michigan kann eine Protein-Engineering-Methode, die einfache, kostengünstige Experimente und Modelle des maschinellen Lernens verwendet, vorhersagen, welche Proteine ​​für einen bestimmten Zweck wirksam sein werden.

Die Methode hat ein weitreichendes Potenzial für den Zusammenbau von Proteinen und Peptiden für Anwendungen, von Industriewerkzeugen bis hin zu Therapeutika. Diese Technik kann beispielsweise dazu beitragen, die Entwicklung stabilisierter Peptide zur Behandlung von Krankheiten auf eine Weise zu beschleunigen, die mit aktuellen Medikamenten nicht möglich ist, einschließlich der Verbesserung der ausschließlichen Bindung von Antikörpern an ihre Ziele in der Immuntherapie.

„Die Regeln, die die Funktionsweise von Proteinen regeln, von der Sequenz über die Struktur bis zur Funktion, sind so kompliziert. Es ist besonders spannend, zur Interpretierbarkeit von Protein-Engineering-Bemühungen beizutragen“, sagte Marshall Case, Doktorand der Chemieingenieurwissenschaften an der UM und Erstautor des Buches Studie.

Derzeit nutzen die meisten Protein-Engineering-Experimente komplexe, arbeitsintensive Methoden und teure Instrumente, um sehr genaue Daten zu erhalten. Der lange Prozess begrenzt die Menge der Daten, die erfasst werden können, und die komplizierten Methoden sind schwierig zu erlernen und auszuführen – ein Kompromiss für die Präzision.

„Unsere Methode hat gezeigt, dass man diese komplizierten Methoden bei vielen Anwendungen vermeiden kann“, sagte Case, jetzt Computerbiologe bei Manifold Biotechnologies.

Die aktualisierte Methode beginnt mit der Sortierung von Zellen in zwei Gruppen, die sogenannte binäre Sortierung, basierend darauf, ob sie ein gewünschtes Merkmal – wie die Bindung an fluoreszierende Moleküle – aufweisen oder nicht. Anschließend werden die Zellen sequenziert, um die zugrunde liegenden DNA-Codes für die interessierenden Proteine ​​zu erhalten. Algorithmen des maschinellen Lernens reduzieren dann das Rauschen in den Sequenzierungsdaten, um das bestmögliche Protein zu identifizieren.

„Anstatt das ‚beste Buch‘ aus der Bibliothek auszuwählen, ist es so, als würde man viele Bücher lesen und dann verschiedene Seiten aus verschiedenen Geschichten zusammensetzen, um das bestmögliche Buch zu finden, auch wenn es nicht in der ursprünglichen Bibliothek war“, sagte Greg Thurber, außerordentlicher Professor für Chemieingenieurwesen an der UM und korrespondierender Autor des Artikels. „Ich war überrascht, wie robust diese Technik ist, die einfache, binäre Sortierdaten verwendet.“

Um die Zugänglichkeit weiter zu verbessern, verwendet die Methode lineare Modelle des maschinellen Lernens, die im Vergleich zu Modellen mit Dutzenden von Parametern einfacher zu interpretieren sind.

„Da wir physikalische Regeln darüber lernen können, wie die Proteine ​​tatsächlich funktionieren, können wir lineare Gleichungen verwenden, um nichtlineares Proteinverhalten zu modellieren und auf diese Weise bessere Medikamente herzustellen“, sagte Case.

Die Forschung ist veröffentlicht im Tagebuch Verfahren der Nationalen Akademie der Wissenschaften und wurde am Advanced Genomics Core, Center for Structural Biology, Biological Mass Spectrometry Facility und Proteomics & Peptide Synthesis Core durchgeführt.

Mehr Informationen:
Marshall Case et al., Maschinelles Lernen zur Vorhersage kontinuierlicher Proteineigenschaften anhand binärer Zellsortierungsdaten und zur Kartierung unsichtbarer Sequenzräume, Verfahren der Nationalen Akademie der Wissenschaften (2024). DOI: 10.1073/pnas.2311726121

Zur Verfügung gestellt von der University of Michigan

ph-tech