Vikas Nanda hat mehr als zwei Jahrzehnte damit verbracht, die Feinheiten von Proteinen zu studieren, den hochkomplexen Substanzen, die in allen lebenden Organismen vorhanden sind. Der Rutgers-Wissenschaftler hat lange darüber nachgedacht, wie die einzigartigen Muster von Aminosäuren, aus denen Proteine bestehen, bestimmen, ob sie zu irgendetwas von Hämoglobin bis Kollagen werden, sowie über den anschließenden, mysteriösen Schritt der Selbstorganisation, bei dem nur bestimmte Proteine zusammenklumpen, um noch komplexere Substanzen zu bilden .
Als Wissenschaftler also ein Experiment durchführen wollten, bei dem ein Mensch – einer mit einem profunden, intuitiven Verständnis des Proteindesigns und der Selbstorganisation – den Vorhersagefähigkeiten eines künstlich intelligenten Computerprogramms gegenübersteht, stellte Nanda, ein Forscher am Center for Advanced Biotechnology and Medizin (CABM) bei Rutgers, stand ganz oben auf der Liste.
Jetzt liegen die Ergebnisse vor, um zu sehen, wer – oder was – besser vorhersagen könnte, welche Proteinsequenzen am erfolgreichsten kombiniert werden würden. Nanda berichtet zusammen mit Forschern des Argonne National Laboratory in Illinois und Kollegen aus dem ganzen Land Naturchemie dass der Kampf knapp, aber entscheidend war. Der Wettbewerb, in dem Nanda und mehrere Kollegen gegen ein Programm für künstliche Intelligenz (KI) antraten, wurde vom Computerprogramm ganz knapp gewonnen.
Wissenschaftler interessieren sich sehr für die Selbstorganisation von Proteinen, weil sie glauben, dass ein besseres Verständnis ihnen helfen könnte, eine Vielzahl revolutionärer Produkte für medizinische und industrielle Zwecke zu entwickeln, wie z. B. künstliches menschliches Gewebe für Wunden und Katalysatoren für neue chemische Produkte.
„Trotz unseres umfassenden Fachwissens hat die KI bei mehreren Datensätzen genauso gut oder besser abgeschnitten, was das enorme Potenzial des maschinellen Lernens zur Überwindung menschlicher Vorurteile zeigt“, sagte Nanda, Professor in der Abteilung für Biochemie und Molekularbiologie bei Rutgers Robert Wood Johnson Medical Schule.
Proteine bestehen aus einer großen Anzahl von Aminosäuren, die Ende an Ende verbunden sind. Die Ketten falten sich zu dreidimensionalen Molekülen mit komplexen Formen. Die genaue Form jedes Proteins zusammen mit den darin enthaltenen Aminosäuren bestimmt, was es tut. Einige Forscher, wie Nanda, beschäftigen sich mit „Proteindesign“ und erstellen Sequenzen, die neue Proteine produzieren. Kürzlich haben Nanda und ein Forscherteam ein synthetisches Protein entwickelt, das VX, einen gefährlichen Nervenkampfstoff, schnell erkennt und den Weg für neue Biosensoren und Behandlungen ebnen könnte.
Aus weitgehend unbekannten Gründen werden sich Proteine mit anderen Proteinen selbst zusammensetzen, um Überstrukturen zu bilden, die in der Biologie wichtig sind. Manchmal scheinen Proteine einem Design zu folgen, beispielsweise wenn sie sich selbst zu einer schützenden äußeren Hülle eines Virus, dem so genannten Kapsid, zusammenfügen. In anderen Fällen bauen sie sich selbst zusammen, wenn etwas schief geht, und bilden tödliche biologische Strukturen, die mit so unterschiedlichen Krankheiten wie Alzheimer und Sichelzellen in Verbindung gebracht werden.
„Das Verständnis der Selbstorganisation von Proteinen ist von grundlegender Bedeutung, um Fortschritte in vielen Bereichen zu erzielen, einschließlich Medizin und Industrie“, sagte Nanda.
In dem Experiment erhielten Nanda und fünf weitere Kollegen eine Liste von Proteinen und wurden gebeten, vorherzusagen, welche sich wahrscheinlich selbst zusammensetzen würden. Ihre Vorhersagen wurden mit denen des Computerprogramms verglichen.
Die menschlichen Experten wählten anhand von Faustregeln, die auf ihrer Beobachtung des Proteinverhaltens in Experimenten basieren, einschließlich Muster elektrischer Ladungen und Grad der Abneigung gegen Wasser, 11 Proteine aus, von denen sie vorhersagten, dass sie sich selbst zusammensetzen würden. Das Computerprogramm, das auf einem fortschrittlichen maschinellen Lernsystem basiert, wählte neun Proteine aus.
Die Menschen lagen bei sechs der elf von ihnen gewählten Proteine richtig. Das Computerprogramm verdiente einen höheren Prozentsatz, da sechs der neun empfohlenen Proteine in der Lage waren, sich selbst zusammenzubauen.
Das Experiment zeigte, dass die menschlichen Experten einige Aminosäuren gegenüber anderen „bevorzugten“, was sie manchmal zu falschen Entscheidungen führte. Außerdem wies das Computerprogramm korrekterweise auf einige Proteine mit Eigenschaften hin, die sie nicht zu einer offensichtlichen Wahl für die Selbstorganisation machten, was die Tür für weitere Untersuchungen öffnete.
Die Erfahrung hat Nanda, einst ein Zweifler des maschinellen Lernens für Untersuchungen zum Zusammenbau von Proteinen, offener für die Technik gemacht.
„Wir arbeiten daran, ein grundlegendes Verständnis der chemischen Natur von Wechselwirkungen zu erlangen, die zur Selbstorganisation führen, daher befürchtete ich, dass die Verwendung dieser Programme wichtige Erkenntnisse verhindern würde“, sagte Nanda. „Aber was ich langsam wirklich verstehe, ist, dass maschinelles Lernen nur ein weiteres Werkzeug ist, wie jedes andere auch.“
Mehr Informationen:
Rohit Batra et al., Maschinelles Lernen überwindet menschliche Voreingenommenheit bei der Entdeckung von selbstorganisierenden Peptiden, Naturchemie (2022). DOI: 10.1038/s41557-022-01055-3