Ein relativ neues Startup namens Evolutionäre Skala hat sich eine große Summe an Geldern gesichert, um KI-Modelle zur Erzeugung neuartiger Proteine für die wissenschaftliche Forschung zu entwickeln.
EvolutionaryScale gab heute bekannt, dass es in einer Seed-Runde unter der Leitung des ehemaligen GitHub-CEO Nat Friedman, Daniel Gross und Lux Capital mit Beteiligung von Amazon und NVentures, Nvidias Corporate-Venture-Arm, 142 Millionen US-Dollar aufgebracht hat. Das Unternehmen hat außerdem ESM3 veröffentlicht, ein KI-Modell, das es als „Grenzmodell“ für die Biologie beschreibt – eines, das Proteine für Anwendungsfälle wie Arzneimittelforschung und Materialwissenschaft erstellen kann.
„ESM3 macht einen Schritt in Richtung einer Zukunft der Biologie, in der KI ein Werkzeug ist, um von Grund auf zu konstruieren, so wie wir Strukturen, Maschinen und Mikrochips konstruieren und Computerprogramme schreiben“, sagte Alexander Rives, Mitbegründer und Chefwissenschaftler von EvolutionaryScale, in einer Erklärung.
Rives begann 2019 zusammen mit Tom Secru und Sal Candido im KI-Forschungslabor FAIR von Meta mit der Entwicklung generativer KI-Modelle zur Erforschung von Proteinen. Nach der Auflösung ihres Teams verließen Rives, Secru und Candido Meta, um die begonnene Arbeit fortzusetzen.
Die Charakterisierung von Proteinen kann die Mechanismen einer Krankheit aufdecken, einschließlich Möglichkeiten, sie zu verlangsamen oder umzukehren, während Erstellen Proteine können zu völlig neuen Medikamentenklassen, Werkzeugen und Therapeutika führen. Der derzeitige Prozess der Proteinentwicklung im Labor ist jedoch sowohl aus rechnerischer als auch aus personeller Sicht kostspielig.
Bei der Entwicklung eines Proteins muss man eine Struktur entwickeln, die plausibel eine Aufgabe im Körper oder in einem Produkt ausführen und dann eine Proteinsequenz finden – die Abfolge der Aminosäuren, aus denen ein Protein besteht –, die sich wahrscheinlich in die Struktur „falten“ lässt. Proteine müssen sich korrekt in dreidimensionale Formen falten, um ihre beabsichtigte Funktion zu erfüllen.
ESM3 wurde anhand eines Datensatzes von 2,78 Milliarden Proteinen trainiert und kann die Sequenz, Struktur und Funktion von Proteinen „ergründen“, sagt Rives. Das Modell kann so neue Proteine generieren, wie es AlphaFold von Google DeepMind tut. EvolutionaryScale stellt das vollständige Modell mit 98 Milliarden Parametern über seine Cloud-Entwicklerplattform Forge für die nichtkommerzielle Nutzung zur Verfügung und veröffentlicht eine kleinere Version des Modells für die Offline-Nutzung.
EvolutionaryScale behauptet, dass es ESM3 verwendet hat, um eine neue Variante des grün fluoreszierenden Proteins (GFP) zu erzeugen, das für das Leuchten von Quallen und die leuchtenden Farben von Korallen verantwortlich ist. Ein Vorabdruck auf der Website des Unternehmens beschreibt seine Arbeit im Detail.
„Wir haben lange daran gearbeitet und freuen uns, es mit der wissenschaftlichen Gemeinschaft zu teilen und zu sehen, was sie damit machen“, fuhr Rives fort.
EvolutionaryScale ist natürlich keine Wohltätigkeitsorganisation – das Unternehmen mit rund 20 Mitarbeitern teilte Tech mit, dass es durch eine Kombination aus Partnerschaften, Nutzungsgebühren und Umsatzbeteiligungen Geld verdienen will. EvolutionaryScale könnte beispielsweise mit Pharmaunternehmen zusammenarbeiten, um ESM3 in ihre Arbeitsabläufe zu integrieren, oder mit Forschern Umsatzbeteiligungen für bahnbrechende Entdeckungen erzielen, die mithilfe von ESM3 kommerzialisiert werden.
Zu diesem Zweck kündigt EvolutionaryScale an, dass es ESM3 und seine Derivate bald ausgewählten AWS-Kunden über die SageMaker AI-Entwicklungsplattform, die Bedrock AI-Plattform und den HealthOmics-Dienst von AWS zur Verfügung stellen wird. ESM3 wird auch ausgewählten Kunden zur Verfügung stehen, die NVIDIAs NIM-Mikroservices nutzen und mit einer Nvidia-Unternehmenssoftwarelizenz unterstützt werden.
Laut EvolutionaryScale können sowohl AWS- als auch Nvidia-Kunden ESM3 auf Wunsch mithilfe ihrer eigenen Daten optimieren.
Es könnte eine Weile dauern, bis EvolutionaryScale Gewinn macht. Im Pitch Deck des Unternehmens, von dem Forbes eine Kopie hat, gelang es EvolutionaryScale hat im vergangenen August wiederholt betont, dass es ein Jahrzehnt dauern könnte, bis generative KI-Modelle bei der Entwicklung von Therapien helfen. Das Unternehmen muss sich auch gegen Konkurrenten wie DeepMinds Spin-off Isomorphic Labs behaupten, das bereits Verträge mit großen Pharmaunternehmen hat, sowie gegen Insitro, das börsennotierte Unternehmen Recursion und Inceptive.
Die große Investition von EvolutionaryScale besteht darin, das Training seines Modells zu erweitern, um über Proteine hinausgehende Daten einzubeziehen und ein allgemeines KI-Modell für Biotech-Anwendungen zu erstellen.
„Das unglaubliche Tempo neuer KI-Fortschritte wird durch immer größere Modelle, immer größere Datensätze und eine zunehmende Rechenleistung vorangetrieben“, sagte ein Sprecher von EvolutionaryScale. „Dasselbe gilt für die Biologie. In den letzten fünf Jahren hat das ESM-Team in seiner Forschung die Skalierung in der Biologie untersucht. Wir haben festgestellt, dass Sprachmodelle mit der Skalierung ein Verständnis für die zugrunde liegenden Prinzipien der Biologie entwickeln und biologische Strukturen und Funktionen entdecken.“
Für diesen Reporter klingt das extrem ehrgeizig – aber finanzkräftige Investoren sind sicherlich hilfreich.