Letztes Jahr leitete Salesforce, das Unternehmen, das vor allem für seine Cloud-Verkaufsunterstützungssoftware (und Slack) bekannt ist, ein Projekt namens ProGen zur Entwicklung von Proteinen mithilfe generativer KI. ProGen ist ein Forschungsprojekt, das – wenn es auf den Markt gebracht wird – dazu beitragen könnte, medizinische Behandlungen kostengünstiger als herkömmliche Methoden aufzudecken, so die dahinterstehenden Forscher behauptet in einem Blogbeitrag vom Januar 2023.
ProGen gipfelte in einer in der Fachzeitschrift Nature Biotech veröffentlichten Studie, die zeigte, dass die KI erfolgreich die 3D-Strukturen künstlicher Proteine erzeugen konnte. Aber abgesehen von der Zeitung hatte das Projekt bei Salesforce oder anderswo keine große Bedeutung – zumindest nicht im kommerziellen Sinne.
Das heißt, bis vor kurzem.
Einer der für ProGen verantwortlichen Forscher, Ali Madani, hat ein Unternehmen gegründet, Profluent, dass er hofft, ähnliche Technologien zur Proteinerzeugung aus dem Labor in die Hände von Pharmaunternehmen zu bringen. In einem Interview mit Tech beschreibt Madani die Mission von Profluent als „Umkehr des Arzneimittelentwicklungsparadigmas“, beginnend mit den Patienten- und Therapiebedürfnissen und rückwärts arbeitend, um „maßgeschneiderte“ Behandlungslösungen zu schaffen.
„Viele Medikamente – zum Beispiel Enzyme und Antikörper – bestehen aus Proteinen“, sagte Madani. „Letztendlich ist dies also für Patienten gedacht, die ein von der KI entwickeltes Protein als Medikament erhalten würden.“
Während seiner Tätigkeit in der Forschungsabteilung von Salesforce Madani fühlte sich von den Parallelen zwischen natürlicher Sprache (z. B. Englisch) und der „Sprache“ der Proteine angezogen. Proteine – Ketten miteinander verbundener Aminosäuren, die der Körper für verschiedene Zwecke verwendet, von der Herstellung von Hormonen bis zur Reparatur von Knochen- und Muskelgewebe – können wie Wörter in einem Absatz behandelt werden, entdeckte Madani. In ein generatives KI-Modell eingespeist, können Daten über Proteine genutzt werden, um völlig neue Proteine mit neuartigen Funktionen vorherzusagen.
Mit Profluent wollen Madani und Mitbegründer Alexander Meeske, Assistenzprofessor für Mikrobiologie an der University of Washington, das Konzept einen Schritt weiterführen, indem sie es auf die Genbearbeitung anwenden.
„Viele genetisch bedingte Krankheiten können nicht behoben werden [proteins or enzymes] direkt aus der Natur entnommen“, sagte Madani. „Darüber hinaus leiden Gen-Editing-Systeme, die auf neue Fähigkeiten abgestimmt sind, unter funktionalen Kompromissen, die ihre Reichweite erheblich einschränken. Im Gegensatz dazu kann Profluent mehrere Attribute gleichzeitig optimieren, um ein individuelles Design zu erreichen [gene] Editor, der perfekt zu jedem Patienten passt.“
Es ist nicht außerhalb des linken Feldes. Andere Unternehmen und Forschungsgruppen haben praktikable Wege aufgezeigt, wie generative KI zur Vorhersage von Proteinen eingesetzt werden kann.
Nvidia veröffentlichte 2022 ein generatives KI-Modell, MegaMolBART, das anhand eines Datensatzes von Millionen von Molekülen trainiert wurde, um nach potenziellen Wirkstoffzielen zu suchen und chemische Reaktionen vorherzusagen. Meta ausgebildet ein Modell namens ESM-2 für Proteinsequenzen, ein Ansatz, mit dem das Unternehmen nach eigenen Angaben Sequenzen für mehr als 600 Millionen Proteine in nur zwei Wochen vorhersagen konnte. Und DeepMind, das KI-Forschungslabor von Google, verfügt über ein System namens AlphaFold, das vollständige Proteinstrukturen vorhersagt und dabei eine Geschwindigkeit und Genauigkeit erreicht, die ältere, weniger komplexe algorithmische Methoden bei weitem übertrifft.
Profluent trainiert KI-Modelle anhand riesiger Datensätze – Datensätze mit über 40 Milliarden Proteinsequenzen –, um neue Systeme zur Genbearbeitung und Proteinproduktion zu erstellen und bestehende Systeme zu optimieren. Anstatt selbst Behandlungen zu entwickeln, plant das Startup, mit externen Partnern zusammenzuarbeiten, um „genetische Medikamente“ mit den vielversprechendsten Zulassungswegen zu entwickeln.
Madani behauptet, dass dieser Ansatz den Zeit- und Kapitalaufwand, der normalerweise für die Entwicklung einer Behandlung erforderlich ist, drastisch reduzieren könnte. Laut der Industriegruppe PhRMA dauert die Entwicklung eines neuen Arzneimittels von der ersten Entdeckung bis zur behördlichen Zulassung durchschnittlich 10 bis 15 Jahre. Jüngste Schätzungen Die Kosten für die Entwicklung eines neuen Medikaments belaufen sich inzwischen auf mehrere hundert Millionen bis 2,8 Milliarden US-Dollar.
„Viele wirkungsvolle Medikamente wurden tatsächlich zufällig entdeckt und nicht absichtlich entwickelt“, sagte Madani. „[Profluent’s] Diese Fähigkeit bietet der Menschheit die Chance, von der zufälligen Entdeckung zur bewussten Entwicklung unserer am meisten benötigten Lösungen in der Biologie überzugehen.“
Das in Berkeley ansässige Unternehmen Profluent mit 20 Mitarbeitern wird von großen Risikokapitalgebern unterstützt, darunter Spark Capital (das die jüngste Finanzierungsrunde des Unternehmens in Höhe von 35 Millionen US-Dollar anführte), Insight Partners, Air Street Capital, AIX Ventures und Convergent Ventures. Auch Google-Chefwissenschaftler Jeff Dean hat seinen Beitrag geleistet und der Plattform zusätzliche Glaubwürdigkeit verliehen.
Der Schwerpunkt von Profluent wird in den nächsten Monaten auf der Aktualisierung seiner KI-Modelle liegen, unter anderem durch die Erweiterung der Trainingsdatensätze, sagt Madani, sowie auf der Kunden- und Partnerakquise. Es muss sich aggressiv bewegen; Konkurrenten, darunter EvolutionaryScale und Basecamp Research, trainieren schnell ihre eigenen proteingenerierenden Modelle und sammeln riesige Summen an VC-Geld.
„Wir haben unsere erste Plattform entwickelt und wissenschaftliche Durchbrüche bei der Genbearbeitung erzielt“, sagte Madani. „Jetzt ist es an der Zeit, mit Partnern zu skalieren und Lösungen zu ermöglichen, die unseren Ambitionen für die Zukunft entsprechen.“