Biologen und andere Wissenschaftler sind heutzutage mit einem tiefen Meer von Daten und einer verwirrenden Palette von Werkzeugen konfrontiert, die darauf angewendet werden können – viele davon erfordern einen Spezialisten, um sie zu bedienen. Eines einzustellen ist eine Herausforderung und die Auslagerung der Arbeit kann Monate dauern … aber LatchBio bietet eine Option, mit der Sie Ihre Daten in Sekundenschnelle durch AlphaFold und andere erstklassige Tools laufen lassen können. Das Unternehmen hat gerade 28 Millionen US-Dollar aufgebracht, um seine zunehmend relevante Plattform auszubauen.
Im Grunde geht es nur darum, dass Wissenschaftler nicht alle Datenwissenschaftler sind.
„Biologen, so großartig sie auch in Biologie, Pipettieren und Laborkram sind … sie sind scheiße beim Programmieren“, sagte Alfredo Andere, Mitbegründer und CEO von LatchBio. Aber die Revolution in der Biotechnologie wird durch die enorme Zunahme an Daten angetrieben, die aus jedem Experiment stammen.
Es wäre vor ein paar Jahren noch möglich gewesen, es mit einfachen Werkzeugen selbst zu verarbeiten, aber das Volumen hat sich um das Tausendfache und mehr erhöht, und jede neue Entdeckung (wie billigere Genomsequenzierung oder neue Methoden zur Anwendung dieser Daten) treibt es weiter in die Höhe.
„Wenn Sie ein CRISPR-Experiment durchführen, sequenzieren Sie es nach der Bearbeitung im Nasslabor in einer Illumina-Maschine. Es gibt Ihnen eine Datei mit dem RNA-String und den von Ihnen vorgenommenen Änderungen zurück – aber es ist keine davon, sondern 10.000 davon“, fuhr Andere fort. „Wenn Sie nur ein Biologe sind, müssen Sie lernen, CRISPResso zu verwenden, die Befehlszeile zu verwenden, die Abhängigkeiten zu installieren, es mit den richtigen Daten zu füttern …“
Die einzig realistische Möglichkeit, mit dieser Menge an Rohdaten umzugehen, besteht darin, sie einem Computerbiologen zu übergeben – eine seltene Art und selten kurzfristig verfügbar.
„Das Problem, das wir immer wieder gesehen haben, ist, dass diese Leute wirklich schwer zu finden sind – es sind wie 20 Biologen auf einen Computerbiologen. Also senden sie ihre Daten und warten, manchmal monatelang“, sagte Andere.
Andere und seine Mitbegründer, CTO Kenny Workman und COO Kyle Griffin, hatten einen Big-Tech-Hintergrund, waren aber von der Branche, in der sie arbeiteten, desillusioniert.
„Bei Google hatten wir diese erstaunlichen Datenpipelines, aber sie dienten der Schaltung von Anzeigen. Dann sahen wir, wie diese Biotech-Unternehmen Krankheiten heilten, aber sie hatten die schlechtesten Datenpipelines der Welt“, sagte er. Warum also nicht die gleiche Leistung und Benutzerfreundlichkeit anwenden, die in einem Google-Tier-Tool zu finden sind, aber für die Verwendung durch Wissenschaftler entwickelt wurden, die keine Zeile Code schreiben können? Das ist die Absicht der Latch-Plattform des Unternehmens, die sich vor allem auf Benutzerfreundlichkeit und Flexibilität konzentriert.
„Sie müssen es den Biologen wirklich einfach machen: Sie brauchen Tools, mit denen sie hochladen, dann etwa drei Parameter eingeben und auf „Ausführen“ klicken können“, sagte Andere. „Wie AlphaFold – es ist ein sehr schweres Modell. Wir haben das in Berkeley gesehen; Sie verbrachten buchstäblich Wochen damit, es auf einem GPU-Cluster zu installieren, und sie konnten es nicht. Es ist einfach so komplex. Wir gaben ihnen unsere Plattform, Sie fügen eine Aminosäuresequenz ein und führen sie aus. Wir hatten [genetic sequencing pioneer] George Church neulich selbst – in buchstäblich 30 Sekunden hatten wir ihn dazu gebracht, AlphaFold auf der Plattform auszuführen.“
Wenn dies alles Wissenschaftler ein wenig zu infantilisieren scheint … fragen Sie einen. Biologen werden wahrscheinlich die ersten sein, die sagen, dass sie sich nicht mit Code befassen wollen. Gute Wissenschaftler sind kluge Leute, aber sie wollen sich im Allgemeinen auf das konzentrieren, was sie am besten können, und nicht eine neue Disziplin lernen, nur um die Datenlawine zu verstehen. Es gibt andere Wissenschaftler, deren eigentlicher Job das ist!
Das Problem tritt auf, wenn man bedenkt, wie vielfältig die Bereiche Biologie und Biotechnologie sind. Jede Domäne, wie Proteomik, Epigenetik und die Dutzende von Unterdomänen darunter, hat Dutzende von einzigartigen Software-Tools und -Prozessen. Während sich einige Plattformen und Methoden, wie Jupyter-Notebooks und dergleichen, in vielen Bereichen zu De-facto-Standards entwickelt haben, richten sie sich an Bioinformatiker und nicht an diejenigen, die in Nasslaboren Schutzbrillen tragen.
„Die Biologie ist so komplex, dass man die verallgemeinerbaren Werkzeuge, die wir für das Software-Engineering entwickelt haben, nicht haben kann“, sagte Andere. „Sie haben also eine Henne-Ei-Situation: Biologen werden es nicht verwenden, wenn es keine Arbeitsabläufe gibt, und es gibt keine Arbeitsabläufe, wenn Menschen es nicht verwenden.“
Sie kamen aus dieser Situation heraus, indem sie, wie er es ausdrückte, ein Huhn kauften. Sie haben selbst populäre Workflows entwickelt und sie Biologen gegeben, dann haben sie dieses Feedback genutzt, um ihr SDK zu verbessern, damit sie mit etwas einfach zu verwendendem zu den Berechnungstypen gehen konnten.
Die Alternative, bemerkte Andere, ist oft so etwas wie das Klonen von GitHub-Repositorys und anderen Notizbüchern oder das Retten von Code aus Papieren und persönlichen Websites. Computational Biologists sind ebensowenig Bestrafungsfresser wie ihre pipettenschwingenden Vettern, also ist alles willkommen, was es ihnen leichter macht. Das Hinzufügen ihres Prozesses zu Latch mithilfe des SDK bedeutet, dass die Wissenschaftler, die ihren Posteingang füllen, dies selbst tun können.
Die Hoffnung und eines der Hauptziele dieser Spendenaktion besteht darin, dass sich die Comp-Bio-Community weiterhin für die Plattform von LatchBio einsetzt und es dem Unternehmen ermöglicht, von populäreren Arbeitsabläufen nach oben zu gehen und die vorhandene Biotech-Infrastruktur zugänglicher zu machen. Viele Unternehmen haben eigene Tools und Stacks, die aber wie der Rest oft nur von Experten bedient werden können. Wenn sich das ändern könnte, entlastet es diese wertvollen Datenexperten, um sie zu erstellen, anstatt sie einfach nur zu implementieren.
„Ein Unternehmen mit 50.000 Mitarbeitern ist derzeit kein Kunde, weil es hundert oder 200 Computerbiologen hat. Aber wenn nur diese Unternehmen es bauen können und kleinere Unternehmen nicht, dann ist das die Chance“, sagte Andere. „Wir bekommen Unternehmen der Serie A und B, die es nicht selbst tun können, und wir arbeiten eng mit ihnen zusammen. Wir wachsen schnell und bald wird dieses Unternehmen der Serie D, das beginnt, sein eigenes aufzubauen, fragen: „Warum tun, wenn LatchBio funktioniert?“ Unternehmen werden viel bezahlen, um dies nicht im eigenen Haus bauen zu müssen.“
Das Unternehmen erwartet bis Ende des Jahres einen ARR von 1 Million US-Dollar, und die Verträge stapeln sich. Andere betonte jedoch, dass die Plattform für Akademiker immer kostenlos sein wird (auch wenn ihre Lizenzsituation schmerzhaft sein kann), die in der Regel lieber einen Monat warten, als fünfstellige Summen auszugeben.
Die 28-Millionen-Dollar-A-Runde wurde gemeinsam von Coatue und Lux Capital geleitet, an der Hummingbird Ventures, Caffeinated Capital, Haystack und Fifty Years teilnahmen.
Andere sagte, sie hoffen, nicht nur das Produkt zu entwickeln, sondern das beste Software-Engineering-Team in der Biotechnologie einzustellen. „Ich denke, junge Leute sind es leid, in Optimierungs- und quantitativen Unternehmen zu arbeiten – es gibt kein Unternehmen in der Biotechnologie, das repräsentiert, zu den besten Software-Ingenieuren der Welt zu gehören und gleichzeitig an weltverändernden Problemen zu arbeiten“, schloss er. Natürlich möchte LatchBio genau das sein.