Together sammelt 20 Millionen US-Dollar für die Entwicklung generativer Open-Source-KI-Modelle

Generative KI – KI, die Essays schreiben, Kunstwerke und Musik erstellen und mehr erstellen kann – erregt weiterhin große Aufmerksamkeit bei Investoren. Einer Quelle zufolge haben generative KI-Startups im ersten Quartal 2023 1,7 Milliarden US-Dollar eingesammelt, mit weiteren Deals im Wert von 10,68 Milliarden US-Dollar angekündigt im Quartal, aber noch nicht abgeschlossen.

Es gibt jede Menge Konkurrenz, darunter etablierte Unternehmen wie OpenAI und Anthropic. Aber trotz dieser Tatsache scheuen VCs nicht vor unerprobten Spielern und Nachwuchsspielern zurück.

Ein typisches Beispiel: Zusammen, ein Startup, das generative Open-Source-KI entwickelt, gab heute bekannt, dass es 20 Millionen US-Dollar eingesammelt hat – den größeren Teil für eine Seed-Runde – angeführt von Lux Capital mit Beteiligung von Factory, SV Angel, First Round Capital, Long Journey Ventures, Robot Ventures, Definition Capital, Susa Ventures, Cadenza Ventures und SCB 10x. Beteiligt waren auch mehrere hochkarätige Angel-Investoren, darunter Scott Banister, einer der Mitbegründer von PayPal, und Jeff Hammerbacher, ein Gründungsmitarbeiter von Cloudera.

„Together ist Vorreiter für den ‚Linux-Moment‘ der KI, indem es ein offenes Ökosystem für Computer und erstklassige Basismodelle bereitstellt“, sagte Brandon Reeves von Lux Capital per E-Mail gegenüber Tech. „Das Together-Team setzt sich dafür ein, ein lebendiges offenes Ökosystem zu schaffen, an dem jeder, von Einzelpersonen bis hin zu Unternehmen, teilnehmen kann.“

Together wurde im Juni 2022 ins Leben gerufen und ist die Idee von Vipul Ved Prakash, Ce Zhang, Chris Re und Percy Liang. Prakash gründete zuvor die Social-Media-Suchplattform Topsy, die 2013 von Apple übernommen wurde, wo er später Senior Director wurde. Zhang ist außerordentlicher Professor für Informatik an der ETH Zürich, befindet sich derzeit in einem Forschungssemester und leitet die Forschung im Bereich „dezentraler“ KI. Was Re betrifft, ist er Mitbegründer verschiedener Startups, darunter SambaNova, das Hardware und integrierte Systeme für KI entwickelt. Und Liang, Informatikprofessor an der Stanford University, leitet das Center for Research on Foundation Models (CRFM) der Universität.

Mit Together wollen Prakash, Zhang, Re und Liang generative Open-Source-KI-Modelle und -Dienste entwickeln, die, in ihren Worten, „Organisationen dabei helfen, KI in ihre Produktionsanwendungen zu integrieren“. Zu diesem Zweck baut Together eine Cloud-Plattform für den Betrieb, das Training und die Feinabstimmung von Open-Source-Modellen auf, von der die Mitbegründer behaupten, dass sie skalierbare Rechenleistung zu „dramatisch niedrigeren“ Preisen als die dominanten Anbieter (z. B. Google Cloud, AWS, Azure, usw.)

„Wir glauben, dass generative Modelle eine Folgetechnologie für die Gesellschaft sind und offene und dezentrale Alternativen zu geschlossenen Systemen von entscheidender Bedeutung sein werden, um die besten Ergebnisse für KI und Gesellschaft zu ermöglichen“, sagte Prakash gegenüber Tech in einem E-Mail-Interview. „Wenn Unternehmen ihre generativen KI-Strategien definieren, achten sie auf Datenschutz, Transparenz, Anpassung und einfache Bereitstellung. Aktuelle Cloud-Angebote mit Closed-Source-Modellen und -Daten werden ihren Anforderungen nicht gerecht.“

Er hat Recht – zumindest insofern, als die Amtsinhaber den Druck spüren. Ein internes Google-Memo durchgesickert Anfang des Monats deutet dies darauf hin, dass der Suchriese – und auch seine Konkurrenten – auf lange Sicht nicht mit Open-Source-KI-Initiativen konkurrieren können. Unterdessen bereitet sich OpenAI Berichten zufolge darauf vor, sein erstes Open-Source-KI-Modell zur Textgenerierung öffentlich vorzustellen, inmitten einer Vielzahl von Open-Source-Alternativen.

Eines der ersten Projekte von Together, Roter Pyjamazielt darauf ab, eine Reihe generativer Open-Source-Modelle zu fördern, darunter „Chat“-Modelle nach dem Vorbild von OpenAIs ChatGPT. Eine gemeinsame Arbeit zwischen Together und mehreren Gruppen, darunter dem MILA Québec AI Institute, CRFM und dem Data Science Lab der ETH, DS3Lab, RedPajama begann mit der Veröffentlichung eines Datensatzes, der es Organisationen ermöglicht, Modelle vorab zu trainieren, die freizügig lizenziert werden können.

Zu den weiteren bisherigen Bemühungen von Together gehören GPT-JT, eine Abzweigung des Open-Source-Textgenerierungsmodells GPT-J-6B (veröffentlicht von der Forschungsgruppe EleutherAI), und OpenChatKit, ein Versuch eines ChatGPT-Äquivalents.

„Heutzutage ist das Training, die Feinabstimmung oder die Produktion generativer Open-Source-Modelle eine große Herausforderung“, sagte Prakash. „Aktuelle Lösungen erfordern, dass Sie über umfassende KI-Kenntnisse verfügen und gleichzeitig in der Lage sind, die erforderliche große Infrastruktur zu verwalten. Die Together-Plattform bewältigt beide Herausforderungen sofort und bietet eine benutzerfreundliche und zugängliche Lösung.“

Es bleibt jedoch abzuwarten, wie nahtlos Together ist – die Plattform muss in GA noch eingeführt werden. Und man könnte argumentieren, dass seine Bemühungen im Kontext der breiteren KI-Landschaft etwas duplizierend sind. Die Anzahl der Open-Source-Modelle sowohl von Community-Gruppen als auch von großen Labors wächst von Tag zu Tag, praktisch. Und obwohl nicht alle für die kommerzielle Nutzung lizenziert sind, sind es einige, wie Dolly 2.0 von Databricks.

Im Bereich der KI-Hardware-Infrastruktur behaupten neben den großen Public-Cloud-Anbietern auch Start-ups wie CoreWeave, leistungsstarke Rechenleistung zu unter dem Marktpreis liegenden Preisen anzubieten. Es gab sogar Versuche, von der Community betriebene, kostenlose Dienste für die Ausführung von KI-Modellen zur Textgenerierung zu entwickeln. (Together beabsichtigt, in die Fußstapfen dieser Community-Gruppen zu treten und eine Plattform aufzubauen, die vorläufig „Together Decentralized Cloud“ genannt wird und Hardware-Ressourcen, einschließlich GPUs, von Freiwilligen aus dem Internet bündelt.)

Was bringt Together also mit sich? Mehr Transparenz, Kontrolle und Privatsphäre, argumentiert Prakash. Es ist ein Verkaufsargument, das dem des Startups Stability AI nicht unähnlich ist, das Rechenleistung und Kapital in die Open-Source-Forschung lenkt und gleichzeitig die verschiedenen fertigen Produkte kommerzialisiert – und zusätzlich Dienstleistungen verkauft.

„Regulierte Unternehmen werden große Kunden von Open Source sein, da auf offenen Datensätzen vorab trainierte Open-Source-Modelle es Unternehmen ermöglichen, die Modelle vollständig zu prüfen, zu verstehen und an ihre eigenen Anwendungen anzupassen“, sagte er. „Wir glauben, dass die Herausforderungen der KI nur durch die Zusammenarbeit einer globalen Gemeinschaft bewältigt werden können. Deshalb haben wir es uns zur Aufgabe gemacht, ein sich selbst tragendes, offenes Ökosystem aufzubauen und zu verwalten, das die besten KI-Systeme für die Menschheit hervorbringt.“

Es ist gewiss ein hohes Ziel. Und Together ist noch in den Kinderschuhen und kann nicht sagen, ob es derzeit Kunden hat – geschweige denn Einnahmen. Doch das Unternehmen schreitet voran und plant, die Größe seines Teams bis Ende des Jahres von 24 Mitarbeitern auf rund 40 zu erhöhen und den Rest des Startkapitals in Forschung und Entwicklung, Infrastruktur und Produktentwicklung zu investieren.

„Die Together-Lösung, die auf generativen Open-Source-Modellen basiert, basiert auf dem Verständnis der Anforderungen großer Organisationen und der Berücksichtigung jedes dieser Bedürfnisse, um Unternehmen die Kernplattform für ihre generative KI-Strategie bereitzustellen“, sagte Prakash. „Together verzeichnet ein enormes Interesse von Unternehmen, die nach mehr Transparenz, Kontrolle und Datenschutz suchen.“

tch-1-tech