KI-Codierungsassistent Supermaven erhält Geld von den Mitbegründern von OpenAI und Perplexity

Jacob Jackson setzte schon früh in seiner Karriere voll auf KI.

Jackson war Mitbegründer von Tabnine, dem KI-Codierungsassistenten, der fast 60 Millionen US-Dollar an Risikokapital einsammelte, während er noch Informatikstudent an der University of Waterloo war. Nachdem er Tabnine 2019 (während seiner Abschlussprüfungen) an Codata verkauft hatte, kam Jackson als Praktikant zu OpenAI, wo er bis 2022 arbeitete.

Zu diesem Zeitpunkt verspürte Jackson den Drang, erneut ein Unternehmen zu gründen, das sich auf die Unterstützung gängiger Entwickler-Workflows konzentrierte.

„In den Jahren, seit ich Tabnine entwickelt habe, haben Tools wie ChatGPT und Github Copilot die Arbeitsweise von Entwicklern verändert“, sagte Jackson gegenüber Tech. „Es ist eine wirklich spannende Zeit, an Entwicklertools zu arbeiten, denn die zugrundeliegende Technologie hat sich seit der Gründung von Tabnine so sehr verbessert – was dazu geführt hat, dass sich viel mehr Entwickler für die Verwendung von KI-Tools zur Beschleunigung ihres Workflows interessieren.“

Also begann Jackson Supermaveneine KI-Codierungsplattform ähnlich wie Tabnine, jedoch mit einigen Verbesserungen in Bezug auf Lebensqualität und Technik.

Supermavens eigenes generatives KI-Modell namens Babble kann dank eines Kontextfensters mit einer Million Token eine Menge Code auf einmal verstehen, sagt Jackson. (In der Datenwissenschaft sind Token unterteilte Rohdaten – wie die Silben „fan“, „tas“ und „tic“ im Wort „fantastic“.)

Der Kontext oder das Kontextfenster eines Modells bezieht sich auf Eingabedaten (z. B. Code), die das Modell berücksichtigt, bevor es eine Ausgabe (z. B. zusätzlichen Code) generiert. Ein langer Kontext kann verhindern, dass Modelle den Inhalt aktueller Dokumente und Daten „vergessen“ und vom Thema abschweifen und falsche Schlussfolgerungen ziehen.

„Unser großes Kontextfenster trägt dazu bei, die Häufigkeit von Halluzinationen zu reduzieren, da es dem Modell ermöglicht, Antworten aus dem Kontext zu ziehen, in Situationen, in denen es sonst raten müsste“, sagte Jackson.

Eine Million Token ist in der Tat ein großes Kontextfenster. Aber es ist nicht größer als das des KI-Codierungs-Startups Magic, das 100 Millionen Token umfasst. Unterdessen entspricht das kürzlich von Google eingeführte Tool Code Assist dem Kontext von Supermaven mit 1 Million Token.

Was sind also die Vorteile von Supermaven gegenüber der Konkurrenz? Jackson behauptet, dass Babble dank einer „neuen neuronalen Architektur“ eine geringere Latenz aufweist. Er wollte nicht weiter darauf eingehen, außer dass die Architektur „von Grund auf neu“ entwickelt wurde.

„Supermaven benötigt 10 bis 20 Sekunden, um das Code-Repository eines Entwicklers zu verarbeiten und sich mit dessen APIs und den einzigartigen Konventionen seiner Codebasis vertraut zu machen“, sagte Jackson. „Dank unserer hauseigenen Modell-Serving-Infrastruktur ist die Latenzzeit geringer, und unser Tool reagiert auch dann, wenn es mit den langen Eingabeaufforderungen arbeitet, die bei großen Codebasen auftreten.“

Der Markt für KI-Codierungstools ist groß und wächst. Polaris Research projizieren dass es bis 2032 einen Wert von 27,17 Milliarden Dollar haben wird. überwiegende Mehrheit der Teilnehmer an GitHubs jüngster Entwicklerumfrage geben an, dass sie KI-Tools in irgendeiner Form eingeführt haben, und über 1,8 Millionen Menschen – und etwa 50.000 Unternehmen – zahlen für GitHub Copilot.

Aber Supermaven muss – zusammen mit Startup-Konkurrenten wie Cognition, Anysphere, Poolside, Codeium und Augment – ​​ethische und rechtliche Herausforderungen bewältigen.

Unternehmen sind oft vorsichtig, wenn es darum geht, proprietären Code Dritten preiszugeben. So zum Beispiel Apple Berichten zufolge hat seinen Mitarbeitern letztes Jahr die Nutzung von Copilot untersagt, da sie sich Sorgen um vertrauliche Datenlecks machten. Einige Code-generierende Tools, die mit restriktiv lizenziertem oder urheberrechtlich geschütztem Code trainiert wurden, wurden gezeigt diesen Code auf eine bestimmte Art und Weise wiederzugeben, was ein Haftungsrisiko darstellt (d. h. Entwickler, die den Code einbauen, könnten verklagt werden). Und weil KI Fehler macht, können unterstützende Codierungstools dazu führen, mehr fehlerhafter und unsicherer Code in Codebasen gepusht werden.

Jackson sagte, dass Supermaven keine Kundendaten verwendet, um seine Modelle zu trainieren. Er gab jedoch zu, dass das Unternehmen die Daten eine Woche lang speichert, um „das System schnell und reaktionsfähig zu machen“, sagte er. Zum Thema Urheberrecht bestritt Jackson nicht ausdrücklich, dass Babble mit IP-geschütztem Code trainiert wurde – nur, dass es „fast ausschließlich mit öffentlich verfügbarem Code und nicht mit einem Ausschnitt des öffentlichen Internets trainiert wurde“, um „die Belastung durch toxische Inhalte während des Trainings zu verringern“.

Die Kunden scheinen sich davon nicht abschrecken zu lassen. Mehr als 35.000 Entwickler nutzen Supermaven, sagt Jackson, und ein beträchtlicher Teil davon zahlt für die Premium-Pläne Pro (10 USD pro Monat) und Team (10 USD pro Monat und Nutzung). Supermavens jährlicher Umsatz erreichte dieses Jahr 1 Million USD, und das dank einer Benutzerbasis, die sich seit dem Start der Plattform im Februar verdreifacht hat.

Diese Dynamik erregte die Aufmerksamkeit der VCs.

Supermaven gab diese Woche seine erste externe Finanzierung bekannt: eine Runde von 12 Millionen Dollar, angeführt von Bessemer Venture Partners und namhaften Angel-Investoren, darunter OpenAI-Mitbegründer John Schulman und Perplexity-Mitbegründer Denis Yarats. Jackson sagt, der Plan sei, das Geld für die Einstellung von Entwicklern auszugeben (Supermaven hat derzeit ein fünfköpfiges Team) und für die Entwicklung des Texteditors von Supermaven, der sich derzeit in der Betaphase befindet.

„Wir planen, bis zum Jahresende deutlich zu wachsen“, fügte er hinzu. „Trotz des Gegenwinds für die Technologie insgesamt wächst der Markt für Coding-Copiloten schnell. Unser Wachstum seit unserem Start im Februar – sowie unsere jüngste Finanzierungsrunde – positionieren uns gut für das nächste Jahr.“

tch-1-tech