Ein Startup, dessen Produkt mit GitHub Copilot und anderen KI-gestützten Codierassistenten konkurriert, hat den Status eines Einhorns erreicht.
Am Donnerstag, Codeium gab bekannt, dass es eine von General Catalyst angeführte Finanzierungsrunde der Serie C in Höhe von 150 Millionen US-Dollar abgeschlossen hat, die das Unternehmen nach der Finanzierung mit 1,25 Milliarden US-Dollar bewertet. Die Runde, an der sich auch die bestehenden Investoren Kleiner Perkins und Greenoaks beteiligten, erhöht die Gesamtfinanzierung des Unternehmens auf fast eine Viertelmilliarde Dollar (243 Millionen US-Dollar) – nur drei Jahre nach seiner Gründung.
Codeiums Mitbegründer und CEO Varun Mohan sagte gegenüber Tech, dass Codeium die im Januar eingeworbene Serie-B-Tranche von 65 Millionen Dollar noch nicht einmal angerührt habe. Damals, vor gerade einmal acht Monaten, wurde Codeium mit einer halben Milliarde Dollar bewertet.
„Obwohl wir unsere bestehenden Mittel kaum angetastet haben, glauben wir, dass diese Kapitalspritze es uns ermöglichen wird, F&E und Wachstum deutlich voranzutreiben und gleichzeitig noch größere strategische Investitionen zu tätigen“, sagte er.
Codeium wurde 2021 von Mohan und seinem Jugendfreund und MIT-Kommilitonen Douglas Chen gegründet. Vor Codeium war Chen bei Meta, wo er an der Entwicklung von Softwaretools für VR-Headsets wie das Oculus Quest mitwirkte. Mohan war technischer Leiter bei Nuro, dem Startup für autonome Lieferungen, und verantwortlich für die Leitung des autonomen Infrastrukturteams.
Das Startup begann als radikal anderes Unternehmen namens Exafunction, das sich auf GPU-Optimierung und Virtualisierung für KI-Workloads konzentrierte. Doch im Jahr 2022 erkannten Mohan und Chen eine größere Chance im generativen Coding und beschlossen, sich umzubenennen – und neu auszurichten.
„Trotz der zunehmenden Verbreitung generativer KI-Tools kämpfen Entwickler immer noch mit zeitaufwändigen Codierungsaufgaben“, sagte Mohan. „Viele der KI-gesteuerten Lösungen bieten generische Codeausschnitte, deren Integration und Sicherung in bestehende Codebasen erhebliche manuelle Arbeit erfordert. Hier kommt unsere KI-Codierungsunterstützung ins Spiel.“
Die Plattform von Codeium basiert auf generativen KI-Modellen, die mit öffentlichem Code trainiert wurden, und liefert Vorschläge im Kontext der gesamten Codebasis einer App. Sie unterstützt rund 70 Programmiersprachen und lässt sich in eine Reihe beliebter Entwicklungsumgebungen integrieren, darunter Microsoft Visual Studio und JetBrains.
Um Entwickler von Copilot und anderen Konkurrenten abzuwerben, hat Codeium zu Beginn ein großzügiges kostenloses Kontingent veröffentlicht. Die Strategie scheint aufzugehen: Heute hat das Startup mehr als 700.000 Benutzer und über 1.000 Unternehmenskunden, darunter Anduril, Zillow und Dell.
Quentin Clark, Geschäftsführer von General Catalyst, meinte, Codeium habe einige seiner größeren Aufträge dadurch gewonnen, dass das Unternehmen bei der Produktforschung einen konsequent kundenorientierten Ansatz verfolgte.
„Der Ansatz des Teams war schon immer, seinen Kunden zu folgen, was das Unternehmen dazu veranlasste, Lösungen zu ihren Bedingungen zu entwickeln – die in jeder Umgebung einsetzbar sind und mehr Sprachen unterstützen als jeder andere“, sagte Clark in einer Erklärung. „Was Codeium geschaffen hat, ist nicht nur eine Demo, eine Ankündigung oder eine Idee – dies ist ein vollständig skalierbares Geschäft, bei dem große Unternehmen das Produkt in ihren gesamten Organisationen übernehmen.“
Unternehmen sind oft vorsichtig, wenn es darum geht, proprietären Code Dritten preiszugeben – beispielsweise Apple Berichten zufolge hat seinen Mitarbeitern letztes Jahr die Nutzung von Copilot untersagt, da sie sich Sorgen um vertrauliche Datenlecks machten. Um diese Befürchtungen zu zerstreuen, bietet Codeium neben seinem Standard-Software-as-a-Service-Plan nun auch eine selbst gehostete Installationsoption an.
Unternehmen können den Dienst von Codeium nun auf ihrer eigenen Hardware einsetzen, wenn sie dies wünschen. Oder sie können eine Hybridkonfiguration wählen, bei der sie ihre Daten auf ihren eigenen Geräten speichern und die Server von Codeium für ihre Rechenleistung nutzen.
Datenübertragungen in die Cloud sind immer mit einem gewissen Risiko verbunden, aber Mohan behauptet, dass Codeium eine starke Verschlüsselung nutzt. „Wir trainieren unser proprietäres generatives Autocomplete-Modell niemals mit Benutzerdaten, verkaufen niemals Daten und stellen sicher, dass alle Datenübertragungen verschlüsselt sind“, fügte er hinzu.
Codeium hat außerdem Schritte unternommen, um „nicht freizügig“ lizenzierten Code (d. h. urheberrechtlich geschützten Code) aus den Datensätzen zu entfernen, die es zum Trainieren seiner KI-Modelle verwendet. Einige Code-generierende Tools, die mit restriktiv lizenziertem oder urheberrechtlich geschütztem Code trainiert wurden, wurden gezeigt diesen Code auf eine bestimmte Art und Weise wiederzugeben, was ein Haftungsrisiko darstellt (d. h. Entwickler, die den Code einbinden, könnten verklagt werden). Mohan sagte, dass dies bei Codeium dank seines Ansatzes zur Vorbereitung und Filterung von Trainingsdaten nicht der Fall sei.
„Wir entfernen auch alle verbleibenden Daten, die Code ähneln, der ausdrücklich nicht freizügig lizenziert ist, nur für den Fall, dass andere Leute Code kopiert haben, ohne die richtige Zuordnung und Lizenzierung anzugeben“, fügte er hinzu. „Darüber hinaus verfügen wir über hochmoderne Zuordnungsfilterung und -protokollierung nach der Generierung für den Fall, dass diese großen Wahrscheinlichkeitsmodelle Code produzieren, der öffentlichem Code ähnelt, egal ob freizügig oder nicht freizügig lizenziert.“
Aber was ist mit Halluzinationen? Die meisten KI-Codierungstools sind dafür berüchtigt, Dinge zu erfinden, was in einer Unternehmensumgebung ziemlich destruktiv sein kann.
Eine Analyse des Entwickler-Tooling-Startups GitClear ergab, dass generative KI-Tools zu Folgendem geführt haben: mehr fehlerhafter Code in den letzten Jahren in Codebasen gepusht. Und ein Purdue Studie festgestellt, dass über die Hälfte der Antworten, die OpenAIs ChatGPT auf Programmierfragen gibt, falsch sind. Sicherheitsforscher haben vor dem Potenzial solcher Tools gewarnt, vorhandene Fehler verstärken in der Software.
A jüngste Eine Umfrage des Cybersicherheitsunternehmens Snyk ergab, dass neun von zehn Entwicklern über die umfassenderen Sicherheitsauswirkungen der Verwendung von KI-Codierungsplattformen besorgt sind. Mohan behauptete jedoch, dass Codeiums angeblich überlegene, tief kontextreiche Technologie vertrauenswürdigere Ergebnisse liefert als die meisten anderen.
„Unsere Kontexterkennungs-Engine kann Ergebnisse auf dem basieren lassen, was bereits in der Codebasis eines Benutzers vorhanden ist. Dies führt zu Vorschlägen mit weniger Halluzinationen und einer stärkeren Einhaltung vorhandener Syntax, Semantik und Standards“, sagte er.
Ob Benchmarks das belegen oder nicht, Codeiums Verkaufsargument scheint bei den richtigen Führungskräften Anklang zu finden: Der Umsatz erreichte dieses Jahr einen achtstelligen Betrag. Mohan sagte, das 80-köpfige Startup mit Sitz in Mountain View wolle seine Mitarbeiterzahl bis 2025 auf 120 erhöhen, um einen größeren Marktanteil mit starken Konkurrenten wie Tabnine, Anysphere und Poolside zu erreichen.
Aufholen zu Copilot, der über 1,8 Millionen zahlende Nutzer Stand April, ist für Codeium wahrscheinlich nicht in Sicht – zumindest nicht in naher Zukunft. Das muss es auch nicht. Wie Mohan richtig bemerkte, angesichts der Weite Verbreitung von KI-Codierungstools unter Entwicklern (trotz ihrer Vorbehalte) dürfte selbst ein kleiner Teil dieses aufstrebenden Segments lukrativ sein.
Polaris-Forschung Projekte dass der Markt für KI-Code-Tools bis 2032 einen Wert von 27,17 Milliarden US-Dollar haben wird.
„Ein Übermaß an Hype ist eine Herausforderung für die Branche“, sagte Mohan. „Das wird es für jedes Unternehmen schwieriger machen, die Endnutzer wirklich davon zu überzeugen, dass sie an der Spitze des Möglichen stehen. Aber wir glauben, dass wahrheitssuchende und realistische KI-Unternehmen wie Codeium diesen Lärm letztendlich durchdringen werden.“