Mistral veröffentlicht Codestral, sein erstes generatives KI-Modell für Code

Mistral veroeffentlicht Codestral sein erstes generatives KI Modell fuer Code

Mistral, das von Microsoft unterstützte und mit 6 Milliarden Dollar bewertete französische KI-Startup, hat freigegeben sein erstes generatives KI-Modell zum Codieren, genannt Codestral.

Wie andere Code-generierende Modelle ist Codestral darauf ausgelegt, Entwicklern beim Schreiben und Interagieren mit Code zu helfen. Es wurde in über 80 Programmiersprachen trainiert, darunter Python, Java, C++ und JavaScript, erklärt Mistral in einem Blogbeitrag. Codestral kann Codierungsfunktionen vervollständigen, Tests schreiben und Teilcode „ergänzen“ sowie Fragen zu einer Codebasis auf Englisch beantworten.

Mistral beschreibt das Modell als „offen“, aber das ist umstritten. Die Lizenz des Startups verbietet die Verwendung von Codestral und seinen Ausgaben für beliebig kommerzielle Aktivitäten. Es gibt eine Ausnahmeregelung für „Entwicklung“, aber selbst diese ist mit Einschränkungen verbunden: Die Lizenz verbietet ausdrücklich „jede interne Nutzung durch Mitarbeiter im Rahmen der Geschäftsaktivitäten des Unternehmens“.

Der Grund könnte sein, dass Codestral teilweise mit urheberrechtlich geschützten Inhalten trainiert wurde. Mistral hat dies in seinem Blogbeitrag weder bestätigt noch dementiert, aber es wäre nicht überraschend; es gibt Beweis dass die vorherigen Trainingsdatensätze des Startups urheberrechtlich geschützte Daten enthielten.

Codestral ist den Aufwand vielleicht sowieso nicht wert. Das Modell mit 22 Milliarden Parametern erfordert einen leistungsstarken PC, um ausgeführt zu werden. (Parameter definieren im Wesentlichen die Fähigkeiten eines KI-Modells bei einem Problem, wie z. B. beim Analysieren und Generieren von Text.) Und obwohl es laut einigen Benchmarks (die, wie wir wissen, unzuverlässig sind) die Konkurrenz schlägt, ist es kein Durchbruch.

Bildnachweise: Mistral

Obwohl Codestral für die meisten Entwickler unpraktisch ist und nur inkrementelle Leistungsverbesserungen bringt, wird es sicherlich die Debatte darüber anheizen, ob es sinnvoll ist, sich bei der Programmierung auf Code-generierende Modelle zu verlassen.

Entwickler nutzen sicherlich generative KI-Tools für zumindest einige Programmieraufgaben. In einem Stack Overflow Umfrage Ab Juni 2023 gaben 44 % der Entwickler an, dass sie derzeit KI-Tools in ihrem Entwicklungsprozess verwenden, während 26 % dies bald planen. Diese Tools weisen jedoch offensichtliche Mängel auf.

Eine Analyse von mehr als 150 Millionen Codezeilen, die in den letzten Jahren von GitClear in Projekt-Repos übertragen wurden, ergab, dass generative KI-Entwicklungstools zu Folgendem führen: mehr fehlerhafter Code in Codebasen gepusht werden. An anderer Stelle haben Sicherheitsforscher gewarnt, dass solche Tools vorhandene Fehler und Sicherheitsprobleme verstärken in Softwareprojekten; mehr als die Hälfte der Antworten, die OpenAIs ChatGPT auf Programmierfragen gibt, sind falsch, laut eine Studie von Purdue.

Das wird Unternehmen wie Mistral und andere nicht davon abhalten, mit ihren Modellen Geld zu verdienen (und Aufmerksamkeit zu gewinnen). Heute Morgen hat Mistral eine gehostete Version von Codestral auf seiner Konversations-KI-Plattform Le Chat sowie seiner kostenpflichtigen API gestartet. Mistral sagt, es habe auch daran gearbeitet, Codestral in App-Frameworks und Entwicklungsumgebungen wie LlamaIndex, LangChain, Continue.dev und Tabnine zu integrieren.

tch-1-tech