Bei bahnbrechenden KI-Modellen regnet es in Strömen. Mistral hat am Mittwoch ein brandneues Flaggschiffmodell namens Large 2 herausgebracht, das in Bezug auf Codegenerierung, Mathematik und Argumentation den neuesten Spitzenmodellen von OpenAI und Meta ebenbürtig sein soll.
Der Veröffentlichung von Mistral Large 2 fällt nur einen Tag, nachdem Meta sein neuestes und bestes Open-Source-Modell, Llama 3.1 405b, herausgebracht hat. Mistral sagt, dass Large 2 die Messlatte für Leistung und Kosten für offene Modelle höher legt und untermauert dies mit einer Handvoll Benchmarks.
Large 2 scheint Llama 3.1 405B bei der Codegenerierung und mathematischen Leistung zu übertreffen und tut dies mit weniger als einem Drittel der Parameter: 123 Milliarden, um genau zu sein.
In einer Pressemitteilung erklärt Mistral, dass einer der Hauptschwerpunkte während des Trainings darin bestand, die Halluzinationsprobleme des Modells zu minimieren. Das Unternehmen sagt, dass Large 2 darauf trainiert wurde, bei seinen Antworten kritischer zu sein und zuzugeben, wenn es etwas nicht weiß, anstatt etwas zu erfinden, das plausibel erscheint.
Das in Paris ansässige KI-Startup hat kürzlich in einer von General Catalyst angeführten Finanzierungsrunde der Serie B 640 Millionen US-Dollar gesammelt und ist damit 6 Milliarden US-Dollar wert. Obwohl Mistral einer der neueren Akteure im Bereich der künstlichen Intelligenz ist, liefert es schnell KI-Modelle auf den neuesten Stand oder fast auf den neuesten Stand.
Es ist jedoch wichtig zu beachten, dass Mistrals Modelle, wie die meisten anderen, nicht im herkömmlichen Sinne Open Source sind – jede kommerzielle Anwendung des Modells erfordert eine kostenpflichtige Lizenz. Und obwohl es offener ist als beispielsweise GPT-4o, verfügen nur wenige auf der Welt über das Fachwissen und die Infrastruktur, um ein so großes Modell zu implementieren. (Das gilt natürlich doppelt für Llamas 405 Milliarden Parameter.)
Was Mistral Large 2 fehlt und auch bei der gestrigen Veröffentlichung von Metas Llama 3.1 fehlt, sind multimodale Fähigkeiten. OpenAI ist der Konkurrenz in Bezug auf multimodale KI-Systeme weit voraus und kann Bild und Text gleichzeitig verarbeiten, eine Funktion, die einige Startups zunehmend nutzen möchten.
Das Modell hat ein 128.000-Token-Fenster, was bedeutet, dass Large 2 eine Menge Daten in einer einzigen Eingabeaufforderung aufnehmen kann (128.000 Token entsprechen etwa einem 300-seitigen Buch). Das neue Modell von Mistral bietet auch eine verbesserte mehrsprachige Unterstützung. Large 2 versteht Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Arabisch, Hindi, Russisch, Chinesisch, Japanisch und Koreanisch sowie 80 Programmiersprachen. Insbesondere behauptet Mistral, dass Large 2 auch präzisere Antworten liefert als führende KI-Modelle, die dazu neigen, zu plappern.
Mistral Large 2 ist für die Nutzung auf Google Vertex AI, Amazon Bedrock, Azure AI Studio und IBM watsonx.ai verfügbar. Sie können das neue Modell auch auf Mistrals le Plateforme unter dem Namen „mistral-large-2407“ verwenden und es kostenlos auf dem ChatGPT-Konkurrenten des Startups, le Chat, testen.