Viral AI Company Deepseek veröffentlicht neue Bildmodellfamilie

Viral AI Company Deepseek veroeffentlicht neue Bildmodellfamilie

Deepseek, die virale KI-Firma, hat einen neuen Satz multimodaler KI-Modelle veröffentlicht, von dem sie behauptet, dass er OpenAs Dall-E 3 übertreffen kann.

Die Modelle, die sind zum Download verfügbar Von der AI Dev Platform umarmt das Gesicht, sind Teil einer neuen Modellfamilie, die Deepseek Janus Pro nennt. Sie haben eine Größe von 1 Milliarde Parametern und 7 Milliarden Parametern. Parameter entsprechen in etwa den Problemen zur Problemlösung eines Modells und Modelle mit mehr Parametern funktionieren im Allgemeinen besser als solche mit weniger Parametern.

Janus Pro steht unter einer MIT -Lizenz, was bedeutet, dass es kommerziell ohne Einschränkung verwendet werden kann.

Das Bild gibt aus Deepseeks Janus -Modellen aus. Bildnachweis:Deepseek

Janus Pro, den Deepseek als „neuartiger autoregressive Framework“ beschreibt, kann neue Bilder analysieren und erstellen. Laut dem Unternehmen zufolge ist Geneval und DPG-Bench, das größte Janus Pro-Modell, Janus Pro 7b, über zwei AI-Bewertungsbenchmarks, Beats Dall-E 3 sowie Modelle wie Pixart-Alpha, Emu3-Gen und Stabilitätsstabil Diffusion xl.

Einige dieser Modelle sind älter, gewährt. Aber die Leistung von Janus Pro 7b ist beeindruckend, wenn man die relativ geringe Größe des Modells berücksichtigt.

„Janus Pro übertrifft das frühere einheitliche Modell und übergeht oder übertrifft die Leistung von aufgabenspezifischen Modellen“, Deepseek schreibt in einem Beitrag über das umarmende Gesicht. „Die Einfachheit, hohe Flexibilität und Effektivität von Janus Pro machen es zu einem starken Kandidaten für einheitliche multimodale Modelle der nächsten Generation.“

Deepseek -Bild
Deepseeks neue Janus -Modelle im Vergleich zum Wettbewerb.Bildnachweis:Deepseek

Deepseek, ein chinesisches KI-Labor, das größtenteils vom quantitativen Handelsunternehmen High-Flyer Capital Management finanziert wurde, brach diese Woche nach dem Mainstream-Bewusstsein ein Die Chatbot -App stieg ganz oben in den Apple App Store -Charts. Die Sprachmodelle von Deepseek, die mit recheneffizienten Techniken trainiert wurden, haben viele Wall Street-Analysten-und Technologen-geführt, um zu fragen, ob die USA ihre Führung im KI-Rennen aufrechterhalten und ob die Nachfrage nach KI-Chips aufrechterhalten wird.

tch-1-tech