Seit das chinesische KI-Unternehmen DeepSeek Anfang dieser Woche eine offene Version seines Argumentationsmodells R1 veröffentlicht hat, haben viele in der Technologiebranche große Ankündigungen darüber gemacht, was das Unternehmen erreicht hat und was dies für den Stand der KI bedeutet.
Der Risikokapitalgeber Marc Andreessen zum Beispiel gepostet dass DeepSeek „einer der erstaunlichsten und beeindruckendsten Durchbrüche ist, die ich je gesehen habe.“
R1 scheint bei bestimmten KI-Benchmarks dem o1-Modell von OpenAI zu entsprechen oder es zu übertreffen. Und das Unternehmen beansprucht eines seiner Modelle kostete nur 5,6 Millionen US-Dollar im Vergleich zu den Hunderten Millionen Dollar, die führende amerikanische Unternehmen für die Ausbildung ihrer Unternehmen zahlen.
Dies scheint ihm auch angesichts der US-Sanktionen gelungen zu sein, die den Verkauf fortschrittlicher Chips an chinesische Unternehmen verbieten. Das schreibt die MIT Technology Review dass der Erfolg des Unternehmens zeigt, wie Sanktionen „Start-ups wie DeepSeek dazu bringen, Innovationen auf eine Weise zu entwickeln, bei der Effizienz, Ressourcenbündelung und Zusammenarbeit im Vordergrund stehen.“ (Auf der anderen Seite, berichtet das Wall Street Journal dass Liang Wenfeng von DeepSeek kürzlich dem chinesischen Ministerpräsidenten sagte, dass amerikanische Exportbeschränkungen immer noch einen Engpass darstellen.)
Curai-CEO Neal Khosla bot eine einfachere ErklärungEr behauptet, dass es sich bei dem Unternehmen um einen „staatlichen Psyop der KPCh“ handelt, der „vortäuscht, die Kosten seien niedrig, um die Festlegung eines niedrigen Preises zu rechtfertigen, und in der Hoffnung, dass alle darauf umsteigen.“ [to] schaden der KI-Wettbewerbsfähigkeit in den USA.“ (Seinem Beitrag wurde eine Community-Notiz beigefügt, in der darauf hingewiesen wird, dass Khosla keine Beweise dafür vorlegt und dass sein Vater Vinod ein OpenAI-Investor ist.)
In der Zwischenzeit, schlug Journalist Holger Zschäpitz vor DeepSeek könnte „die größte Bedrohung für die US-Aktienmärkte darstellen“ – wenn ein chinesisches Unternehmen ein hochmodernes Modell zu geringen Kosten und ohne Zugang zu fortschrittlichen Chips bauen kann, würde dies „den Nutzen von Hunderten von Milliarden Dollar“ in Frage stellen Investitionen werden in diese Branche gesteckt.“
Als Antwort: Garry Tan, CEO von Y Combinator, argumentierte Der Erfolg von DeepSeek wäre tatsächlich gut für seine amerikanischen Konkurrenten: „Wenn Trainingsmodelle schneller und einfacher billiger werden, wird die Nachfrage nach Inferenz (tatsächlicher Einsatz von KI in der realen Welt) noch schneller wachsen und sich beschleunigen, was sicherstellt, dass das Rechenangebot genutzt wird.“ ”
Und Metas Chef-KI-Wissenschaftler Yann LeCun dagegen argumentiert Betrachten wir die Ankündigung von DeepSeek aus der Perspektive von China vs. den Vereinigten Staaten. Stattdessen schlug er vor, dass die eigentliche Lehre darin bestehe, dass „Open-Source-Modelle proprietäre Modelle übertreffen“.
„DeepSeek hat von offener Forschung und Open Source profitiert (z. B. PyTorch und Llama von Meta)“, schrieb LeCun. „Sie haben neue Ideen entwickelt und diese auf der Grundlage der Arbeit anderer aufgebaut. Da ihre Arbeit veröffentlicht und Open Source ist, kann jeder davon profitieren.“
Die ganze Debatte scheint die Verbraucher dazu zu bringen, das Produkt auszuprobieren – Stand Sonntagnachmittag, Der KI-Assistent von DeepSeek ist die beste kostenlose App im Apple App Store, knapp vor ChatGPT.