Das chinesische AI Lab Deepseek hat eine offene Version von Deepseek-R1 veröffentlicht, seinem sogenannten Argumentationsmodell, das sie behauptet, sowie OpenAs O1 auf bestimmten AI-Benchmarks.
R1 ist von der AI Dev -Plattform erhältlich, die sich unter einer MIT -Lizenz umarmt, was bedeutet, dass es kommerziell ohne Einschränkungen verwendet werden kann. Laut Deepseek besiegt R1 O1 auf den Benchmarks Aime, Math-500 und Swe-Bench verifiziert. Aime verwendet andere Modelle, um die Leistung eines Modells zu bewerten, während Math-500 eine Sammlung von Wortproblemen ist. SWE-Bench verifiziert sich inzwischen auf Programmieraufgaben.
Als Argumentationsmodell überprüft R1 sich die Fakten selbst, was es dazu beiträgt, einige der Fallstricke zu vermeiden, die normalerweise Modelle stolpern. Die Argumentationsmodelle dauern etwas länger – normalerweise Sekunden bis Minuten länger -, um zu Lösungen zu gelangen, verglichen mit einem typischen Nichtbevölkerungsmodell. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.
R1 enthält 671 Milliarden Parameter, Deepseek in a enthüllt Technischer Bericht. Parameter entsprechen in etwa den Problemen zur Problemlösung eines Modells und Modelle mit mehr Parametern funktionieren im Allgemeinen besser als solche mit weniger Parametern.
In der Tat sind 671 Milliarden Parameter massiv, aber Deepseek veröffentlichte auch „destillierte“ Versionen von R1 von 1,5 Milliarden Parametern bis 70 Milliarden Parametern. Der kleinste kann auf einem Laptop laufen. Was den vollen R1 betrifft, erfordert es kräftigere Hardware, aber es Ist Erhältlich über die API von Deepseek zu Preisen 90% -95% billiger als Opens O1.
Clem Delangue, der CEO von Hugging Face, sagte in einem Post auf x Am Montag haben die Entwickler auf der Plattform mehr als 500 „Derivative“ -Modelle von R1 erstellt, die zusammen 2,5 Millionen Downloads zusammengefasst haben – fünfmal so viele Downloads, die der offizielle R1 erhalten hat.
Es gibt einen Nachteil zu R1. Als chinesisches Modell unterliegt es für Benchmarking durch Chinas Internetregulierungsbehörde, um sicherzustellen, dass seine Antworten „kernkern sozialistische Werte verkörpern“. R1 beantwortet beispielsweise keine Fragen zum Tiananmen Square oder die Autonomie Taiwans.
Viele Chinesische KI -Systeme, einschließlich anderer Argumentationsmodelle, lehnen es ab, auf Themen zu reagieren, die den Zorn der Aufsichtsbehörden im Land erhöhen könnten, wie z. B. Spekulationen über die Xi Jinping Regime.
R1 kommt Tage nach der vorgeschlagenen ausgehenden Biden -Verwaltung an härter Exportregeln und Beschränkungen für KI -Technologien für chinesische Unternehmungen. Unternehmen in China wurden bereits daran gehindert, fortgeschrittene KI -Chips zu kaufen. Wenn die neuen Regeln jedoch wie geschrieben in Kraft treten, werden Unternehmen sowohl für die Halbleitertechnologie als auch mit strengeren Obergrenzen für die Bootstrap -KI -Systeme konfrontiert sein.
In einem politischen Dokument in der vergangenen Woche forderte OpenAI die US -Regierung auf, die Entwicklung der US -KI zu unterstützen, damit chinesische Modelle sie nicht in der Lage sind. In an Interview Mit den Informationen hat OpenAIs VP der Politik Chris Lehane High Flyer Capital Management, Deepseeks Corporate Parent, als Organisation von besonderem Anliegen heraus.
Bisher mindestens drei chinesische Labors – Deepseek, Alibaba und Kimidie Besitz von Chinese Unicorn Moonshot AI ist – haben Modelle erzeugt, die sie für den Rivalen O1 beanspruchen. (Bemerkenswerterweise war Deepseek der erste – es kündigte Ende November eine Vorschau von R1 an.) In a Post Auf X sagte Dean Ball, AI -Forscher an der George Mason University, dass der Trend darauf hindeutet, dass die chinesischen KI -Labors weiterhin „schnelle Anhänger“ sein werden.
„Die beeindruckende Leistung von Deepseeks destillierten Modellen […] bedeutet, dass sehr fähige Vernunfter weiterhin weit verbreitet sind und auf lokaler Hardware ausgeführt werden können.
Diese Geschichte wurde ursprünglich am 20. Januar veröffentlicht und wurde am 27. Januar mit weiteren Informationen aktualisiert.
Tech hat einen AI-ausgerichteten Newsletter! Melden Sie sich hier an Um es jeden Mittwoch in Ihren Posteingang zu bekommen.