Deepseek ist viral geworden.
Das chinesische AI Lab Deepseek brach diese Woche in das Mainstream -Bewusstsein ein, nachdem die Chatbot -App an die Spitze der Apple App Store -Charts gestiegen war. Die KI-Modelle von Deepseek, die mit recheneffizienten Techniken ausgebildet wurden, haben die Wall Street-Analysten-und Technologen-geführt, um zu fragen, ob die USA ihre Führung im KI-Rennen aufrechterhalten und ob die Nachfrage nach KI-Chips aufrechterhalten wird.
Aber woher kam Deepseek und wie ist es so schnell zu internationalem Ruhm geworden?
Deepseeks Trader -Ursprünge
Deepseek wird von High-Flyer Capital Management unterstützt, einem chinesischen quantitativen Hedgefonds, der KI verwendet, um seine Handelsentscheidungen zu informieren.
Die AI-Enthusiastin Liang Wenfeng war 2015 Mitbegründer von High-Flyer. Wenfeng, der Berichten zufolge mit dem Handel mit dem Handel gestoßen war, als ein Student an der Zhejiang University ein Hochflyer-Kapitalmanagement als Hedgefonds ins Leben gerufen hat, der sich auf die Entwicklung und Bereitstellung von AI-Algorithmen konzentrierte.
Im Jahr 2023 startete High-Flyer Deepseek als Labor für die Erforschung von KI-Tools, die von seinem Finanzgeschäft getrennt sind. Mit High-Flyer als einer seiner Investoren wurde das Labor in seine eigene Firma, auch Deepseek genannt.
Vom ersten Tag an baute Deepseek seine eigenen Rechenzentrum -Cluster für das Modelltraining auf. Aber wie andere KI -Unternehmen in China wurde Deepseek von den US -Exportverboten auf Hardware betroffen. Um eines seiner neueren Modelle auszubilden, musste das Unternehmen NVIDIA H800-Chips verwenden, eine weniger Kraft eines Chips, dem H100, der US-Unternehmen zur Verfügung steht.
Das technische Team von Deepseek soll jung sein. Die Firma Berichten zufolge aggressiv Rekruten Doktoranden -KI -Forscher von Top chinesischen Universitäten. Deepseek stellt auch Menschen ohne Informatik -Hintergrund ein Um seiner Technologie zu helfen, eine breite Palette von Themen besser zu verstehen, gemäß der New York Times.
Deepseeks starke Modelle
Deepseek stellte im November 2023 seine erste Modelle vor-Deepseek Codierer, Deepseek LLM und Deepseek Chat. begann zu bemerken.
Deepseek-V2, ein allgemeines text- und bildanalysierendes System, hat in verschiedenen KI-Benchmarks eine gute Leistung erzielt-und war zu dieser Zeit weitaus billiger als vergleichbare Modelle. Es zwang Deepseeks Inlandswettbewerb, einschließlich Bytedance und Alibaba, dazu, die Nutzungspreise für einige ihrer Modelle zu senken und andere völlig frei zu machen.
Deepseek-V3, der im Dezember 2024 eingeführt wurde, bot nur zu Deepseeks Bekanntheit.
Laut Deepseeks internen Benchmark-Tests übertrifft Deepseek V3 sowohl herunterladbare, offen verfügbare Modelle wie Metas Lama- als auch „geschlossen“ -Modelle, auf die nur über eine API wie das OpenAI-GPT-4O zugegriffen werden können.
Ebenso beeindruckend ist Deepseeks R1 -Argumentationsmodell. Deepseek, die im Januar veröffentlicht wurde, behauptet, R1 führt ebenso wie das O1 -Modell von OpenAI für wichtige Benchmarks durch.
Als Argumentationsmodell überprüft R1 sich die Fakten selbst, was es dazu beiträgt, einige der Fallstricke zu vermeiden, die normalerweise Modelle stolpern. Die Argumentationsmodelle dauern etwas länger-normalerweise Sekunden bis Minuten länger-, um zu Lösungen zu gelangen, im Vergleich zu einem typischen Nicht-Begrenzungsmodell. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.
Es gibt jedoch einen Nachteil von R1, Deepseek V3 und Deepseeks anderen Modellen. Als Chinesisch-entwickelte KI sind sie unterworfen Benchmarking durch Chinas Internetregulierungsbehörde, um sicherzustellen, dass seine Antworten „kernkern sozialistische Werte verkörpern“. In Deepseeks Chatbot -App wird beispielsweise R1 keine Fragen zum Tiananmen Square oder Taiwans Autonomie beantworten.
Ein disruptiver Ansatz
Wenn Deepseek ein Geschäftsmodell hat, ist nicht klar, was dieses Modell genau ist. Das Unternehmen bewertet seine Produkte und Dienstleistungen weit unter dem Marktwert – und verschenkt andere kostenlos.
Die Art und Weise, wie Deepseek es sagt, haben die Durchbrüche der Effizienz ermöglicht, extreme Kostenwettkämpfe aufrechtzuerhalten. Einige Experten Disput Die Zahlen des Unternehmens haben jedoch geliefert.
Was auch immer der Fall sein mag, Entwickler haben sich in Deepseeks Modelle begeben, die nicht Open Source sind, da der Ausdruck allgemein verstanden wird, aber unter zulässigen Lizenzen verfügbar ist, die eine kommerzielle Nutzung ermöglichen. Laut Clem Delangue, dem CEO von Sugging Face, einer der Plattformen, auf denen Deepseeks Modelle veranstaltet werden, veranstaltet sie. Entwickler auf dem Umarmungsgesicht haben über 500 „Derivat“ -Modelle von R1 erstellt Das haben 2,5 Millionen Downloads zusammengegeben.
Deepseeks Erfolg mit größeren und etablierteren Konkurrenten war beschrieben als „aufstrebende KI“ Und Einlösten „eine neue Ära der AI -Brinkmanship“. Der Erfolg des Unternehmens war zumindest teilweise dafür verantwortlich, dass der Aktienkurs von Nvidia am Montag um 18% gesunken ist und für eine öffentliche Antwort auslösen vom OpenAI -CEO Sam Altman.
Was Deepseeks Zukunft betrifft, ist es nicht klar. Verbesserte Modelle sind selbstverständlich. Aber die US -Regierung scheint zu sein Wachstum vorsichtig mit dem, was es als schädlichen fremden Einfluss wahrnimmt.
Tech hat einen AI-ausgerichteten Newsletter! Melden Sie sich hier an, um es jeden Mittwoch in Ihren Posteingang zu bringen.