Qu’est-ce que DeepSeek, l’intelligence artificielle chinoise qui a surpassé ChatGPT en termes de capacités et d’efficacité par surprise

Quest ce que DeepSeek lintelligence artificielle chinoise qui a surpasse ChatGPT

Le monde de l’intelligence artificielle vit une révolution. L’année 2025 a démarré fort dans ce secteur, dans lequel les entreprises chinoises parviennent à rendre nerveux les géants américains. OpenAI a lancé la semaine dernière O3, son nouveau modèle capable de raisonner et totalement gratuit. Votre réponse a été DeepSeek, le chatbot chinois qui capte tous les regards et cela a déjà provoqué l’effondrement de Nvidia, qui perd 400 milliards de millions de capitalisation, et une baisse de 3% du Nasdaq directement liée aux entreprises technologiques américaines.

L’engouement pour ce nouvel agent est tel que l’application pour utiliser le chatbot DeepSeek a été placé en première place dans l’App Store américaindétrônant ChatGPT. Il y a trois raisons essentielles pour lesquelles cette startup chinoise a mis les rois de l’IA dans les cordes : ses performances, son prix et son statut open source.

Le 20 janvier, DeepSeek a introduit R1, un modèle spécialisé dans la résolution de problèmes complexes en générant des chaînes de raisonnement. Une proposition similaire à celle qu’OpenAI avait déjà présentée avec son modèle o1 en 2024. La première surprise est venue dans le document de présentation lui-même, en voyant les résultats du modèle dans les principaux benchmarks, malgré l’utilisation de puces de qualité inférieure, comme indiqué Le Wall Street Journal.

Puissant, bon marché et ouvert

Dans le graphique suivant, vous pouvez voir à quel point le modèle DeepSeek-R1 mesure de près, voire dépasse OpenAI-o1, dans la plupart des benchmarks ou tests de performances du marché. Restent des modèles comme DeepSeek V3, qui a été présenté sans capacité de raisonnement fin décembre 2024. En seulement un mois, la startup chinoise a réussi à tenir tête au roi de cette industrie. Pourtant, les experts préviennent que, même si elle est très prometteuse, cette technologie est toujours en retard sur celle d’OpenAi et de Google.

Avec ces résultats, le prochain succès a été le prix. Le modèle phare de DeepSeek est gratuit, mais la société facture les utilisateurs qui connectent leurs propres applications au modèle et à l’infrastructure informatique de DeepSeek. Alors qu’OpenAI demande 57,80 euros (438 yuans en Chine) pour l’utilisation d’un million de jetons de sortie, DeekSeek ne demande que 2,10 euros (16 yuans), comme déjà souligné. Reuters.

Comparaison entre DeepSeek et OpenAI o1 DeepSeek Omicrono

Vous pouvez tester le chatbot sur le site DeepSeek et activez la chaîne de raisonnement qui se déroule complètement jusqu’à atteindre la réponse finale. La machine dialogue avec elle-même, s’exprimant comme le ferait un humain. Il suffit d’activer le bouton DeepThink pour le comparer avec la capacité de raisonnement d’autres concurrents comme OpenAI. Dans les versions précédentes, ce chatbot a fait preuve d’une certaine censure concernant les politiques sensibles en Chine.

La transparence de DeepSeek serait le troisième pilier de son récent succès. Cette entreprise lance généralement ses modèles open source, c’est-à-dire qu’elle ouvre le code pour que toute la communauté des développeurs et autres entreprises puissent utiliser la technologie.

DeepSeek R1 n’est pas seulement « 25 fois moins cher que GPT o1″…

C’est mieux que l’OpenAI o3 inédit au même prix en codage sur Codeforces et ARC-AGI ! pic.twitter.com/JNOZJhTpiw

– Deedy (@deedydas) 27 janvier 2025

Une stratégie que des géants comme OpenAI et Google ont laissé derrière eux depuis longtemps. Dans le document lui-même, DeepSeek détaille son travail pour créer son modèle de raisonnement avec beaucoup plus de détails que ce que les entreprises privées fournissent habituellement.

L’avenir de DeepSeek R1

Cette ouverture offre à la communauté mondiale la possibilité d’améliorer d’autres projets, en s’appuyant sur la technologie DeepSeek. R1 est un grand modèle, qui permet d’exécuter seulement une partie spécifique en fonction de l’usage qui va lui être donné, mais il nécessite un gros matériel pour l’exécuter. L’entreprise chinoise l’a lancé pour que d’autres entreprises puissent l’utiliser commercialement.

L’entreprise chinoise elle-même l’utilise déjà comme entraîneur pour ses futurs modèles d’intelligence artificielle, explique le vulgarisateur Carlos Santana dans votre chaîne Youtube. Grâce aux données synthétiques et raisonnées générées par R1, d’autres modèles sont alimentés et entraînés de plus petite taille sans capacité de raisonnement DeepSeek et dont les résultats remettent également en question des modèles plus grands dans les benchmarks. L’IA forme l’IA du futur.



fr-02