En quelques jours, DeepSeek a pu mettre en jeu les modèles économiques d’OpenAI et de Google en précisant que son LLM offre une grande capacité et ne nécessite pas autant de ressources pour offrir une expérience qui imite celle de ChatGPT, Claude ou Gémeaux. Il se lance désormais dans la génération d’images IA avec Janus Pro 7Bun modèle multimodal qui se distingue par son efficacité et son architecture.
L’assistant IA de DeepSeek a également atteint l’application la plus téléchargée du pays sur OpenAI, donc les nerfs commencent à s’installer. prospérer dans les géants américains de la technologie qu’ils se battaient presque entre eux pour conquérir cette part de marché juteuse des chatbots d’intelligence artificielle et de toutes les expériences qui les entourent.
Janus-Pro-7B, dans les tests effectués par Rowan Cheung, surpasse certains benchmarks, tels que GenEval et DPG-Bench, vers DALL-E3 depuis OpenAI et Stable Diffusion. En fait, le déploiement de Janus-Pro-7B et tout ce que DeepSeek de R1 a généré a fait chuter les actions de NVIDIA de plus de 17 %.
L’une des prouesses importantes de ce nouveau modèle multimodal des images est de pouvoir Établir une nouvelle norme en matière de performances de l’intelligence artificielle. En fait, selon Investirl’attention se concentre désormais sur la réponse que ses concurrents doivent apporter pour résoudre le nouveau paradigme que Janus-Pro-7B a mis sur la table ainsi que le chatbot DeepSeek.
Si l’IA de DeepSeek s’est imposée grâce à sa grande efficacité en ne nécessitant pas autant de ressources, Janus Pro 7B va dans le même sens grâce à son système innovant « double voie » pour traiter les images. Pour mieux comprendre son efficacité, et entrer dans l’aspect technique, il est capable de séparer, d’une part, le codage pour la génération de l’image et, d’autre part, l’identification de l’image pour sa recréation.
Exemples d’images de l’avancée du Janus-Pro-7B The Free Android
Utilisez SigLIP-L comme encodeur visuel pour les images avec un Résolution 384 x 384et pour le moment il se limite dans cette résolution à ouvrir la porte à de futures innovations qui le mettent au même niveau que les solutions d’OpenAI et d’autres.
Et comme cela a été mentionné, et pourquoi DeepSeek se démarque énormément, c’est grâce à son efficacité. Janus-Pro-7B utilise un taille compacte de 7 milliards de paramètresoffre des performances supérieures à des modèles spécifiques similaires et plus grands, et est open source sous licence MIT.
Ce dernier point fait n’importe qui peut utiliser, modifier et distribuer le code librement et même à des fins commerciales, contrairement à la licence DeepSeek qui, bien que gratuite et commerciale, ne peut être utilisée à des fins militaires ou pour générer de la désinformation.
Construit sur Base DeepSeek-LLM-7bvia Xatakaprofite de ses énormes capacités de traitement du langage ainsi que de génération d’images, et grâce à son système de sous-échantillonnage 16x, il est capable de maintenir son efficacité sans détériorer la qualité de ses générations.