C’est la nouvelle alternative à l’impressionnant ChatGPT audio et vidéo

Cest la nouvelle alternative a limpressionnant ChatGPT audio et video

Les derniers jours ont été extrêmement chargés dans le secteur technologique. Si nous pensions que 2023 avait été l’année de l’intelligence artificielle, c’était parce que nous ne savions pas ce que 2024 nous réservait. Nous pouvions deviner quelque chose, mais même en supposant que les avancées seraient grandes, peu de gens l’imaginaient avant d’avoir terminé la première. la moitié de cette année, nous aurions vu tellement de choses nouvelles et importantes.

En attendant ce qu’Apple va présenter à la WWDC, tous les regards étaient tournés vers le Google I/O aura lieu à San Francisco cette semaine. Mais OpenAI n’a pas l’habitude de laisser la vedette à ses concurrents s’ils peuvent l’éviter, et ils ont annoncé quelques heures plus tôt l’une des avancées les plus impressionnantes en matière d’intelligence artificielle depuis la présentation officielle de ChatGPT.

[Qué es Google Gemini: las 8 claves que debes conocer sobre la inteligencia artificial que tendrás en tu móvil]

Dans une présentation de moins de 30 minutes, l’entreprise a non seulement annoncé le nouvelle version de votre chatbot, ChatGPT 4omais un nouvelle forme d’interaction multimodale cela va bien au-delà de ce qui a été vu jusqu’à présent. Il est impossible de ne pas se souvenir du film « Her » de Spike Jonze. L’impact sur le secteur est clairement visible, de nombreux analystes et professionnels faisant l’éloge du nouveau produit de l’entreprise dirigée par Sam Altman. Un moteur de recherche était attendu et l’entreprise a lancé une campagne de répression contre tous ses concurrents. À tel point que Google a fait un aperçu de ce qu’il allait présenter lors de sa conférence inaugurale Google I/O. Il s’agissait d’une courte vidéo enregistrée au siège de Google dans laquelle vous pouvez voir comment ils étaient prêts à présenter un système très similaire à ce qu’OpenAI venait d’annoncer.

Gemini est l’avenir de Google

À la fin de l’année dernière, Google a annoncé Gemini, sa nouvelle marque pour tout ce qui touche à l’intelligence artificielle générative. Il a même remplacé Bard, le chatbot lancé par Google pour être le rival de ChatGPT. Ce produit prend de plus en plus d’importance dans l’entreprise de Sundar Pichai, remplaçant même l’Assistant Google sur ses téléphones mobiles sur certains marchés. Cela a été l’axe central de la conférence inaugurale Google I/O.

Il est actuellement intégré d’une manière ou d’une autre non seulement dans les nouveaux Pixel, dont le Pixel 8a, mais aussi dans les téléphones mobiles d’autres sociétés, comme le Galaxy S24 de Samsung. Cela montre à quel point ce produit est pertinent pour Google, une entreprise qui Elle dit depuis huit ans qu’elle est une entreprise axée sur l’intelligence artificielle mais il a vu comment un débutant, OpenAI, l’a dépassé de manière inattendue.

Gémeaux Google I:O 2024 Google L’Android gratuit

Sur cette base, Google a présenté ses nouveautés lors du Google I/O pour ne pas perdre le rythme des présentations de ses concurrents. Et il l’a fait d’une manière dont ses concurrents ne peuvent rêver : en utilisant les données de ses utilisateurs. Et ça peut tout changer. Par exemple, le L’application Gemini est capable de créer du contenu ou de comprendre ce qui se trouve sur le mobile, répondre sur cette base.

La nouvelle ère des données

Les données ont été un élément clé dans les entreprises depuis de nombreuses années maintenant, mais à l’ère de l’intelligence artificielle qui atteint un nouveau niveau. Google a ici un avantage grâce aux milliards d’utilisateurs qui utilisent déjà ses services, du moteur de recherche à Gmail, en passant par Google Maps ou Google Photos.

C’est la recherche à l’ère des Gémeaux. #GoogleIO pic.twitter.com/JxldNjbqyn

-Google (@Google) 14 mai 2024

Google a annoncé certaines des améliorations apportées à ces services, en y intégrant Gemini. Et il le fait d’une manière multimodal et avec un grand contexte, les deux clés de cette nouvelle génération d’IA. Par exemple, en été, nous aurons une nouvelle fonction dans Google Photos qui vous permettra de faire des demandes à l’application aussi complexe que « montre-moi comment mon neveu a appris à nager », et montrera des photographies chronologiques de mon neveu liées à ma demande. Une autre démonstration concerne Gmail, en particulier WorkSpace. Nous pourrons vous demander un récapitulatif de tous les emails d’une personne, ou effectuez une recherche parmi les milliers d’e-mails que nous avons stockés. D’autres exemples sont liés aux achats effectués et à la gestion d’un retour, le tout depuis Gemini, ce qui est possible en ayant accès à nos données. Cette fonctionnalité sera déployée le mois prochain dans certains pays.

Projet Astra

Mais la chose la plus impressionnante de l’événement a été le Projet Astra, un système de reconnaissance par vidéo en temps réel ce qui n’est pas sans rappeler ce que OpenAI présentait il y a quelques heures. Pour ce faire, Google a dû baisser au maximum la latence, pour laquelle il a créé Flash Gémeauxune version de son intelligence artificielle conçue pour cela.

Le projet Astra est un prototype de @GoogleDeepMind explorer comment un agent d’IA universel peut être réellement utile dans la vie de tous les jours. Regardez notre prototype en action en deux parties, chacune capturée en une seule prise, en temps réel ↓ #GoogleIO pic.twitter.com/uMEjIJpsjO

-Google (@Google) 14 mai 2024

Pour le moment, Google n’a pas annoncé de date de sortie, mais ambitionne de l’intégrer à l’application Gemini à la fin de l’année. Cela pourrait changer la façon dont nous utilisons les assistants vocaux, y compris celui de Google, qui devient de plus en plus obsolète, même si Gemini ne peut toujours pas faire des choses, comme exécuter des routines liées aux appareils domotiques.

Imaginez 3 et je vois

Mais Google ne perd pas de vue l’impact de Dall-E et, surtout, de Sora, le système de génération vidéo d’OpenAI qui, bien que non disponible pour les utilisateurs, a démontré ce qui allait arriver. Chez Google I/O, nous avons assisté à la présentation de Je vois, Le système de génération vidéo de Google, qui va un peu plus loin que Sora, en donnant la priorité non seulement à la qualité, mais aussi à la cohérence entre les images.

Présentation de Veo : notre modèle vidéo génératif le plus performant. 🎥

> Il peut créer des clips 1080p de haute qualité pouvant durer plus de 60 secondes.

Du photoréalisme au surréalisme et à l’animation, il peut aborder une gamme de styles cinématographiques. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH

– Google DeepMind (@GoogleDeepMind) 14 mai 2024

Dans les exemples présentés, il se distingue par son aspect cinématographique, capable de créer des vidéos en résolution FHD d’une certaine durée, environ une minute par prise. De plus, vous pouvez utiliser des effets visuels, tels que des filtres, des particules de fumée… Mais le meilleur, c’est que ces vidéos peuvent être éditées à l’aide de commandes de texte.

En collaboration avec Veo, ils ont présenté Imaginez 3, le nouveau moteur de génération d’images, avec une qualité qui rappelle Adobe Firefly en raison des résultats photoréalistes. De plus, ils ont accordé de l’importance au texte, ce que de nombreux moteurs d’IA ont du mal à créer. Les deux produits seront disponibles dans la section Google Labs, même s’il n’y a pas de date pour un déploiement commercial massif.

En route vers l’AGI

Toutes les avancées démontrées par Google sont impressionnantes, comme l’intelligence artificielle qui parvient à prédire la structure et l’interaction de toutes les molécules de la vie, et maintiennent l’entreprise dans la course pour atteindre l’objectif ultime, l’AGI. L’Intelligence Générale Artificielle ou Intelligence Artificielle Générale est ce que Google et OpenAI cherchent à développerun système capable d’effectuer plusieurs actions sans avoir besoin d’être formé pour le faire, capable d’apprendre par lui-même.

Cela n’a pas encore été créé, mais à la vitesse à laquelle nous voyons les développements actuels, il n’est pas fou de penser que tôt ou tard, l’une de ces deux sociétés créera probablement un tel produit. Pendant ce temps, Google et Open Ai continueront de diriger le développement de produits dotés d’intelligence artificielle, et ce sera nous qui en profiterons.



fr-02