Il y a un peu plus d’un an, ChatGPT provoquait un véritable séisme dans le secteur technologique. Pour la première fois, l’IA générative était à la portée du grand public, et il ne s’agissait pas d’un simple concept futuriste ; C’était réel et n’importe qui pouvait l’utiliser pour créer des textes de n’importe quel type.
Quelques semaines plus tard, des IA capables de créer des images, comme Dall-E et Midjourney, ont montré que ni l’industrie ni les internautes n’étaient préparés à un tel potentiel. Maintenant, nous avons vu un saut tout aussi important, voire plus important, avec l’introduction de Sora.
Sora est la nouvelle IA d’OpenAI, créateur de ChatGPT et Dall-E et dirigée par l’une des personnalités les plus controversées du secteur, Sam Altman. Décrit comme un génie visionnaire par certains, et un fou avide par d’autres, Altman a laissé derrière lui la peur de l’IA et a appuyé sur l’accélérateur dans le développement de nouveaux modèles multimodaux, capables de créer tout type de contenu à travers des textes, des images. et vidéo.
Les vidéos de Sora
Le résultat de ce pari est Sora. Ce n’est pas la première Intelligence Artificielle capable de créer des vidéos, loin de là ; mais c’est sans doute le plus avancé. La différence par rapport à d’autres projets de création vidéo comme celui de Google est énorme ; Comparer des vidéos créées par les deux IA, c’est comme comparer les graphismes d’une PlayStation avec ceux d’une PlayStation 5, c’est comme si plusieurs générations s’étaient écoulées entre les deux. Mais en réalité, ils ont été développés quasiment en même temps.
Invite : Une femme élégante marche dans une rue de Tokyo avec des néons lumineux et des panneaux de ville animés. Elle porte une veste en cuir, une longue robe rouge et des bottes noires et porte un sac noir. Elle porte des lunettes de soleil et du rouge à lèvres. Marchez avec confiance et avec désinvolture. La rue est humide et réfléchissante, créant un effet miroir des lumières colorées. Plusieurs piétons marchent.
Les vidéos partagées par OpenAI démontrent comment ce modèle est capable de prendre du texte et de créer des vidéos avec différents styles et « directions » ; des créations réalistes qui semblent avoir été enregistrées avec une caméra dans des lieux réels, aux scènes animées qui pourraient parfaitement s’intégrer dans le prochain film Pixar.
Invite : scène animée avec un plan rapproché d’un petit monstre pelucheux agenouillé à côté d’une bougie rouge fondante. Le style artistique est 3D et réaliste, en mettant l’accent sur l’éclairage et la texture. L’ambiance est à l’émerveillement et à la curiosité, le monstre regardant la flamme les yeux et la bouche ouverts. Sa pose et son expression témoignent d’un sentiment d’innocence et de plaisir, comme s’il explorait le monde pour la première fois. L’utilisation de couleurs chaudes et d’un éclairage spectaculaire améliore l’atmosphère de l’image.
La clé de ce réalisme, selon OpenAI, est que Sora est capable de comprendre « comment les objets existent dans le monde physique », et ne souffre donc pas des problèmes habituels de la création vidéo, comme le mélange entre objets que les premières créations. causé tant de cauchemars il y a quelques années. Ils admettent cependant qu’il y a encore place à l’amélioration, notamment en matière de simulation physique.
Invite : Une volée d’avions en papier survole une jungle dense, volant à travers les arbres comme s’il s’agissait d’oiseaux migrateurs.
Invite : Un chat réveille son propriétaire endormi en lui demandant de prendre un petit-déjeuner. Le propriétaire essaie d’ignorer le chat, mais celui-ci essaie de nouvelles tactiques et finalement, le propriétaire sort une réserve secrète de friandises de l’oreiller pour permettre au chat de tenir un peu plus longtemps.
Il n’échappe à personne que Sora est comme la boîte de Pandore et qu’une fois ouverte, il sera impossible de la refermer. Créer des vidéos professionnelles sera aussi simple que d’écrire ce que l’on veut, et cela peut avoir des conséquences très graves pour des millions de personnes ; de la perte d’emplois que cela entraînera inévitablement, à la création de fausses vidéos pour tromper la population, comme des politiciens partageant de faux crimes commis par leur rival ou des magasins présentant des produits contrefaits.
Invite : Images historiques de la Californie pendant la ruée vers l’or.
Invite : Les archéologues découvrent une chaise en plastique dans le désert, la creusant et l’époussetant avec le plus grand soin. Échec : Dans cet exemple, Sora ne considère pas la chaise comme un objet rigide, conduisant à des interactions physiques imprécises.
Par conséquent, pour le moment, Sora n’est pas accessible au public et ne peut pas être utilisé même si nous avons un abonnement aux services OpenAI. Seul un nombre limité de personnes de « l’équipe rouge » d’OpenAI, qui seront chargées de détecter les dommages et les risques potentiels, peuvent créer des vidéos. La société a également confirmé qu’elle offrirait l’accès à divers « artistes, designers et cinéastes » pour donner leur avis.
Cela peut vous intéresser
Suivez les sujets qui vous intéressent