OpenAI a introduit un nouveau modèle Sora AI pour la création vidéo

OpenAI a annoncé un nouveau modèle IA Sora, capable de générer des vidéos haute définition d'une durée maximale d'une minute sur la base d'invites textuelles. Sora, qui signifie « ciel » en japonais, ne sera pas disponible au grand public de sitôt, mais la société le communiquera à un petit groupe de scientifiques et de chercheurs qui évalueront les dégâts et les abus potentiels.

"Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques et des détails précis sur les objets et l'arrière-plan", indique le site Web de la société. "Le modèle comprend non seulement ce que l'utilisateur a demandé dans l'invite, mais aussi comment ces choses existent dans le monde physique."

Une vidéo générée par Sora montre un couple marchant dans un Tokyo enneigé avec des fleurs de cerisier et des flocons de neige tourbillonnant autour d'eux, tandis qu'une autre montre des mammouths laineux d'apparence réaliste marchant dans une prairie enneigée sur fond de chaînes de montagnes aux sommets enneigés.

Présentation de Sora, notre modèle texte-vidéo.

Sora peut créer des vidéos d'une durée maximale de 60 secondes présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes. https://t.co/7j2JN27M3W

Invite : "Beau, enneigé... phototwitter.com/ruTEWn87vf

- OpenAI (@OpenAI) 15 février 2024

OpenAI dit que le modèle fonctionne avec une « compréhension profonde du langage » qui lui permet d’interpréter des indices textuels. Cependant, comme presque tous les générateurs d’images et de vidéos IA, Sora n’est pas parfait. OpenAI prévient également que le modèle peut être difficile à établir une cause et un effet - par exemple, il peut générer une vidéo d'une personne mangeant un cookie, mais il peut ne pas montrer de marques de morsure.

Sora n'est pas le premier modèle de conversion texte-vidéo. D'autres sociétés, dont Meta, Google et Runway, ont soit fait allusion à des outils de conversion texte-vidéo, soit les ont rendus accessibles au public. Cependant, aucun autre outil n'est actuellement capable de générer une vidéo de 60 secondes. Sora génère également des vidéos entières à la fois, plutôt que de les collecter image par image comme les autres modèles, de sorte que les objets de la vidéo restent intacts même lorsqu'ils disparaissent temporairement de la vue.

Invite : "Plusieurs mammouths laineux géants s'approchent en traversant une prairie enneigée, leur longue fourrure laineuse souffle légèrement dans le vent pendant qu'ils marchent, des arbres couverts de neige et des montagnes aux sommets enneigés spectaculaires au loin, la lumière du milieu de l'après-midi avec des nuages vaporeux et un soleil haut dans la distance… phototwitter.com/Um5CWI18nS

- OpenAI (@OpenAI) 15 février 2024

L’avènement des outils de conversion texte-vidéo a suscité des inquiétudes quant à leur capacité à créer plus facilement de fausses vidéos réalistes. Et plus largement, l’IA générative a provoqué une réaction négative de la part des artistes et des travailleurs créatifs, inquiets que la technologie puisse potentiellement les remplacer.

OpenAI a déclaré qu'il travaillait avec des experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés pour tester l'outil avant de le rendre accessible au public. La société développe également des outils capables de détecter les vidéos créées par Sora et d'inclure des métadonnées dans les vidéos créées pour les rendre plus faciles à découvrir. La société a refusé de préciser comment Sora avait été formé, mais a déclaré qu'elle utilisait à la fois des « vidéos du domaine public » et des vidéos sous licence des titulaires de droits.

Lisez aussi:

sources'engager

S'inscrire

0 Commentaires

Avis intégrés

Voir tous les commentaires

Autres articles

Le modèle Sora AI d'OpenAI générera des vidéos d'une minute à partir d'invites textuelles

Commentaires récents