OpenAI annonce Sora, un modèle texte-vidéo d’IA sauvage. Voyez-le en action.
Bienvenue dans l’ère de la vidéo IA.
D’abord du texte, puis des images, OpenAI dispose désormais d’un modèle pour générer des vidéos.
Jeudi, les créateurs de ChatGPT et DALL-E ont annoncé Sora, un modèle de diffusion texte-vidéo. À partir d’aujourd’hui, Sora est à la disposition des équipes rouges, ou des experts qui testent de manière contradictoire le modèle pour détecter les dommages et les risques. Selon l’annonce, il est également disponible pour un groupe sélectionné d’artistes visuels, de designers et de cinéastes « pour obtenir des commentaires sur la manière de faire progresser le modèle afin qu’il soit le plus utile possible aux professionnels de la création ».
Le tweet a peut-être été supprimé
OpenAI développe des outils d’IA générative à un rythme effréné depuis le lancement de ChatGPT en novembre 2022. Depuis lors, nous avons vu la sortie de GPT-4, des invites vocales et image, le nouveau modèle d’image DALL-E 3, tous disponibles via ChatGPT. L’API d’OpenAI a également eu un effet exponentiel sur le secteur de l’IA, en permettant aux entreprises et aux développeurs de créer leurs propres outils d’IA générative. Aujourd’hui, OpenAI franchit une prochaine étape majeure vers l’avancement des capacités de l’IA grâce à la génération vidéo.
Il existe d’autres modèles de génération de vidéos, mais aucun n’est capable de produire des vidéos réalistes et complexes comme celles que Sora est censé créer. Meta dispose d’un outil permettant de créer de courts clips vidéo et Google travaille sur son propre modèle de conversion texte-vidéo, mais il est encore en phase de recherche.
Avec Sora, les utilisateurs peuvent générer des vidéos d’une durée maximale d’une minute, incorporant des scènes détaillées et plusieurs personnages. L’annonce comprend des extraits d’une vidéo suivant un SUV le long d’une route de montagne sinueuse et des images « historiques » de la Californie à l’époque de la ruée vers l’or.
Passons maintenant aux petits caractères de sécurité. En plus de l’équipe rouge du modèle, OpenAI affirme que ses outils de création permettent d’étiqueter les vidéos créées par Sora en tant que telles, conformément aux directives C2PA. Il utilise également les méthodes de sécurité existantes appliquées à DALL-E qui rejettent les invites textuelles inappropriées ou nuisibles.
Enfin, OpenAI affirme qu’elle « engagera les décideurs politiques, les éducateurs et les artistes du monde entier à comprendre leurs préoccupations et à identifier des cas d’utilisation positifs pour cette nouvelle technologie ». La société estime que la meilleure façon d’apprendre toutes les manières bénéfiques et nuisibles dont les gens utiliseront Sora est de « apprendre de l’utilisation du monde réel est un élément essentiel de la création et de la publication de systèmes d’IA de plus en plus sûrs au fil du temps ».