Rejoignez-nous
Divers

OpenAI annonce Sora, un modèle texte-vidéo d’IA sauvage. Voyez-le en action.

Pierre

Date de publication :

le

OpenAI annonce Sora, un modèle texte-vidéo d'IA sauvage.  Voyez-le en action.

Bienvenue dans l’ère de la vidéo IA.

D’abord du texte, puis des images, OpenAI dispose désormais d’un modèle pour générer des vidéos.

Jeudi, les créateurs de ChatGPT et DALL-E ont annoncé Sora, un modèle de diffusion texte-vidéo. À partir d’aujourd’hui, Sora est à la disposition des équipes rouges, ou des experts qui testent de manière contradictoire le modèle pour détecter les dommages et les risques. Selon l’annonce, il est également disponible pour un groupe sélectionné d’artistes visuels, de designers et de cinéastes « pour obtenir des commentaires sur la manière de faire progresser le modèle afin qu’il soit le plus utile possible aux professionnels de la création ».

OpenAI développe des outils d’IA générative à un rythme effréné depuis le lancement de ChatGPT en novembre 2022. Depuis lors, nous avons vu la sortie de GPT-4, des invites vocales et image, le nouveau modèle d’image DALL-E 3, tous disponibles via ChatGPT. L’API d’OpenAI a également eu un effet exponentiel sur le secteur de l’IA, en permettant aux entreprises et aux développeurs de créer leurs propres outils d’IA générative. Aujourd’hui, OpenAI franchit une prochaine étape majeure vers l’avancement des capacités de l’IA grâce à la génération vidéo.

Il existe d’autres modèles de génération de vidéos, mais aucun n’est capable de produire des vidéos réalistes et complexes comme celles que Sora est censé créer. Meta dispose d’un outil permettant de créer de courts clips vidéo et Google travaille sur son propre modèle de conversion texte-vidéo, mais il est encore en phase de recherche.

Avec Sora, les utilisateurs peuvent générer des vidéos d’une durée maximale d’une minute, incorporant des scènes détaillées et plusieurs personnages. L’annonce comprend des extraits d’une vidéo suivant un SUV le long d’une route de montagne sinueuse et des images « historiques » de la Californie à l’époque de la ruée vers l’or.

Passons maintenant aux petits caractères de sécurité. En plus de l’équipe rouge du modèle, OpenAI affirme que ses outils de création permettent d’étiqueter les vidéos créées par Sora en tant que telles, conformément aux directives C2PA. Il utilise également les méthodes de sécurité existantes appliquées à DALL-E qui rejettent les invites textuelles inappropriées ou nuisibles.

Enfin, OpenAI affirme qu’elle « engagera les décideurs politiques, les éducateurs et les artistes du monde entier à comprendre leurs préoccupations et à identifier des cas d’utilisation positifs pour cette nouvelle technologie ». La société estime que la meilleure façon d’apprendre toutes les manières bénéfiques et nuisibles dont les gens utiliseront Sora est de « apprendre de l’utilisation du monde réel est un élément essentiel de la création et de la publication de systèmes d’IA de plus en plus sûrs au fil du temps ».

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.

Cliquer pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Copyright © 2014-2023 - Indigo Buzz, site d'actualité collaboratif abordant les sujets comme l'high-tech, le web, les jeux vidéo, lifestyle ou encore le mobile !