Déplacez-vous sur Bing Image Creator ! Google annonce un nouvel outil de génération d’images IA
L’expérience de recherche IA de Google devient multimodale.
À l’heure actuelle, l’expérience de recherche basée sur l’IA de Google, baptisée SGE, est multimodale. Dans la foulée de la sortie par OpenAI de DALL-E 3 et de Bing Image Creator de Microsoft, le SGE de Google dispose désormais de son propre outil de génération d’images IA.
Propulsés par les modèles de diffusion texte-image Imagen de Google, les utilisateurs ayant accès à SGE peuvent décrire l’image de leur choix et, en quelques secondes, SGE leur proposera quatre variétés parmi lesquelles choisir. À partir de là, les utilisateurs peuvent modifier davantage la description pour peaufiner l’image qu’ils souhaitent voir. Dans l’exemple de Google, la demande initiale concerne une image fantaisiste d’un capybara portant une toque de chef et cuisinant du bacon. Les utilisateurs peuvent modifier la description pour faire cuire les pommes de terre rissolées au capybara à la place.
Dans la course aux armements en matière d’IA, ou Thunderdome – ou peu importe comment vous voulez appeler les géants de la technologie en compétition pour la domination du marché de l’IA – la multimodalité est un territoire stratégique convoité. La multimodalité fait référence à la capacité d’un modèle d’IA à comprendre et à traiter différents types de médias, notamment l’image et l’audio.
Un chatbot IA qui converse avec les utilisateurs est une chose, mais « voir », « entendre » et produire des résultats créatifs est un tout nouveau niveau de sophistication de l’IA. OpenAI a récemment publié la dernière version de son outil de génération d’images DALL-E 3. Microsoft, qui est un investisseur d’OpenAI, utilise désormais DALL-E 3 pour Bing Image Creator. Et maintenant, Google propose sa propre version à SGE.
L’accès généralisé aux outils de génération d’images d’IA n’est pas sans préoccupations majeures, notamment la propagation de la désinformation et des violations des droits d’auteur. SGE a été formé pour bloquer les contenus nuisibles ou trompeurs qui enfreignent la politique d’IA générative de Google, et il ne montrera pas les visages photoréalistes de personnes célèbres pour empêcher d’éventuels deepfakes. Par mesure de précaution supplémentaire, l’outil est destiné aux utilisateurs âgés de 18 ans et plus.
Les images créées par SGE comporteront des métadonnées et un filigrane intégré pour indiquer qu’elles sont générées par l’IA. De plus, les modèles Imagen de Google ont été formés sur du contenu accessible au public. Indigo Buzz a demandé à Google si les données utilisateur provenant des invites textuelles et des images générées étaient utilisées pour entraîner le modèle. Nous avons également demandé s’il existait une option de désinscription. Nous mettrons à jour cette histoire lorsque nous aurons une réponse.
Une autre nouveauté de SGE est la possibilité de rédiger des messages. Il s’agit de la même fonctionnalité disponible dans le chatbot AI de Google, mais elle est désormais accessible directement dans la fonction de recherche de SGE, ce qui vous évite de passer d’une fenêtre à l’autre.
La génération d’images et la rédaction de messages au sein de SGE sont aujourd’hui présentées en anglais aux utilisateurs aux États-Unis.