Rejoignez-nous
Divers

Cette vidéo Google Gemini était tellement étonnante grâce à un montage astucieux

Pierre

Date de publication :

le

Cette vidéo Google Gemini était tellement étonnante grâce à un montage astucieux

Les choses ne sont pas ce qu’elles semblent être avec Google Gemini

Une vidéo de démonstration de Gemini, le nouveau modèle d’IA de Google, n’est pas aussi « époustouflante » qu’il y paraît.

Mercredi, Google a publié Gemini, un modèle multimodal construit en natif qui a surpassé le GPT-4 d’OpenAI dans les principaux tests de référence en matière de renseignement. Une vidéo de démonstration de six minutes montrant les incroyables capacités des Gémeaux à suivre une balle dans une tasse, à localiser des pays sur une carte et à identifier un simple dessin de canard. impressionné techniciens sur les réseaux sociaux – et a semblé convaincre Internet que l’AGI (intelligence générale artificielle) se profilait à l’horizon.

Mais il n’a pas fallu longtemps aux experts pour découvrir que la vidéo Gemini était un peu exagérée. Comme Parmy Olson pour Bloomberg l’a rapporté pour la première fois, la vidéo a été montée de nombreuses manières.

Comment Google a-t-il embelli la démo Gemini ?

Comme l’a confirmé Google, la vidéo n’a pas été tournée en temps réel. Au lieu de cela, la vidéo a été créée en « utilisant des images fixes de la séquence et des invites via du texte », selon un porte-parole de Google.

Il semble que Gemini soit invité par la voix de la personne, mais l’audio a en fait été ajouté plus tard. Cependant, « l’utilisateur exprime des extraits réels des invites réelles utilisées pour produire la sortie Gemini qui suit », a déclaré le représentant de Google. De plus, selon la description sur YouTube, « la latence a été réduite et les sorties Gemini ont été raccourcies par souci de concision ». En d’autres termes, son temps de réponse rapide dans la vidéo n’est pas réel.

Après qu’il a été révélé que les capacités de Gemini étaient gonflées par un montage vidéo astucieux, Oriol Vinyals, vice-président de l’apprentissage et de la recherche chez Google DeepMind. posté sur X (anciennement Twitter) pour mettre les choses au clair. « Toutes les invites et sorties utilisateur dans la vidéo sont réelles, abrégées par souci de concision », a déclaré Vinyals. « La vidéo illustre à quoi pourraient ressembler les expériences utilisateur multimodales créées avec Gemini. Nous l’avons créée pour inspirer les développeurs. »

Mais les utilisateurs se sentent toujours trompés. « Si vous voulez inspirer les développeurs, pourquoi ne publiez-vous pas du contenu factuel ? Les invites ne peuvent pas être  » réelles  » et raccourcies en même temps. C’était fallacieux et trompeur « , a commenté un utilisateur sur le post de Vinyals. « Désolé, « réel mais raccourci » n’est pas une chose. » dit un autre.

Les réactions négatives suscitées par la démo ont éclipsé certaines des réalisations réelles de Gemini. Le billet de blog expliquant comment la vidéo a été réalisée a montré les capacités de raisonnement impressionnantes de Gemini, même si ce n’était que par le biais d’invites textuelles et de photos (par opposition à la voix et à la vidéo). D’autres vidéos promotionnelles présentaient des cas d’utilisation spécifiques sur la façon dont Gemini peut extraire des données scientifiques de 200 000 articles de recherche ou aider les parents à aider leurs enfants à faire leurs devoirs de mathématiques et de physique.

Cela dit, c’est aux utilisateurs de décider si les capacités de Gemini sont supérieures ou inférieures aux attentes.

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.

Cliquer pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *