Rejoignez-nous
Divers

Quoi de neuf dans Google Gemini AI ?

Pierre

Date de publication :

le

Quoi de neuf dans Google Gemini AI ?

Réponse : Pas beaucoup.

Les consommateurs et les investisseurs en ont assez du battage médiatique autour de l’IA, et Google le sait.

« Il y a eu tellement de promesses, tellement de « bientôt disponible », et pas assez d'aide concrète en matière d'IA », a déclaré Rick Osterloh, vice-président senior de Google, lors de l'événement « Made by Google » qui a dévoilé les nouveaux téléphones Pixel à Mountain View mardi. « C'est pourquoi aujourd'hui, nous sommes réalistes… nous allons répondre à la plus grande question que les gens se posent sur l'IA : que peut faire l'IA pour moi ? »

Alors, Google a-t-il tenu sa promesse ? Si l'on fait abstraction de tous les détails de la conférence (les apparitions de célébrités, le jargon sur les « unités de traitement Tensor », les spécifications techniques des téléphones Pixel, les visions de ce que Gemini pourrait être capable de faire à long terme), qu'est-ce qui était nouveau dans l'expérience Android ? Et est-ce que l'une de ces nouveautés peut être qualifiée d'application incontournable ?

Voici une liste complète de tout ce que l'événement de 90 minutes a offert en démonstrations de fonctionnement réel. En d'autres termes, une aide concrète, par opposition à des publicités ou des promesses.

1. Gemini peut consulter votre calendrier Google pour voir si vous êtes libre pour un futur concert, sur la base d'une affiche.

Pauvre Dave Citron. Dans le moment le plus gênant de la conférence, ce chef de produit de Google a dû invoquer « l'esprit de la démo » et changer de téléphone avant que Gemini n'affiche une réponse à la question « Vérifiez mon calendrier et voyez si je suis libre quand elle viendra à San Francisco cette année » (« elle » étant l'artiste Sabrina Carpenter ; Citron venait d'envoyer à Gemini une photo de l'affiche de son concert).

« Sabrina Carpenter viendra à San Francisco le 9 novembre 2024 », a finalement répondu Gemini. « Je ne vois aucun événement sur votre calendrier à cette période. »

L'intelligence artificielle qui lit le texte d'une image et comprend le contexte n'est pas une nouveauté. L'ajout au calendrier l'est, et c'est à l'avantage de Google. En théorie, Apple Intelligence fera la même chose lors de ses débuts.

Les démonstrations suivantes de Citron ont montré comment Gemini pouvait rédiger une lettre à un propriétaire au sujet d'un climatiseur en panne, ou à un professeur au sujet d'un cours – un terrain bien connu de tous les assistants IA.

2. Gemini Live offre une « conversation fluide »

Ensuite, la vice-présidente de Google, Jenny Blackburn, a présenté l'assistant vocal Gemini Live. Ils ont discuté des expériences scientifiques qui pourraient plaire à sa nièce et à son neveu et, après quelques échanges, ont décidé de fabriquer de l'encre invisible. La discussion s'est déroulée sur un ton conversationnel.

Tout va bien, sauf qu'OpenAI a présenté son assistant vocal GPT-4o, avec des conversations tout aussi interruptibles, en mai dernier. Cette fonctionnalité est actuellement disponible pour un petit groupe d'utilisateurs de ChatGPT Plus, mais pas pour tous. Google a donc été le premier à y arriver, on suppose ?

3. Gemini Nano propose des résumés de vos appels téléphoniques sur l'appareil

Voici une fonctionnalité qui peut être moins effrayante qu'il n'y paraît : Call Notes, qui « donne suite à vos appels téléphoniques avec un résumé entièrement privé de la conversation ». Mais ne vous inquiétez pas, car elle utilise Gemini Nano, un service d'IA entièrement basé sur le téléphone Pixel 9 sans nécessiter d'accès au cloud. (La partie sur l'appareil n'est pas nouvelle ; Samsung fait la même chose avec Galaxy AI.)

4. Les captures d'écran sont consultables.

Marquez un succès supplémentaire pour Gemini Nano sur ce que nous appelons la fonctionnalité d'IA la plus utile de 2024.

Mais après cela, nous avons eu droit à beaucoup de choses visuelles que nous avons vu des assistants IA faire une douzaine de fois auparavant. À savoir : créer une invitation à une fête dans Pixel Studios, cadrer automatiquement dans Magic Editor, ajouter des images IA génératives à votre image, vous insérer dans une photo de famille ou une photo avec une célébrité (la nouvelle fonctionnalité au nom embarrassant « Ajoutez-moi »). Et aussi des choses mignonnes mais pas du tout IA (la fonction « Vous fait regarder » qui attirera l'attention de votre enfant sur l'écran arrière du Pixel).

Alors, cet ensemble de fonctionnalités suffira-t-il à dissiper le scepticisme qui s'est installé autour de la bulle de l'IA ? Ne comptez pas sur Gemini pour répondre à cette question de sitôt.

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.