Gemini, la réfutation de Google au GPT-4, est ici

Date de publication :

Publié il y a 3 ans

6 décembre 2023

Par

Pierre Challon

Gemini, la réfutation de Google au GPT-4, est ici

Et il est prêt pour le Pixel 8 Pro et Bard.

Google a dévoilé Gemini, le qualifiant de « modèle d’IA le plus grand et le plus performant ».

Mercredi, Google DeepMind, le laboratoire de recherche en intelligence artificielle de la société, a présenté le modèle très attendu qui surpasserait le GPT-4 d’OpenAI sur les principaux benchmarks.

Depuis qu’OpenAI a lancé ChatGPT il y a un an, les principales entreprises technologiques se sont retrouvées engagées dans une compétition pour les progrès de l’IA. Jusqu’à présent, Microsoft a bénéficié d’un léger avantage grâce à son accès aux modèles d’OpenAI en tant qu’investisseur majeur dans la société d’IA. Google a été inhabituellement pris au dépourvu. La version initiale de Bard – son concurrent ChatGPT – a été bâclée. Et Google est généralement en retard sur les versions d’OpenAI et de Microsoft avec Bing et Copilot. Google Gemini, cependant, pourrait constituer une avancée suffisamment importante pour devancer OpenAI.

Qu’est-ce que les Gémeaux ?

Ce qui rend Gemini si bon, selon Google, ce sont ses capacités multimodales, son raisonnement sophistiqué et ses capacités de codage avancées. Contrairement à d’autres modèles d’IA multimodaux qui sont d’abord construits à partir de texte, puis ajoutent ensuite des données d’image, Gemini est nativement multimodal. Cela signifie qu’il a été pré-formé dès le début sur les modalités audio et image en plus du texte. « Cela aide Gemini à comprendre et à raisonner de manière transparente sur toutes sortes d’entrées à partir de la base, bien mieux que les modèles multimodaux existants », indique l’annonce.

Gemini a obtenu un score de 90 %, contre 86,4 % pour GPT-4 sur le MMLU (compréhension massive du langage multitâche), qui teste les connaissances multidisciplinaires et la résolution de problèmes.

Nous savons donc que les Gémeaux ont obtenu de bonnes notes, mais comment cela se passe-t-il dans le monde réel ? Nous sommes tous sur le point de le découvrir. Google a optimisé Gemini pour trois tailles différentes : Gemini Ultra, le plus grand modèle pour les tâches très complexes, Gemini Pro, le modèle de poids moyen capable de la plupart des autres tâches, et Gemini Nano, un modèle efficace suffisamment petit pour vivre sur votre téléphone.

En parlant de cela, à partir d’aujourd’hui, Gemini Nano fonctionnera sur le Google Pixel 8 Pro. Pour l’instant, Gemini Nano alimentera deux fonctionnalités de l’appareil. Il peut résumer les transcriptions dans l’application Recorder et suggérera également des réponses pour Smart Reply pour le clavier du téléphone (Gboard).

Même si vous n’êtes pas un utilisateur Android, vous pouvez tester Gemini dans Google Bard dès aujourd’hui. Attendez-vous à remarquer une amélioration globale du raisonnement, de la planification et de la compréhension. Gemini Pro alimentera Bard, mais uniquement des invites textuelles.

La multimodalité arrive bientôt. L’année prochaine, Google prévoit d’annoncer une version avancée de Bard qui sera alimentée par Gemini Ultra.

Article suivant

Passez à Instacart+ et commencez à diffuser Peacock gratuitement

Article précédent

J’ai les lunettes intelligentes Ray-Ban Meta : 7 réponses aux questions des Redditors confus

Pierre Challon

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.