Gemini, la réfutation de Google au GPT-4, est ici
Et il est prêt pour le Pixel 8 Pro et Bard.
Google a dévoilé Gemini, le qualifiant de « modèle d’IA le plus grand et le plus performant ».
Mercredi, Google DeepMind, le laboratoire de recherche en intelligence artificielle de la société, a présenté le modèle très attendu qui surpasserait le GPT-4 d’OpenAI sur les principaux benchmarks.
Depuis qu’OpenAI a lancé ChatGPT il y a un an, les principales entreprises technologiques se sont retrouvées engagées dans une compétition pour les progrès de l’IA. Jusqu’à présent, Microsoft a bénéficié d’un léger avantage grâce à son accès aux modèles d’OpenAI en tant qu’investisseur majeur dans la société d’IA. Google a été inhabituellement pris au dépourvu. La version initiale de Bard – son concurrent ChatGPT – a été bâclée. Et Google est généralement en retard sur les versions d’OpenAI et de Microsoft avec Bing et Copilot. Google Gemini, cependant, pourrait constituer une avancée suffisamment importante pour devancer OpenAI.
Qu’est-ce que les Gémeaux ?
Ce qui rend Gemini si bon, selon Google, ce sont ses capacités multimodales, son raisonnement sophistiqué et ses capacités de codage avancées. Contrairement à d’autres modèles d’IA multimodaux qui sont d’abord construits à partir de texte, puis ajoutent ensuite des données d’image, Gemini est nativement multimodal. Cela signifie qu’il a été pré-formé dès le début sur les modalités audio et image en plus du texte. « Cela aide Gemini à comprendre et à raisonner de manière transparente sur toutes sortes d’entrées à partir de la base, bien mieux que les modèles multimodaux existants », indique l’annonce.
Gemini a obtenu un score de 90 %, contre 86,4 % pour GPT-4 sur le MMLU (compréhension massive du langage multitâche), qui teste les connaissances multidisciplinaires et la résolution de problèmes.
Nous savons donc que les Gémeaux ont obtenu de bonnes notes, mais comment cela se passe-t-il dans le monde réel ? Nous sommes tous sur le point de le découvrir. Google a optimisé Gemini pour trois tailles différentes : Gemini Ultra, le plus grand modèle pour les tâches très complexes, Gemini Pro, le modèle de poids moyen capable de la plupart des autres tâches, et Gemini Nano, un modèle efficace suffisamment petit pour vivre sur votre téléphone.
En parlant de cela, à partir d’aujourd’hui, Gemini Nano fonctionnera sur le Google Pixel 8 Pro. Pour l’instant, Gemini Nano alimentera deux fonctionnalités de l’appareil. Il peut résumer les transcriptions dans l’application Recorder et suggérera également des réponses pour Smart Reply pour le clavier du téléphone (Gboard).
Même si vous n’êtes pas un utilisateur Android, vous pouvez tester Gemini dans Google Bard dès aujourd’hui. Attendez-vous à remarquer une amélioration globale du raisonnement, de la planification et de la compréhension. Gemini Pro alimentera Bard, mais uniquement des invites textuelles.
La multimodalité arrive bientôt. L’année prochaine, Google prévoit d’annoncer une version avancée de Bard qui sera alimentée par Gemini Ultra.