Anthropic sort Claude 3.5 Sonnet. 3 choses à savoir sur le rival ChatGPT.

Date de publication :

Publié il y a 2 ans

21 juin 2024

Par

Anthropic sort Claude 3.5 Sonnet. 3 choses à savoir sur le rival ChatGPT.

Comment Claude 3.5 Sonnet se compare à ChatGPT.

Anthropic dispose d'un nouveau modèle d'IA générative pour rivaliser avec le GPT-4o d'OpenAI en termes d'intelligence, de vitesse et de capacités de vision.

Jeudi, la société d'IA qui se présente comme l'alternative éthique et responsable à OpenAI, a annoncé Claude 3.5 Sonnet. Au sein de la famille de modèles Anthropic, Claude Sonnet est l'enfant du milieu qui allie vitesse et performance pour la plupart des tâches quotidiennes. En comparaison, Claude Haiku est le modèle le plus léger et le plus rapide, et Claude Opus est le modèle de puissance industrielle pour les tâches complexes de mathématiques et de codage.

Claude 3.5 Sonnet est une version plus avancée de Claude 3 Sonnet, qui, selon la société, surpasse Claude 3 Opus en termes d'intelligence. Dans l'annonce

Claude 3.5 Sonnet bat (légèrement) GPT-4o sur plusieurs benchmarks

La comparaison de référence est devenue monnaie courante pour chaque nouvelle version d’un modèle d’IA. Qu'il s'agisse de Google Gemini, de GPT-4o d'OpenAI ou de Llama 3 de Meta, ce que le public veut vraiment savoir, c'est comment ils se comparent à leurs concurrents lors des tests d'évaluation standard.

Le tweet a peut-être été supprimé

Lors des tests d'Anthropic, Claude 3.5 Sonnet surpasse GPT-4o, Gemini 1.5 Pro et Llama dans plusieurs catégories clés comme le raisonnement et le codage. Il a également battu GPT-4o en raisonnement au niveau des cycles supérieurs et l'a égalé en connaissances au niveau du premier cycle. Ce n'est pas rien, mais Claude 3.5 Sonnet ne bat ses rivaux que de quelques points de pourcentage sur la plupart des benchmarks. Ainsi, pour l’utilisateur moyen, il n’y aura peut-être pas de différence notable dans la gestion des tâches quotidiennes.

Comme le note Gary Marcus, éminent scientifique et professeur en IA, les progrès informatiques ont ralenti ces derniers temps. « Le domaine a dépensé plus de 50 milliards de dollars l'année dernière pour essayer de battre de manière décisive GPT-4, mais jusqu'à présent, ce que (je) vois, c'est une convergence, plutôt qu'une croissance exponentielle continue. » Outre le fait que l'AGI n'est peut-être pas aussi proche qu'on le pense, le Claude 3.5 Sonnet semblera probablement assez similaire aux autres modèles avancés.

Le tweet a peut-être été supprimé

Claude 3.5 Sonnet possède des capacités de vision avec différents degrés d'accès

Claude 3.5 Sonnet est la première version gratuite d'Anthropic à disposer de capacités de vision. Comme son concurrent GPT-4o, sorti en mai, le dernier modèle d'Anthropic peut interpréter des tableaux et des graphiques, transcrire du texte à partir d'images et, de manière générale, comprendre des visuels et des images. Une démo dans l'annonce montre Claude 3.5 Sonnet transcrivant les données des étapes de séquençage du génome et un graphique des coûts au fil du temps, puis combinant les données en un seul graphique. Ensuite, il prépare un diaporama pour un cours de génomique.

Anthropic affirme qu'il inclut des capacités de vision comme fonctionnalité pour la version gratuite de Claude 3.5 Sonnet. Mais la version gratuite a une limite de fenêtre qui dépend de l’utilisation quotidienne et de la capacité. Lorsque nous avons essayé de télécharger une capture d'écran d'une image sur Facebook, on nous a dit que la limite était dépassée même si elle était inférieure à la taille maximale du fichier. Cela peut être dû à un bug ou à une forte demande à certaines heures de la journée. Mais tout comme ChatGPT, 20 dollars par mois vous permettront d'obtenir la version Pro avec une bande passante et une disponibilité prioritaires.

Claude 3.5 Sonnet ne génère pas d'images

Claude 3.5 Sonnet peut comprendre et interpréter les images téléchargées (avec plus de succès si vous payez pour la version Pro) mais il ne peut pas générer d'images. Contrairement au DALL-E 3 d'OpenAI, Anthropic ne dispose pas actuellement de générateur d'images IA. Cela pourrait être dû à l’approche plus prudente d’Anthropic en matière de déploiement de l’IA générative. Et les images générées par l’IA amènent les entreprises dans un domaine particulièrement risqué en matière d’utilisation abusive de la technologie.

« La détection et l'atténuation des utilisations interdites de notre technologie sont essentielles pour empêcher les mauvais acteurs d'utiliser nos modèles à mauvais escient pour générer du contenu abusif, trompeur ou trompeur », a déclaré Anthropic décrivant son approche dans le livre blanc annonçant la famille de modèles Claude 3. « Les invites utilisateur signalées comme violant la (Politique d'utilisation acceptable) déclenchent une instruction à nos modèles pour qu'ils répondent avec encore plus de prudence. »

Malgré cet inconvénient, les utilisateurs félicitent le modèle pour sa rapidité et ses capacités de codage. Il y a donc encore assez de facteur wow pour tout le monde.

Le tweet a peut-être été supprimé

Article suivant

1Password ajoute des codes de récupération au cas où votre compte serait bloqué

Article précédent

Les meilleures offres du 4 juillet sont déjà en cours – voici ce que vous devez savoir

Pierre Challon

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.