ChatGPT vs Bing vs Bard : vous pouvez choisir le meilleur dans cette arène de chatbot
C’est comme un test de dégustation à l’aveugle pour l’IA générative. Essayez-le vous-même.
Vous voulez savoir comment ChatGPT, Bing et Bard se comparent ? Bienvenue dans la Chatbot Arena.
Un groupe de recherche de l’UC Berkeley en partenariat avec l’UC San Diego et l’Université Carnegie Mellon, a conçu une expérience où les utilisateurs peuvent discuter avec deux modèles anonymes en même temps et voter pour le meilleur. Chatbot Arena comprend des LLM d’Open AI (GPT-4), Google (PaLM), Meta (LLaMA) et Anthropic’s Claude, ainsi que d’autres modèles construits à l’aide des API de ces sociétés.
Lorsque vous entrez une invite dans le Chatbot Arena, deux modèles anonymes donnent leurs réponses. Une fois que vous avez voté, l’expérience vous indique pour quel modèle vous avez voté. Vous pouvez également expérimenter des comparaisons côte à côte de différents modèles et consulter le classement du modèle le plus voté.
Le groupe de recherche, appelé Large Model Systems Organization (LMSYS), a créé l’expérience participative comme moyen de comparer efficacement les nombreux LLM qui ont proliféré récemment. « L’analyse comparative des assistants LLM est extrêmement difficile car les problèmes peuvent être ouverts et il est très difficile d’écrire un programme pour évaluer automatiquement la qualité de la réponse », a déclaré le blog LMSYS annonçant Chatbot Arena. Jusqu’à présent, plus de 40 000 votes ont été exprimés.
Alors, quel LLM est le meilleur? Jusqu’à présent, cet honneur revient au GPT-4. En deuxième place se trouve Claude-v1 d’Anthropic, suivi de Claude Instant, qui est la version plus légère et plus rapide d’Anthropic de Claude. Consultez le classement pour les résultats complets, et essayez le Chatbot Arena pour vous-même sur le site Web de LMSYS.