C’est comme ChatGPT avec un corps : regardez la démo effrayante du robot alimenté par OpenAI « Figure 01 »
Je préfère mon ChatGPT désincarné, merci beaucoup.
Une démo effrayante de « Figure 01 », un robot humanoïde conversationnel, a été diffusée sur Internet – et je ne peux pas croire que ce ne soit pas une scène supprimée de Moi, Robot.
Dans la démo, on demande à la figure 01, dotée de la technologie OpenAI, ce qu’elle peut « voir ». Faisant étalage de ses prouesses en matière de reconnaissance visuelle, le robot avant-gardiste explique avec précision ce qui se trouve devant lui : une pomme rouge, un étendoir avec de la vaisselle et l’homme qui a posé la question à la Figure 01.
OK, c’est un peu étrange, mais ce n’est rien que nous n’ayons jamais vu auparavant, n’est-ce pas ? Par exemple, l’année dernière, Google a montré comment le modèle d’IA Gemini pouvait reconnaître les stimuli placés devant lui, depuis un canard en caoutchouc bleu jusqu’à diverses illustrations dessinées à la main (bien qu’il ait été découvert plus tard qu’une édition astucieuse exagérait légèrement ses capacités).
Mais ensuite, l’homme demande : « Puis-je avoir quelque chose à manger ? Le personnage 01 saisit la pomme, reconnaissant clairement que c’est le seul objet comestible sur la table, et la lui tend.
Euh, sommes-nous sûrs que Will Smith ne va pas apparaître de si tôt ?
Comment fonctionne le robot Figure 01 ?
Qu’est-ce qui sous-tend exactement l’interaction fluide de la figure 01 avec un humain ? Il s’agit d’un nouveau modèle de langage visuel (VLM) transformant la figure 01 d’un morceau de ferraille encombrant en un robot futuriste de science-fiction qui ressemble un peu trop à un humain. (Le VLM est issu d’une collaboration avec OpenAI et Figure, la startup derrière Figure 01.)
Après avoir remis la pomme, la figure 01 révèle qu’elle peut accomplir plusieurs tâches en même temps lorsqu’on lui demande : « Pouvez-vous expliquer pourquoi vous (m’avez donné la pomme) pendant que vous ramassez ces déchets ?
Tout en reconnaissant ce qui est un déchet (et ce qui ne l’est pas) et en plaçant les objets appropriés dans ce que la figure 01 identifie comme une poubelle, le robot explique qu’il a offert une pomme à l’homme parce que c’était la seule chose devant lui qui pouvait être mangée. C’est un multitâche impressionnant !
Enfin, l’homme demande à la figure 01 dans quelle mesure elle pense avoir réussi. Dans le cadre d’une conversation, le robot dit : « Je pense que j’ai plutôt bien réussi. La pomme a trouvé son nouveau propriétaire, les déchets ont disparu et la vaisselle est à sa place. »
Selon Brett Adcock, le fondateur de Figure, Figure 01 dispose de caméras embarquées qui alimentent les données VLM qui l’aident à « comprendre » la scène devant lui, permettant au robot d’interagir en douceur avec l’humain devant lui. Aux côtés d’Adcock, la figure 01 est le fruit de l’idée originale de plusieurs acteurs clés de Boston Dynamics, Tesla, Google Deep Mind et Archer Aviation.
En fouillant le robot Optimus d’Elon Musk, Adcock s’est vanté que la figure 01 n’était pas téléopérée. Autrement dit, contrairement à Optimus, qui est devenu viral pour avoir plié une chemiseLa figure 01 peut fonctionner indépendamment.
Le but ultime d’Adcock ? Former un système d’IA ultra-avancé pour contrôler des milliards de robots humanoïdes, révolutionnant potentiellement plusieurs industries. On dirait que moi, Robot est bien plus réel que nous le pensions.