Rejoignez-nous
Divers

Le nouveau modèle d’IA de Meta est un expert en traduction en temps réel

Pierre

Date de publication :

le

Le nouveau modèle d'IA de Meta est un expert en traduction en temps réel

Meta vient de placer la barre pour les modèles de traducteur IA.

La dernière sortie IA de Meta constitue une avancée majeure pour la traduction de texte et de parole en temps réel.

Mardi, la société a lancé SeamlessM4T : un modèle multimodal qui traduit le texte en parole et vice versa. Meta affirme que SeamlessM4T est « le premier modèle de traduction et de transcription d’IA multimodal multilingue tout-en-un », ce qui signifie qu’il est unique en son genre capable de traduire et de transcrire des langues en même temps. SeamlessM4T peut traduire des entrées parole-texte, parole-parole, texte-parole et texte-texte dans jusqu’à 100 langues. Les traductions pour les sorties parole-parole et synthèse vocale prennent en charge 35 langues.

Comme d’autres modèles d’IA récemment publiés par Meta, notamment Llama 2 et AudioCraft, SeamlessM4T est accessible au public pour les chercheurs et développeurs disposant d’une licence de recherche. Parallèlement au modèle, Meta publie également son ensemble de données de formation appelé SeamlessAlign, qui compte 270 000 heures d’alignement de parole et de texte. Contrairement à OpenAI et Google, Meta a mis un point d’honneur à rendre ses modèles open source et accessibles au public. L’approche de Meta consistant à lancer des modèles open source a le double effet de permettre aux développeurs de créer et d’améliorer les produits, tout en gagnant des points parmi les éthiciens de l’IA qui réclament la transparence des systèmes d’IA générative.

L’approche open source de Meta peut sembler altruiste, mais il s’agit d’un coup de force stratégique sur un marché impitoyablement concurrentiel par rapport aux autres grandes entreprises technologiques développant l’IA. Il y a aussi la question de la collecte de données avec laquelle tous les modèles d’IA doivent faire face. Selon le billet de blog, l’ensemble de données de SeamlessM4T (SeamlessAlign) est constitué de données accessibles au public. Il existe des problèmes éthiques et juridiques liés à l’utilisation d’œuvres protégées par le droit d’auteur et de données personnelles sans consentement.

L’annonce de Meta ne détaille pas les plans spécifiques pour SeamlessM4T, laissant seulement entendre qu’elle souhaite « explorer comment ce modèle fondamental peut permettre de nouvelles capacités de communication ». En d’autres termes, nous pourrions un jour voir une version grand public de SeamlessM4T sur WhatsApp ou Instagram.

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.

Cliquer pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *