Microsoft a créé une voix d'IA si réelle qu'il est trop dangereux de la diffuser
Son synthétiseur vocal IA est trop réaliste.
Microsoft a un nouveau jouet d’IA — et non, vous ne pouvez pas l’utiliser.
Les chercheurs de l'entreprise ont révélé dans un article de recherche (repéré par Live Science) qu'ils ont construit un synthétiseur vocal IA capable de créer des voix humaines crédibles et réalistes directement à partir d'invites de texte.
Appelé VALL-E 2, le document de recherche affirme que c'est la première fois que la « parité humaine » est atteinte dans un système de synthèse vocale.
Bien sûr, il n'y a aucun moyen pour nous de le savoir avec certitude, car les gens ordinaires ne peuvent pas l'utiliser. Le billet de blog de Microsoft est très clair à ce sujet.
« Cette page est destinée uniquement à des fins de démonstration de recherche », indique le site Web de Microsoft. « Actuellement, nous n'avons pas l'intention d'intégrer VALL-E 2 dans un produit ou d'élargir l'accès au public. »
Malheureusement, il n'existe pas d'échantillons audio disponibles, vous devrez donc faire confiance aux chercheurs sur ce point. Cependant, l'article de blog propose de nombreux graphiques et termes techniques à explorer. Mais si c'est aussi bon qu'ils le disent, c'est peut-être pour le mieux que nous ne puissions pas l'entendre.