Modèles d'IA ouverts et formés par Google sur les vidéos YouTube
Les deux géants de la technologie ont transcrit des vidéos YouTube, ce qui peut violer les droits d'auteur des créateurs.
OpenAI et Google se sont tournés vers la transcription de vidéos YouTube pour perfectionner leurs modèles d'IA, ce qui pourrait violer les droits d'auteur des créateurs, rapporte le New York Times. Le rapport détaille comment les deux géants de la technologie, ainsi que Meta, ont pris des raccourcis pour accéder à autant de données que possible afin de former leurs modèles d'IA.
Selon le rapport, OpenAI a utilisé Whisper, un outil de reconnaissance vocale, pour transcrire plus d'un million d'heures de vidéos YouTube. Il a ensuite introduit les transcriptions dans GPT-4, le puissant système d'IA sur lequel fonctionne le dernier modèle de chatbot de ChatGPT. Google, propriétaire de YouTube, a également transcrit des vidéos YouTube pour entraîner ses modèles d'IA.
La transcription de vidéos par les deux sociétés peut porter atteinte aux droits d'auteur des créateurs sur leurs vidéos. D’autres utilisations du contenu des créateurs pour former l’IA ont donné lieu à des poursuites en matière de droits d’auteur et de licence.
L'utilisation par OpenAI des vidéos YouTube peut également enfreindre les règles de Google, qui interdisent l'utilisation de ses vidéos pour des applications « indépendantes » et « des moyens automatisés (tels que des robots, des botnets ou des scrapers) » pour accéder à ses vidéos.
Matt Bryant, porte-parole de Google, a déclaré au New York Times que la société n'était pas au courant d'une telle utilisation par OpenAI. Mais le rapport allègue que des personnes chez Google étaient au courant de l'utilisation non autorisée des vidéos YouTube par OpenAI et ont négligé de prendre des mesures parce qu'elles faisaient la même chose. Google a également déclaré au journal qu'il entraîne son IA uniquement sur des vidéos de créateurs qui ont accepté que leur contenu soit utilisé de cette manière.
En juillet 2023, Google a modifié ses conditions d'utilisation pour autoriser l'utilisation de documents publics en ligne tels que les critiques de restaurants Google Docs et Google Maps afin de perfectionner ses modèles d'IA.