Google giflé avec un procès pour « vol secret » de données pour former Bard
Du même cabinet d’avocats qui poursuit également OpenAI pour vol de données.
Un cabinet d’avocats californien a déposé un recours collectif contre Google pour avoir « secrètement volé » de grandes quantités de données sur le Web pour entraîner ses technologies d’intelligence artificielle.
Le cabinet d’avocats Clarkson poursuit le géant de la technologie pour négligence, atteinte à la vie privée, vol, violation du droit d’auteur et profit de données personnelles obtenues illégalement. « Google a pris toutes nos informations personnelles et professionnelles, nos travaux créatifs et rédigés, nos photographies et même nos e-mails – la quasi-totalité de notre empreinte numérique – et les utilise pour créer des produits commerciaux d’intelligence artificielle (« IA ») tels que ‘ Bard », a déclaré la plainte, qui a été déposée le 11 juillet dans le district nord de la Californie.
Le procès fait suite à la mise à jour discrète de sa politique de confidentialité par Google la semaine dernière, affirmant que toute information publique peut être utilisée pour former ses produits d’IA comme Bard. Google dit essentiellement que tout ce qui est publié sur le Web est un jeu équitable, mais le cabinet d’avocats estime qu’il s’agit d’une invasion massive de la vie privée, en grattant des données sans compensation ni consentement pour la raison expresse de la formation de modèles d’IA. Le procès allègue que Google, une entreprise de plusieurs milliards de dollars avec plus d’un milliard d’utilisateurs dans le monde, place les utilisateurs dans une position « intenable » : « soit utilisez Internet et renoncez à toutes vos informations personnelles et protégées par le droit d’auteur aux modèles d’IA insatiables de Google, soit évitez Internet entièrement. »
Dans une déclaration à Reutersl’avocate générale de Google, Halimah DeLaine Prado, a qualifié les affirmations de « sans fondement », affirmant que « nous utilisons des données provenant de sources publiques – telles que des informations publiées sur le Web ouvert et des ensembles de données publics – pour former les modèles d’IA derrière des services tels que Google Translate, de manière responsable et en ligne ». avec nos principes d’IA. »
Récemment, Clarkson a déposé un recours collectif similaire contre OpenAI, la société qui a créé ChatGPT, pour « vol et détournement de données personnelles », en utilisant le même type d’opération de grattage de données. Les grands modèles de langage ont besoin d’énormes quantités de données pour entraîner les chatbots IA et les rendre conversationnels et intelligents. Bard et ChatGPT s’appuient sur de grands modèles de langage pour fonctionner, ce qui a soulevé des inquiétudes quant à l’utilisation de données privées ainsi qu’à la violation du droit d’auteur.
Le procès le plus récent indique que Google a détourné des ensembles de données comme Common Crawl, une organisation à but non lucratif, qui rend ses données gratuites à des fins de recherche et d’éducation, ainsi que des données provenant de sites comme Medium et Kickstarter. Google utilise également ses propres données issues de Gmail et de Google Search pour alimenter ses modèles. D’autres données récupérées incluent des œuvres protégées par le droit d’auteur telles que des livres électroniques dans des bibliothèques numériques, et même des sites Web de piratage, que l’entreprise utilise sans rémunérer les artistes et les auteurs.
La clé du procès de Clarkson est la question du domaine public. Mais « » accessible au public « n’a jamais signifié une utilisation gratuite à quelque fin que ce soit », indique la plainte. Oui, certaines données ou disponibles à l’achat, mais cela dépend du contexte de leur utilisation et du consentement de l’utilisateur. Oui, les utilisateurs consentent aux politiques de confidentialité lorsqu’ils publient du contenu sur le Web, mais ils ont le droit de savoir s’il est utilisé ailleurs. En d’autres termes, dit Clarkson, « Google doit comprendre, une fois pour toutes : Internet ne lui appartient pas ».