Une collection de livres en ligne géante utilisée par Meta pour former son IA est résolue par des problèmes de droits d’auteur
L’IA et les détenteurs de droits d’auteur se retrouvent une fois de plus sur le terrain de la bataille virtuelle.
L’IA telle que nous la connaissons existe essentiellement pour dévorer Internet et vous le recracher. Le problème avec cela est que d’énormes parties d’Internet sont protégées par la loi sur le droit d’auteur.
C’est l’un des principaux points à retenir de la gigantesque base de données Books3 qui a été supprimée à la suite d’une demande DMCA du groupe anti-piratage danois Rights Alliance, comme l’avait initialement rapporté TorrentFreak. Books3 contenait un peu plus de 196 000 livres au format texte brut pour les modèles d’IA à mâcher à des fins de formation, mais à part quelques liens alternatifs flottant sur Internet, il n’est plus accessible au public. L’ancien lien vers celui-ci mène à une page 404.
Books3 existait dans le cadre d’une plus grande collection de contenus de formation sur l’IA appelée The Pile, organisée par le groupe de recherche EleutherAI. Comme indiqué par un rapport de Gizmodo sur le sujet, Meta a déjà fait référence à l’utilisation de The Pile pour former son modèle d’IA interne. Ce ne serait pas le premier grand modèle d’IA technologique à être potentiellement formé sur du matériel diffusé illégalement, car un recours collectif déposé en juillet a accusé Google de faire la même chose.
Ce truc devient vite délicat au sens juridique, mais aussi au sens éthique. Par exemple, une personne qui pourrait être en faveur du piratage en général à des fins d’archivage historique pourrait également s’opposer avec véhémence aux modèles d’IA formés sur du matériel protégé par le droit d’auteur (j’ai l’impression de connaître plusieurs personnes qui pensent de cette façon). Il est également facile de comprendre pourquoi les auteurs s’opposeraient à ce que leur travail soit utilisé de cette façon, car les créateurs de ces modèles d’IA pourraient théoriquement profiter du travail d’autres personnes à l’avenir.
La seule chose qui est certaine, c’est que ces batailles ne feront que devenir plus compliquées à partir d’ici.