Rejoignez-nous
High tech

Une collection de livres en ligne géante utilisée par Meta pour former son IA est résolue par des problèmes de droits d’auteur

Pierre

Date de publication :

le

Une collection de livres en ligne géante utilisée par Meta pour former son IA est résolue par des problèmes de droits d'auteur

L’IA et les détenteurs de droits d’auteur se retrouvent une fois de plus sur le terrain de la bataille virtuelle.

L’IA telle que nous la connaissons existe essentiellement pour dévorer Internet et vous le recracher. Le problème avec cela est que d’énormes parties d’Internet sont protégées par la loi sur le droit d’auteur.

C’est l’un des principaux points à retenir de la gigantesque base de données Books3 qui a été supprimée à la suite d’une demande DMCA du groupe anti-piratage danois Rights Alliance, comme l’avait initialement rapporté TorrentFreak. Books3 contenait un peu plus de 196 000 livres au format texte brut pour les modèles d’IA à mâcher à des fins de formation, mais à part quelques liens alternatifs flottant sur Internet, il n’est plus accessible au public. L’ancien lien vers celui-ci mène à une page 404.

Books3 existait dans le cadre d’une plus grande collection de contenus de formation sur l’IA appelée The Pile, organisée par le groupe de recherche EleutherAI. Comme indiqué par un rapport de Gizmodo sur le sujet, Meta a déjà fait référence à l’utilisation de The Pile pour former son modèle d’IA interne. Ce ne serait pas le premier grand modèle d’IA technologique à être potentiellement formé sur du matériel diffusé illégalement, car un recours collectif déposé en juillet a accusé Google de faire la même chose.

Ce truc devient vite délicat au sens juridique, mais aussi au sens éthique. Par exemple, une personne qui pourrait être en faveur du piratage en général à des fins d’archivage historique pourrait également s’opposer avec véhémence aux modèles d’IA formés sur du matériel protégé par le droit d’auteur (j’ai l’impression de connaître plusieurs personnes qui pensent de cette façon). Il est également facile de comprendre pourquoi les auteurs s’opposeraient à ce que leur travail soit utilisé de cette façon, car les créateurs de ces modèles d’IA pourraient théoriquement profiter du travail d’autres personnes à l’avenir.

La seule chose qui est certaine, c’est que ces batailles ne feront que devenir plus compliquées à partir d’ici.

Pierre, plus connu sous son pseudonyme "Pierrot le Fou", est un rédacteur emblématique du site Indigo Buzz. Originaire d'une petite ville du sud-ouest du Gers, cet aventurier des temps modernes est né sous le signe de l'ombre en 1986 au sommet d'une tour esotérique. Élevé dans une famille de magiciens-discount, il a développé un goût prononcé pour l'excentricité et la magie des mots dès son plus jeune âge. Pierre a commencé sa carrière de rédacteur dans un fanzine local dédié aux films d'horreur des années 80, tout en poursuivant des études de communication à l'Université de Toulouse. Passionné par l'univers du web, il a rapidement pris conscience de l'impact du numérique et des réseaux sociaux sur notre société. C'est alors qu'il a décidé de troquer sa collection de cassettes VHS contre un ordinateur flambant neuf... enfin presque.

Cliquer pour commenter

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *