Reddit aurait cédé son contenu pour former des modèles d’IA
Une IA pillée par Reddit ?!
Les publications sur Reddit pourraient être le prochain carburant de la machine d’innovation de l’IA, car la « première page d’Internet » aurait négocié un accord de licence de contenu pour permettre à ses données d’être utilisées pour former des modèles d’IA.
Avant une introduction en bourse potentielle de 5 milliards de dollars en mars, Bloomberg a annoncé que la plateforme de médias sociaux avait signé un accord de 60 millions de dollars avec une société d’IA non divulguée (mais de grande envergure), potentiellement pour vendre à la dernière minute aux investisseurs que la plateforme avait un potentiel d’argent. ouvrir des voies dans le monde de l’IA.
Reddit n’a pas encore confirmé l’accord.
Cette décision signifie que les publications sur Reddit, des subreddits les plus populaires aux commentaires des rôdeurs et des petits comptes, pourraient constituer des LLM déjà existants ou fournir un cadre pour le prochain jeu d’IA générative. C’est une décision risquée de la part de Reddit, car les utilisateurs sont déjà en désaccord avec les décisions commerciales de la plateforme vieille de près de 20 ans.
L’année dernière, suite à l’annonce par Reddit de commencer à facturer l’accès à ses API, des milliers de forums Reddit ont fermé leurs portes en signe de protestation. Peu de temps après, le site lui-même s’est écrasé et quelques jours plus tard, un groupe de pirates informatiques de Reddit a menacé de divulguer les données du site précédemment volées à moins que le PDG de Reddit, Steve Huffamn, n’annule le plan de l’API ou ne leur verse 4,5 millions de dollars. Plus tard, Reddit a supprimé des années de journaux de discussion privés et de messages des comptes des utilisateurs, affirmant qu’il effaçait les données antérieures au 1er janvier 2023 pour préparer une nouvelle infrastructure de discussion.
Reddit a également annoncé d’autres changements, notamment un nouveau badge « officiel » destiné à distinguer les comptes réels des imitateurs et de nouvelles fonctionnalités de modération automatique. En septembre, Reddit a supprimé l’option permettant de désactiver la personnalisation des publicités, ralliant encore plus d’utilisateurs contre l’évolution de la plateforme.
Ce nouvel accord sur l’IA pourrait susciter encore plus de colère chez les utilisateurs, alors que le débat fait rage sur l’éthique de l’utilisation des données publiques, de l’art et d’autres contenus créés par l’homme pour former l’IA.