L'apocalypse du droit d'auteur
Les poursuites judiciaires se multiplient. Les auteurs, les artistes et les musiciens poursuivent les entreprises d'IA. Ils affirment que les entreprises utilisent leurs œuvres sans autorisation. Cela marque la fin de l'entraînement des IA sur n'importe quel contenu.
La génération actuelle d'IA utilise des données massives et non sous licence. La prochaine génération utilisera probablement des ensembles de données plus restreints et légaux. Ce changement change tout.
La bataille juridique
Les plaignants, tels que les organisations de presse et les auteurs, affirment que :
- Les entreprises d'IA utilisent des œuvres protégées par le droit d'auteur sans autorisation.
- L'IA utilise les noms et l'image des artistes.
- Les produits d'IA entrent en concurrence avec les créateurs originaux.
Les entreprises d'IA se défendent en affirmant que :
- L'entraînement constitue un usage transformatif.
- L'IA apprend des modèles plutôt que de copier directement.
Le contrôle est le véritable enjeu. Les créateurs veulent posséder leur travail et être rémunérés. Les entreprises d'IA veulent continuer à construire. La loi est encore en train de rattraper son retard.
Le problème de l'opt-out
Des outils comme Robots.txt ou les balises NoAI existent. Ils permettent aux créateurs de bloquer l'IA. Mais c'est un piège.
Les systèmes d'opt-out font reposer la responsabilité sur le créateur. Vous devez trouver l'outil et demander à ne pas être sollicité. Ce n'est pas du consentement. Un véritable consentement exige que les entreprises d'IA demandent d'abord la permission.
Deux futurs possibles
Scénario 1 : La voie optimiste Les entreprises d'IA paient des licences. Elles créent un système similaire à Spotify pour le texte. Les créateurs sont rémunérés et les modèles restent performants.
Scénario 2 : La voie pessimiste Les entreprises d'IA perdent leurs procès. Elles doivent supprimer leurs données. Les futurs modèles deviendront beaucoup moins performants en raison du manque d'informations.
Une nouvelle vision de la qualité des données
Moins de données signifie souvent moins de précision et moins de nuance. Cependant, les modèles actuels utilisent beaucoup de bruit. Une grande partie des données est redondante. Un ensemble de données plus petit et plus propre pourrait en réalité produire de meilleurs résultats.
Comment vous préparer
- Suivez les procès. Les résultats définiront l'industrie.
- Soutenez les créateurs. Payez pour le contenu que vous aimez.
- Exigez l'équité. Les entreprises d'IA devraient indemniser les personnes qui fournissent les données.
Si vous pouviez construire un système équitable pour l'entraînement de l'IA, comment fonctionnerait-il ? Comment les créateurs devraient-ils être rémunérés ?
Optional learning community: https://t.me/GyaanSetuAi
