L'IA : une menace pour le droit d'auteur ?
L’apparition récente des logiciels de génération de textes et d’images par intelligence artificielle (IA) met à mal les droits de propriété intellectuelle et concurrence déjà les dessinateurs et les illustrateurs. Stéphanie Le Cam, maîtresse de conférences en droit à l’université Rennes 2 et directrice de la Ligue des auteurs professionnels, explique la complexité du problème.
---
Pouvez-vous nous présenter la directive européenne d’avril 2019 sur le droit d’auteur et ce qu’elle implique pour la fouille de données ?
Stéphanie Le Cam : J’avais suivi les débats liés à l’adoption de cette directive en 2019. La plupart des juristes s’étaient concentrés sur l’article 17 qui portait sur la responsabilité des plateformes et sur les articles 18 à 23 relatifs à la juste rémunération des auteurs et des artistes interprètes. J’avoue que je me suis peu attardée à l’époque sur les articles 3 et 4 qui traitent de l’exception de fouille de données dont nous allons parler. Il a fallu attendre juillet 2022 et l’apparition de Midjourney, un générateur d’images par IA, capable de créer des visuels artistiques grâce à une courte description textuelle, pour que l’inquiétude nous gagne. Nous avons alors pris conscience que la directive de 2019 avait ouvert la voie à ces IA génératrices de contenus dont on ne connaissait pas encore bien les potentialités. La directive donne en effet la possibilité aux établissements publics de recherche de pratiquer la fouille de données, l’objectif étant que les chercheurs puissent échapper aux contraintes du droit d’auteur. Dans l’esprit du législateur, c’est dans le cadre d’une institution publique et pour faciliter le travail des chercheurs que cette exception au droit d’auteur a été mise en place. Personne ne s’est inquiété à l’époque. Cette exception prévue par l’article 3 semblait à la fois justifiée et peu utilisée. Quant à celle prévue par l’article 4 de la directive, elle aurait pu interpeller davantage, étant élargie à toute personne publique ou privée et pour une tout autre finalité. Mais dans la mesure où l’auteur pouvait s’y opposer – ce que l’on nomme l’"opt-out" –, cela nous semblait être un garde-fou. Or, on voit aujourd’hui que cet opt-out est un garde-fou illusoire. Nous savons maintenant que cet article 4 s’est invité au tout dernier moment de la rédaction de la directive et qu’il est le fruit d’un lobbying très intense des entreprises de la "tech", qui savaient, elles, que cette exception était la porte ouverte au développement des IA génératrices de contenus. Textes, images et demain peut-être vidéos de bonne qualité sont et seront générés avec un pillage généralisé des contenus auparavant protégés par le droit d’auteur.
La transposition en droit français de cette directive par l’ordonnance de décembre 2021 et le décret de juin 2022 limitent tout de même cette fouille de données massive offerte aux IA…
Stéphanie Le Cam : Oui. D’un côté, les établissements publics de recherche peuvent exercer la fouille de données ; le texte prévoit la recherche d’un accord collectif entre les parties pour établir de bonnes pratiques
concernant l’application de l’exception. De l’autre côté, pour toutes les autres finalités, le législateur français a repris la "limite" de la directive, à savoir cet opt-out. Cela signifie que l’auteur d’une œuvre est a priori consentant pour qu’on pratique des fouilles et des analyses sur celle-ci, mais qu’il a la possibilité de opt-out, c’est-à-dire de déclarer qu’il retire son consentement à cette fouille. Or, très concrètement, comment peuvent-ils s’y prendre ? Si on prend l’exemple d’un auteur de bande dessinée qui a plusieurs dizaines de planches et d’illustrations en ligne, il doit apposer à côté de chacune d’entre elles une mention claire indiquant qu’il refuse que tel robot vienne les aspirer ainsi que les contenus présents sur ce site. D’une part, je ne suis pas sûre que cela suffise pour empêcher les robots d’agir, tant qu’il n’y a pas de transparence sur les bases de données qui nourrissent les IA ; et d’autre part, si je opt-out en novembre 2023 mais que le contenu a été aspiré en novembre 2019, que se passe-t-il ? Il n’y a pas de rétroactivité possible dans ce cas : c’est comme si je vous demandais de désapprendre ce que vous avez appris il y a deux ans ! Un autre point affaiblit fortement cette possibilité d’opt-out, c’est le fait qu’une autre personne, souvent de bonne foi, peut reproduire votre image. Prenons l’exemple d’un libraire qui a eu un coup de cœur pour votre BD et a pris en photo une case ou la couverture et l’a mise sur son blog pour illustrer son article sur le livre. Même si l’auteur a fait opt-out sur cette image, le fait que le libraire ou le blogueur la mette en ligne annule tous les efforts des autres. En résumé, l’opt-out est un bon outil juridique en théorie, mais en pratique, ça ne marche pas du tout !
Le plus simple ne serait-il pas d’imposer un "opt-in", c’est-à-dire une obligation pour les entreprises de l’IA d’obtenir l’accord des ayants droit avant de les intégrer à leur base de données ?
Stéphanie Le Cam : Je suis en effet convaincue qu’il faut appliquer l’opt-in, on le fait d’ailleurs dans l’utilisation des données personnelles, dans le cadre du Règlement général pour la protection des données (RGPD). Malheureusement, le mal est déjà largement fait. Nous sommes en 2023 et les robots ont quasiment aspiré en trois ou quatre ans une bonne partie des contenus présents sur Internet. Si on appliquait l’opt-in, il faudrait pouvoir obtenir des jugements condamnant les entreprises de l’IA à détruire de nombreuses bases de données, ce qui me semble assez difficile. Le combat est en bonne partie déjà perdu. Ces IA se sont super-entraînées, depuis plusieurs années, et sont capables aujourd’hui nous seulement de générer des contenus de qualité, mais aussi de s’auto-entraîner avec des contenus qu’elles ont elles-mêmes créés.
Comment les auteurs et les ayants droit peuvent-ils agir concrètement aujourd’hui. Quelles sont les revendications de la Ligue des auteurs professionnels ?
Stéphanie Le Cam : La première revendication est tout de même cette application de l’opt-in. Il faut demander la permission aux auteurs avant d’utiliser leurs œuvres dans le cadre de la fouille de données portée par des entreprises privées. Ensuite, nous demandons une obligation de transparence dans l’utilisation de ces contenus. Quand, par exemple, une illustration générée automatiquement s’est fortement inspirée de celle d’un illustrateur, il faut que celui-ci puisse être crédité. Enfin, nous demandons une rémunération des artistes-auteurs et autrices dont les œuvres ont nourri et entraîné ces IA. Nous ne nous contenterons pas d’une simple compensation illusoire. Pour le moment, ce sont essentiellement les illustrateurs et les dessinateurs qui voient concrètement les conséquences du développement des IA générant des images. Plusieurs bandes dessinées sortent avec un auteur scénariste humain et des illustrations générées par Midjourney. Les secteurs de la presse et de la publicité commencent aussi à être touchés : ce sont autant de clients que les illustrateurs en chair et en os vont perdre. Les auteurs de l’écrit, et notamment de fiction, sont pour l’instant moins concernés, mais il est évident qu’ils seront aussi menacés à court et à moyen terme, comme le redoutent déjà les scénaristes de films et de série en grève pendant plusieurs mois à Hollywood. Une IA comme ChatGPT s’est nourrie de quasiment tous les articles de presse et les livres présents en ligne, d’où une qualité de production très impressionnante, et qui l’est encore plus en anglais, puisque cette IA s’est beaucoup nourrie de contenus anglophones. C’est la raison pour laquelle nous aimerions une prise de position plus claire des grands groupes éditoriaux et du Syndicat national de l’édition. Ce dernier n’a pour l’heure proposé que des clauses types à ses adhérents pour opt-out, alors qu’on souhaiterait qu’il incite les éditeurs à s’engager à ne pas avoir recours aux IA génératrices de contenus. Nous attendons vraiment une prise de position politique forte des éditeurs pour sauver les droits de propriété intellectuelle dont ils ont la titularité. Lorsque les premières images générées par IA sont apparues en 2022, nous pensions que les auteurs et les éditeurs allaient parler d’une même voix. Mais on voit bien que les positions des éditeurs sont loin d’être unanimes, car plusieurs d’entre eux utilisent ces logiciels qui leur permettent de réduire leurs coûts.
Du point de vue juridique, quel est le droit d’auteur qui s’applique pour ces œuvres générées par l’IA ? À qui appartiennent-elles ? Sont-elles elles-mêmes protégées ?
Stéphanie Le Cam : On continuera probablement d’appliquer la définition de l’œuvre telle qu’elle existe
aujourd’hui : pour être protégée, une œuvre doit être le fruit d’un esprit humain. Si elle est entièrement créée par une IA, elle ne sera pas considérée comme une œuvre mais comme un contenu, échappant par conséquent à la protection du droit de la propriété intellectuelle. C’est différent d’une œuvre créée par un artiste qui a été assisté par une technologie de retouche d’image ou un logiciel de correction de son : dans ce cas-là, l’artiste crée bien une œuvre protégée. Il faudra donc que le juge, s’il est saisi d’une telle affaire, détermine si le contenu a été entièrement créé par l’IA ou si l’auteur a été simplement assisté par l’IA pour sa création. La différence ne sera pas évidente et l’analyse ne sera pas une mince affaire.