HarperCollins ouvre le bal : un accord a été signé avec un (mystérieux) acteur de l’IA pour intégrer ses livres de non-fiction dans son modèle de langage (LLM). Sous réserve bien sûr que les auteurs approuvent…
Dans un mail adressé à ses auteurs de non-fiction, l’éditeur américano-britannique HarperCollins, 3e mondial, leur propose de signer un protocole cédant leur droit d’utilisation de leurs livres à une entreprise d’intelligence artificielle dont l’identité n’est pas dévoilée.
Des deals avaient déjà été signés par des éditeurs universitaires comme Wiley et Taylor & Francis, mais c’est le premier éditeur grand public qui le fait, à l’instar d’une autre filiale de News Corp, le Wall Street Journal.
La contrepartie proposée : 2500 $ par livre pour trois ans. On suppose que la licence sera renouvelée à cette date pour la même somme, comment peut-on en être sûr, dans un univers aussi mouvant que celui de l’IA ?
Dans un email qu’un auteur s’est empressé de reproduire, HarperCollins indique que le partenaire en question est « important et respecté ». D’après Publishers Weekly, il s’agirait de Microsoft. Mais alors pourquoi le cacher aux auteurs ?
Dans le même article, on indique que le deal prévoit une répartition à 50/50 entre l’auteur et l’éditeur, ce qui signifie donc que Microsoft investit 5000 $ par livre dans cette affaire. Ce qui chiffonne auteurs et agents, c’est que cet accord forfaitaire n’envisage pas la création d’un nouveau droit, avec rémunération proportionnelle, comme il est de coutume pour les droits secondaires dans le livre. Et pour cause : sur quel critère pourrait-on fonder une telle rémunération ? Comment savoir avec certitude qu’une phrase, un paragraphe, un chapitre vectorisé dans ces immenses LLM a été utilisé pour répondre à la question d’un utilisateur ?
Les auteurs et leurs représentants sont donc sceptiques sur certains aspects de cet accord. Robert Gottlieb, patron d’une grosse agence littéraire, et Mary Rasenberger, présidente de la Guilde des auteurs, le trouve pourtant préférable à l’utilisation sauvage de données sous copyright qui a prévalu jusqu’ici, donnant lieu à de nombreux procès (en cours) contre les développeurs d’IA qui considérent que ce pillage relève du fair use, comme le scanning des livres de bibliothèque par Google Books. « Nous ne pouvons faire la politique de l’autruche », dit Rasenberger.
L’auteur précité a refusé de signer, malgré l’injonction de son éditeur qui lui annonce que des centaines d’auteurs l’ont fait. Ah bon… Qui, combien, et quand ? Les réactions à son message Bluesky sobrement intitulé « Abominable » montrent que les auteurs sont divisés sur la réponse à apporter.
Les autres éditeurs du top 5 (Penguin Random House, Hachette, Simon and Schuster, MacMillan) sont dans l’attente ou ne font pas de commentaires. Mais il serait curieux qu’ils n’y pensent pas. La boîte de Pandore est ouverte, et elle n’est pas près de se se refermer.