Opinion : L'IA s'attaque aux journalistes

Note de la rédaction : Seán O'Connor est professeur de droit et directeur du Center for Intellectual Property x Innovation Policy à la faculté de droit Antonin Scalia de l'université George Mason. Les opinions exprimées dans ce commentaire sont les siennes. Voir d'autres opinions sur CNN.

Seán O'Connor

C'est ce qu'affirme le New York Times dans un récent procès intenté devant le tribunal fédéral de Manhattan, rejoignant ainsi d'autres créateurs et titulaires de droits d'auteur qui contestent aujourd'hui l'utilisation de leurs œuvres sans autorisation par des entreprises spécialisées dans l'intelligence artificielle. Les défendeurs OpenAI et Microsoft Corp. répondront très certainement que l'entraînement de ChatGPT et de systèmes similaires sur des millions d'œuvres protégées par le droit d'auteur du New York Times et d'autres auteurs constitue un "usage loyal" au regard de la loi.

En effet, OpenAI a déjà présenté une défense fondée sur l'usage loyal dans une motion visant à rejeter une action en justice distincte intentée par la comédienne Sarah Silverman et d'autres auteurs contre Meta devant le tribunal fédéral de San Francisco l'année dernière, sur la base d'un scénario similaire dans lequel ChatGPT reproduit des parties substantielles des livres après avoir été formé à leur utilisation. Bien que ce procès ne se soit pas particulièrement bien déroulé - le juge a récemment accepté la requête de Meta de rejeter toutes les demandes de Silverman et al. sauf une - il était largement basé sur des théories différentes de celles de l'affaire du Times.

Certains universitaires ont défendu une théorie de "l'apprentissage équitable" pour justifier la reproduction en gros d'éléments protégés par le droit d'auteur dans des ensembles d'entraînement d'IA générative, en faisant l'analogie avec la reproduction privée par des humains d'œuvres protégées par le droit d'auteur pour les étudier et en tirer des enseignements, ce qui est généralement considéré comme ne constituant pas une contrefaçon ou une utilisation équitable. Or, selon le document, ces résultats de l'IA sont substantiellement similaires à des articles spécifiques du Times. Cette utilisation est tout sauf équitable.

Sans la défense de l'usage loyal, les entreprises de GenAI sont probablement responsables d'une violation du droit d'auteur. Le Times et d'autres éditeurs ont donc le droit de participer aux bénéfices que GenAI tirera des documents des éditeurs et la possibilité de négocier des "garde-fous" sur la manière dont leurs documents sont utilisés ou se retrouvent dans les résultats de GenAI.

En réponse à la plainte du Times, un porte-parole d'Open AI a déclaré que l'entreprise technologique respectait les droits des créateurs et des propriétaires de contenu et qu'elle travaillait avec eux pour s'assurer qu'ils bénéficient de la technologie de l'IA et de nouveaux modèles de revenus : "Nos conversations en cours avec le New York Times ont été productives et ont permis d'avancer de manière constructive, c'est pourquoi nous sommes surpris et déçus par ce développement. Nous espérons que nous trouverons un moyen mutuellement bénéfique de travailler ensemble, comme nous le faisons avec de nombreux autres éditeurs." Microsoft n'a pas répondu à une demande de commentaire sur le procès.

Lorsque des étudiants en art copient la "Joconde", ils cherchent à comprendre comment Léonard de Vinci a exécuté sa vision artistique. Leur objectif est de développer des outils pour exprimer leur propre vision, dans leur propre style original, et non de reproduire servilement le style d'un autre.

OpenAI et ses semblables, en revanche, conçoivent leurs systèmes d'IA générative pour reproduire les créations et les styles humains existants. L'IA générative est appelée ainsi pour le texte, les images et les autres expressions créées en réponse aux demandes des utilisateurs.

J'ai analysé ce modèle commercial dans le contexte de la musique. Des applications telles que Jukebox et MuseNet - deux autres projets OpenAI - mettent en avant leur capacité à créer de "nouvelles" œuvres dans le style d'artistes et de compositeurs spécifiquement nommés. Il n'est pas certain qu'il y ait un jeu à long terme qui s'oriente plutôt vers la création d'œuvres uniques.

Dans ses meilleurs jours, l'industrie naissante promeut la vision d'un outil qui aide les humains à créer des œuvres distinctives. Mais pour l'instant, l'IA générative se limite à des mélanges de styles existants (en partie parce que les systèmes doivent être formés sur des matériaux existants).

La créativité révolutionnaire n'est pas simplement un remaniement des apports stylistiques actuels où chacun reste reconnaissable. Il s'agit plutôt d'une création stylistique entièrement nouvelle qui ne fait qu'évoquer ses influences. "Frank Sinatra chantant une chanson d'Ed Sheeran", telle qu'elle est générée par les systèmes d'IA générative actuels, ressemblerait exactement à ce que son titre décrit. L'auditeur entendrait ce qui ressemble à la voix de Sinatra comme s'il chantait une reprise d'une chanson d'Ed Sheeran, c'est-à-dire le type de mélodies, de changements d'accords et de phrasés qui caractérisent les chansons de Sheeran, même s'il ne s'agit pas d'une véritable chanson de Sheeran.

En revanche, lorsque des musiciens humains créent leur propre style à partir des styles d'autres musiciens qu'ils admirent et imitent, le résultat ne ressemble pas à l'une de leurs influences chantant la chanson d'une autre influence. Par exemple, l'auteur-compositeur-interprète Brandi Carlile a clairement indiqué l'influence profonde qu'ont exercée sur son propre style des artistes antérieurs tels que Joni Mitchell et Elton John. Pourtant, à l'exception des cas où Carlile a repris une chanson de Joni ou d'Elton, ses chansons originales ne sonnent pas directement comme le style d'interprétation ou de composition de ses deux idoles. Ainsi, la production d'êtres humains créatifs et compétents sonne comme quelque chose de nouveau, tandis que la production de l'IA sonne comme une juxtaposition maladroite du travail des différents êtres humains sur lesquels elle a été formée.

Dans ses pires moments, l'industrie de l'IA générative semble vouloir remplacer complètement la créativité humaine. Les systèmes d'IA produiront de nouvelles œuvres sur la base de leurs propres messages internes, à grande échelle, pour tous les goûts et tous les budgets. Une esthétique précieuse ou un nouveau style authentique peuvent-ils émerger de cette situation ?

En ce qui concerne les informations, on peut se demander si les informations ne sont pas "simplement des faits". Or, en vertu de la loi sur le droit d'auteur, les faits ne sont pas protégeables. En outre, si le texte est "fonctionnel", comme une recette de cuisine, il n'est pas non plus protégeable. Toutefois, même si les reportages sont simplement factuels et fonctionnels, l'arrêt rendu en 1918 par la Cour suprême des États-Unis dans l'affaire International News Service v. Associated Press considère toujours que la reproduction immédiate de reportages non protégés par le droit d'auteur constitue une appropriation illicite.

Par ailleurs, le journalisme ne se limite pas aux faits. Il s'agit aussi de raconter des histoires. Les lecteurs veulent des points de vue et des analyses perspicaces et originaux, le tout enveloppé dans des passages stylisés attrayants. Dans certains cas, des styles qui bousculent les normes, comme le "journalisme gonzo" de Hunter S. Thompson, peuvent même donner aux lecteurs une nouvelle façon de comprendre les événements mondiaux.

L'IA générative est délibérément conçue pour reproduire le style des journalistes établis. Ce faisant, elle confère à sa production les qualités que les lecteurs attendent des informations et des commentaires. Dans la pratique, cela signifie également que l'IA générative produit des textes non seulement dans le style d'écrivains connus, mais qu'elle reproduit aussi exactement des passages déjà publiés. La plainte du Times fait état d'un certain nombre de ces cas.

La reproduction par l'IA générative d'informations et de commentaires déjà publiés peut-elle être considérée comme un usage loyal ? Je ne le crois pas. Certains journalistes sont plus lus que d'autres non seulement parce qu'ils publient en premier ou qu'ils ont de meilleures idées, mais aussi parce qu'ils expriment bien leurs idées. Lorsque l'IA générative s'appuie sur ces succès stylistiques, elle échoue au test légal en quatre parties de l'usage loyal: but et nature de l'usage (par exemple, commercial ou non commercial) ; nature de l'œuvre protégée par le droit d'auteur ; quantité et importance de la partie utilisée par rapport à l'ensemble de l'œuvre ; et effet de l'usage sur le marché de l'œuvre originale. Les tribunaux utilisent souvent le critère de "l'utilisation transformatrice" pour désigner certains ou l'ensemble de ces facteurs. L'œuvre présumée contrefaite utilise-t-elle les parties reproduites d'une manière différente de celle de l'œuvre originale ?

L'utilisation de Generative AI n'est pas "transformative" en ce sens qu'elle ne commente pas ou ne critique pas l'histoire originale, ni ne la transpose sur un support, dans un but ou dans un contexte différents. Au contraire, elle reproduit des parties substantielles de l'œuvre d'autrui simplement pour rivaliser dans les mêmes canaux de marché que l'œuvre originale.

Recevez notre lettre d'information hebdomadaire gratuite

S'inscrire à la lettre d'information de CNN Opinion
Rejoignez-nous sur Twitter et Facebook

Plus problématique encore pour un monde inondé de fausses informations, l'IA générative "hallucine" des articles tout en les faisant passer pour des publications légitimes d'organes d'information respectés. On parle d'"hallucination" lorsque l'IA générative fabrique des faits et des histoires qui n'existent pas ou qui ont été modifiés pour devenir faux, mais les présente de manière convaincante (par exemple, en présentant une citation juridique qui correspond au format technique, alors qu'il n'existe en réalité aucune affaire de ce type). Ainsi, l'IA générative porte atteinte aux droits des marques et attribue de manière erronée des histoires et des idées.

En fin de compte, l'IA générative fait exactement le contraire de ce que l'apprentissage humain est censé réaliser. Plutôt que de maîtriser les styles d'autres experts pour en développer de nouveaux et de meilleurs, c'est un tuyau serpentant qui s'agite de manière incontrôlée, crachant des séquences de texte irréfléchies basées uniquement sur les probabilités qu'un mot vienne après l'autre dans l'expression humaine.

Les expressions réfléchies de créateurs humains compétents ont été cooptées dans un énorme tuyau d'inanité qui menace de bouleverser non seulement les industries créatives, mais aussi la démocratie et notre sens même de la vérité et de la réalité. Si la violation des droits d'auteur peut sembler être le cadet de nos soucis, l'application des droits de propriété intellectuelle est le meilleur moyen de maîtriser l'IA générative pour le bien de l'humanité.

Couvertures historiques du magazine Sports Illustrated au siège de la NFL à New York en janvier 2005.

Opinion : L'IA s'attaque aux journalistes