Opinião: A IA chega para os jornalistas

Nota do editor: Seán O'Connor é professor de Direito e diretor do Centro de Propriedade Intelectual e Política de Inovação da Faculdade de Direito Antonin Scalia da Universidade George Mason. As opiniões expressas neste comentário são da sua inteira responsabilidade. Ver mais opiniões na CNN.

Seán O'Connor

O New York Times alega esta última situação numa ação judicial recentemente intentada no tribunal federal de Manhattan, juntando-se a outros criadores e detentores de direitos de autor que contestam a utilização das suas obras por empresas de IA sem autorização. Os arguidos OpenAI e Microsoft Corp. responderão quase de certeza que treinar o ChatGPT e sistemas semelhantes em milhões de obras protegidas por direitos de autor do TheTimes e de outros é uma "utilização justa" ao abrigo da lei.

De facto, a OpenAI já previu uma defesa de utilização justa numa moção de rejeição de uma ação judicial separada intentada pela comediante Sarah Silverman e outros autores contra a Meta no tribunal federal de São Francisco, no ano passado, com base num cenário semelhante em que o ChatGPT reproduzia partes substanciais dos livros depois de ter sido treinado com eles. Embora esse processo não esteja a correr muito bem - o juiz aceitou recentemente a moção da Meta para rejeitar todas as queixas de Silverman et al., exceto uma - baseou-se em grande parte em teorias diferentes das do processo do Times.

Alguns académicos defenderam uma teoria de "aprendizagem justa" para justificar a reprodução de materiais protegidos por direitos de autor em conjuntos de treino de IA generativa, com base na analogia de que isto é semelhante à reprodução privada por seres humanos de obras protegidas por direitos de autor para as estudar e aprender com elas, o que é geralmente considerado como não infração ou utilização justa. Mas estes resultados da IA são substancialmente semelhantes a artigos específicos do Times, de acordo com o documento. Esta utilização é tudo menos justa.

Sem a defesa do uso justo, as empresas GenAI são provavelmente responsáveis por violação de direitos autorais. Isto dá ao Times e a outros editores o direito de partilharem os lucros que a GenAI obterá com os materiais dos editores e a capacidade de negociarem "barreiras" para a forma como os seus materiais são utilizados ou acabam nos resultados da GenAI.

Em resposta ao processo do Times, um porta-voz da Open AI disse que a empresa tecnológica respeitava os direitos dos criadores e proprietários de conteúdos e estava a trabalhar com eles para garantir que beneficiavam da tecnologia de IA e de novos modelos de receitas: "As nossas conversas em curso com o New York Times têm sido produtivas e estão a avançar de forma construtiva, por isso estamos surpreendidos e desapontados com este desenvolvimento. Esperamos encontrar uma forma mutuamente benéfica de trabalhar em conjunto, como estamos a fazer com muitas outras editoras." A Microsoft não respondeu a um pedido de comentário sobre o processo.

Quando os estudantes de arte copiam a "Mona Lisa", procuram compreender como Leonardo da Vinci executou a sua visão artística. Os seus objectivos são desenvolver ferramentas para expressar a sua própria visão, no seu próprio estilo original, e não duplicar servilmente o estilo de outro.

Em contrapartida, a OpenAI e a sua congénere concebem os seus sistemas de IA generativa para reproduzir as criações e estilos humanos existentes. A IA generativa é assim designada pelo texto, imagens e outras expressões criadas em resposta a sugestões dos utilizadores.

Analisei este modelo de negócio no contexto da música. Aplicações como a Jukebox e a MuseNet - dois outros projectos OpenAI - promovem a sua capacidade de criar "novas" obras nos estilos de artistas e compositores especificamente designados. Não é claro se existe um jogo a longo prazo que se concentre em gerar resultados únicos.

Nos seus melhores dias, a indústria nascente promove a visão de uma ferramenta que ajuda os humanos a criar obras distintas. Mas, neste momento, a IA generativa está limitada a misturas de estilos existentes (em parte, porque os sistemas precisam de ser treinados com materiais existentes).

A criatividade revolucionária não é apenas uma reformulação das entradas estilísticas actuais, em que cada uma permanece reconhecível. É, em vez disso, uma criação estilística totalmente nova que apenas sugere as suas influências. "Frank Sinatra a cantar uma canção de Ed Sheeran", tal como gerada pelos actuais sistemas de IA generativa, soaria exatamente como o título descreve. O ouvinte ouviria o que parece ser a voz real de Sinatra, como se ele estivesse a cantar uma cover de uma canção de Ed Sheeran - ou seja, o tipo de melodias, mudanças de acordes e fraseado que caracterizam as canções de Sheeran - apesar de não se tratar de nenhuma canção de Sheeran.

Por outro lado, quando os músicos humanos criam o seu próprio estilo novo a partir dos estilos de outros músicos que admiram e imitam, o resultado não soa como uma das suas influências a cantar a canção de outra influência. Por exemplo, a cantora e compositora Brandi Carlile é famosa por ter sido clara sobre a profunda influência de artistas anteriores, incluindo Joni Mitchell e Elton John, no seu próprio estilo. No entanto, com exceção dos casos em que Carlile fez um cover de uma canção de Joni ou de Elton, as suas canções originais não soam diretamente como o estilo de atuação ou de composição dos seus dois ídolos. Assim, a produção de seres humanos criativos e competentes soa a algo novo, enquanto a produção da IA soa a justaposições estranhas do trabalho dos diferentes seres humanos com que foi treinada.

Nos seus piores dias, a indústria da IA generativa parece querer substituir completamente a criatividade humana. Os sistemas de IA produzirão novos trabalhos com base nas suas próprias instruções internas, à escala, para todos os gostos e orçamentos. Poderá surgir daí alguma estética valiosa ou um novo estilo autêntico?

No que diz respeito às notícias, as pessoas podem perguntar: as notícias não são "apenas os factos"? E, segundo a lei dos direitos de autor, os factos não são protegíveis. Além disso, se o texto for "funcional", como uma receita, também não é suscetível de proteção. No entanto, mesmo que as notícias sejam meramente factuais e funcionais, a decisão de 1918 do Supremo Tribunal dos Estados Unidos no processo International News Service v. Associated Press continua a defender que a reprodução imediata de notícias não protegidas por direitos de autor constitui uma apropriação indevida.

Ao mesmo tempo, o jornalismo não é "apenas os factos". É também contar histórias. Os leitores querem pontos de vista e análises perspicazes e originais, tudo embrulhado em passagens estilizadas e atractivas. Nalguns casos, os estilos que quebram as normas, como o "jornalismo gonzo" de Hunter S. Thompson, podem até dar aos leitores uma nova forma de compreender os acontecimentos mundiais.

A IA generativa é intencionalmente criada para replicar o estilo de jornalistas estabelecidos. Ao fazê-lo, dá aos seus resultados as qualidades que os leitores esperam das notícias e dos comentários. Na prática, isso também significa que a IA generativa está a produzir texto não só no estilo de escritores conhecidos, mas também a reproduzir exatamente passagens publicadas anteriormente. A queixa do Times documenta uma série destes casos.

Poderá uma reprodução por IA generativa de notícias e comentários previamente publicados ser considerada utilização justa? Penso que não. Alguns jornalistas tornam-se mais lidos do que outros, não só porque publicam primeiro ou têm melhores ideias, mas também porque exprimem bem as suas ideias. Quando a IA generativa se aproveita destes sucessos estilísticos, falha o teste estatutário de quatro partes para utilização justa: finalidade e carácter da utilização (por exemplo, comercial ou não comercial); natureza do trabalho protegido por direitos de autor; quantidade e substancialidade da parte utilizada em comparação com o trabalho global; e efeito da utilização no mercado do original. Os tribunais utilizam frequentemente um teste de "utilização transformadora" como abreviatura para alguns ou todos estes factores. A obra alegadamente infratora está a utilizar as partes reproduzidas de uma forma diferente da utilizada na obra original?

A utilização da IA generativa não é "transformadora" na medida em que não comenta ou critica a história original ou a transfere para um meio, objetivo ou contexto diferente. Em vez disso, está a reproduzir partes substanciais do trabalho de outros simplesmente para competir nos mesmos canais de mercado que o original.

Receba o nosso boletim semanal gratuito

Subscrever o boletim informativo da CNN Opinion
Junte-se a nós no Twitter e no Facebook

Ainda mais problemático para um mundo inundado de desinformação, a IA generativa está a "alucinar" histórias, fazendo-as parecer provenientes de publicações legítimas de agências noticiosas respeitadas. "Alucinar" é o nome dado a quando a IA generativa fabrica factos e histórias que não existem ou que foram alterados para uma falsidade, mas apresenta-os de forma convincente (por exemplo, apresenta uma citação de um tribunal legal que corresponde ao formato técnico, mas na realidade esse caso não existe). Assim, a IA generativa está a infringir os direitos de marca registada, bem como a atribuir erradamente histórias e ideias.

Em última análise, a IA generativa está a fazer exatamente o oposto do que se pretende com a aprendizagem humana. Em vez de dominar os estilos de outros especialistas para desenvolver estilos novos e melhores, é uma mangueira serpenteante que se agita descontroladamente, vomitando sequências impensadas de texto baseadas apenas nas probabilidades de uma palavra vir depois de outra na expressão humana.

As expressões ponderadas de criadores humanos qualificados foram cooptadas para uma mangueira de inanidade flagrante que ameaça destruir não só as indústrias criativas, mas também a democracia e os nossos próprios sentidos de verdade e realidade. Embora a violação dos direitos de autor possa parecer a menor das nossas preocupações, a aplicação dos direitos de propriedade intelectual é o melhor começo para controlar a IA generativa para o bem da humanidade.