Reddit ha bloccato Bing per via dell'IA, non per un accordo con Google
Dopo che i risultati di Reddit hanno iniziato a scomparire dai motori di ricerca non chiamati Google la scorsa settimana, l'azienda ha finalmente deciso di spiegare il perché, sminuendo di fatto il problema di ricerca e affermando di essere stanca che le aziende di IA si addestrano sui suoi dati gratuitamente.
"Abbiamo avuto Microsoft, Anthropic e Perplexity che si comportano come se tutto il contenuto su Internet fosse gratuito per loro da usare", ha detto il CEO di Reddit Steve Huffman a The Verge in un'intervista. "...cosa ci ha portato a bloccare persone che non hanno voluto raggiungere un accordo su come vorremmo che i nostri dati venissero usati o non usati."
Huffman ha accusato Microsoft di addestrarsi sulla IA con i dati di Reddit raccolti attraverso Bing, oltre a rivenderli tramite l'API di Bing. Sembra che la rimozione delle ricerche di Reddit fosse principalmente un effetto collaterale del blocco di questo processo, anche se l'azienda non era felice del fatto che il motore di ricerca di Bing utilizzasse l'IA per riassumere i suoi post senza richiedere agli utenti di cliccare per visualizzarli.
Ma come potrebbe combattere l'IA la ricerca? Anche se potrebbero sembrare tecnologie completamente separate, sia l'IA che la ricerca dipendono dai "web crawler", che scorrono su Internet raccogliendo dati che possono essere archiviati, visualizzati o utilizzati altrove. Questa tecnologia è necessaria per far funzionare i motori di ricerca come fanno, ma può anche essere utilizzata per l'addestramento dell'IA. Quando i siti web aggiornano i loro file per bloccare i web crawler, questo rompe entrambe le cose.
Data la maggior parte del tempo trascorso da Huffman a parlare di IA, sembra che il nocciolo della questione sia che Reddit non vuole che le aziende si addestrino sui suoi dati degli utenti senza avere alcuna voce in capitolo, con Huffman che ha detto a The Verge che compagnie come Microsoft, Anthropic e Perplexity si sono rifiutate di negoziare.
"Senza questi accordi, non abbiamo alcuna voce o conoscenza di come i nostri dati vengono visualizzati o utilizzati." Il CEO ha detto che è stato "un vero fastidio bloccare queste aziende".
Ciò non significa che Reddit stia agendo completamente per altruismo, è ovvio. All'inizio di quest'anno, l'azienda ha firmato un contratto di licenza di $60 milioni all'anno che consente a Google di addestrarsi sulla sua IA sui post degli utenti, il che spiega anche perché i post di Reddit continuano a comparire senza problemi sui motori di ricerca di Google. In modo simile, OpenAI può anche addestrarsi sui post di Reddit e il suo prossimo SearchGPT sarà in grado di collegarsi a loro, anche se l'importo esatto dietro l'accordo di Reddit con il creatore di ChatGPT non è stato reso noto.
Invece di essere contro l'IA, Reddit vuole essere coinvolto nel processo decisionale su ciò che accade con i suoi dati. E, ovviamente, essere pagato per questo.
The Verge ha riferito che Huffman ha fatto riferimento a un recente commento del CEO di Microsoft AI Mustafa Suleyman come esempio del tipo di comportamento che sta cercando di combattere. In una discussione con CNBC's Andrew Ross Sorkin al festival delle idee di Aspen, l'esecutivo ha detto che il contenuto "che è già sul web aperto...è stato 'software libero', se vuoi".
Questa è sicuramente un'interpretazione creativa della legge sul copyright, ma non è unica a Microsoft. Nonostante l'accordo di Google con Reddit, lo scorso luglio Gizmodo ha notato un cambiamento nella privacy policy di Google che diceva di utilizzare "informazioni pubblicamente disponibili" per addestrarsi sui suoi modelli IA, senza riconoscere che Google non possiede effettivamente tutto ciò che viene pubblicato su Internet.
Mentre non è chiaro come Google definisca "informazioni pubblicamente disponibili", questo nuovo accordo di Reddit potrebbe gettare luce sull'argomento. Per ora, l'addestramento dell'IA potrebbe passare da un free-for-all a un punto in cui coloro che possono permettersi di far pagare le aziende otterranno la loro giusta parte (a condizione che profittare dalla vendita del contenuto creato dagli utenti prima che l'IA esistesse conti come giusto ai tuoi occhi). Insieme a Reddit, anche The Verge's società madre Vox Media ha stipulato un accordo con OpenAI, così come The Atlantic. Per quanto riguarda il resto di noi, dovremo affidarsi alla regolamentazione, che è stata lenta a rispondere all'IA fuori dall'UE.
In risposta a ciò, alcuni appassionati di tecnologia hanno iniziato a discutere la situazione sui sottoreddit di IA, esprimendo le loro preoccupazioni sulla privacy dei dati e la monetizzazione del contenuto generato dagli utenti.
Inoltre, la comunità tecnologica di Reddit AI ha iniziato a dibattere se azioni come quelle di Microsoft e Google potrebbero stabilire un pericoloso precedente nel settore tecnologico, potenzialmente portando a un internet meno aperto e democratico.