ir al contenido

Reddit bloqueó Bing por IA, no por un acuerdo con Google

Si quieres acceder a los datos de Reddit, tendrás que pagar.

Reddit bloqueó Bing por IA, no por un acuerdo con Google

Después de que los resultados de Reddit comenzaron a desaparecer de los motores de búsqueda que no eran Google la semana pasada, la empresa ha salido finalmente a explicar por qué, básicamente minimizando el problema de búsqueda y diciendo que está cansada de que las empresas de IA entrenen en sus datos de forma gratuita.

"Hemos tenido a Microsoft, Anthropic y Perplexity actuando como si todo el contenido de internet fuera gratis para ellos usarlo", le dijo el CEO de Reddit, Steve Huffman, a The Verge en una entrevista. "...lo que nos ha puesto en una posición ahora de bloquear a la gente que no ha estado dispuesta a llegar a un acuerdo sobre cómo nos gustaría que se usaran o no nuestros datos".

Huffman acusó a Microsoft de entrenar su IA en datos de Reddit que se habían extraído a través de Bing, así como de vender luego esos datos a través de la API de Bing. Parece que la eliminación de las búsquedas de Reddit fue en gran medida un subproducto de bloquear ese proceso, aunque la empresa también no estaba contenta con que el motor de búsqueda de Bing utilizara IA para resumir sus publicaciones sin requerir que los usuarios hagan clic en ellas.

Pero ¿cómo podría luchar contra la IA romper la búsqueda? Aunque puedan parecer tecnologías completamente separadas, tanto la IA como la búsqueda dependen de los "crawlers web", que recorren internet recopilando datos que se pueden almacenar, mostrar o utilizar en otros lugares. Esta clase de tecnología es necesaria para que los motores de búsqueda funcionen como lo hacen, pero también se puede utilizar para el entrenamiento de IA. Cuando los sitios web actualizan sus archivos para bloquear a los crawlers web, se rompe tanto la búsqueda como la IA.

Dado que Huffman pasó la mayor parte de su tiempo hablando de IA, parece que el meollo del problema es que Reddit no quiere que las empresas entrenen en sus datos de usuarios sin tener ningún tipo de control, con Huffman diciendo a The Verge que empresas como Microsoft, Anthropic y Perplexity se han negado a negociar.

"Sin estos acuerdos, no tenemos ningún control ni conocimiento de cómo se muestra o se utiliza nuestros datos". El CEO dijo que ha sido "un verdadero dolor de cabeza bloquear a estas empresas".

No significa que Reddit esté siendo completamente altruista, claro. Antes de esto, la empresa firmó un acuerdo de licencia de $60 millones al año que permite a Google entrenar su IA en publicaciones de usuarios, lo que también explicaría por qué las publicaciones de Reddit aún aparecen sin problemas en la búsqueda de Google. De manera similar, OpenAI también puede entrenar en publicaciones de Reddit, y su próximo SearchGPT podrá enlazarlas, aunque la cantidad exacta de dinero detrás del acuerdo de Reddit con el creador de ChatGPT no se ha revelado.

En lugar de estar en contra de la IA, Reddit quiere estar involucrado en el proceso de toma de decisiones sobre lo que happens con sus datos. Y, por supuesto, también quiere ganar dinero.

The Verge dijo que Huffman citó un reciente comentario del CEO de AI de Microsoft, Mustafa Suleyman, como un ejemplo del tipo de comportamiento que busca combatir. En una discusión con Andrew Ross Sorkin de CNBC en el Festival de Ideas de Aspen, el ejecutivo dijo que el contenido "que ya está en la web abierta...ha sido 'software libre', si se quiere decir".

Esa es ciertamente una interpretación creativa de la ley de derechos de autor, pero no es única de Microsoft. A pesar del acuerdo de Google con Reddit, en julio del año pasado, Gizmodo descubrió un cambio en la política de privacidad de Google que decía que utiliza "información públicamente disponible" para entrenar sus modelos de IA, sin reconocer que Google no es dueño de todo lo que se publica en internet.

Mientras tanto, es incierto exactly how Google defines "information publicly available", this new Reddit deal might shed some light on the subject. For now, AI training could be moving from a free-for-all to a point where those who can afford to make companies pay will get their fair share (assuming that profiting off selling content users made before AI was even a thing counts as fair in your eyes). Alongside Reddit, The Verge's parent company Vox Media has also entered into a deal with OpenAI, as has The Atlantic. As for the rest of us, we’ll have to rely on regulation, which has been slow to respond to AI outside of the EU.

En respuesta a esto, algunos entusiastas de la tecnología comenzaron a discutir la situación en los subforos de AI de Reddit, expresando sus preocupaciones sobre la privacidad de los datos y la monetización del contenido generado por los usuarios.

Además, la comunidad tecnológica de Reddit AI comenzó a debatir si tales acciones por parte de empresas como Microsoft y Google podrían establecer un peligroso precedente en la industria tecnológica, potencialmente llevando a un internet menos abierto y democrático.

Lea también:

Comentarios

Más reciente

El presidente ruso Putin dio la bienvenida personalmente a los prisioneros liberados en el...

"Un trato con el diablo"

"Un trato con el diablo" Un convicto por asesinato es liberado para permitir que ciudadanos occidentales y críticos del Kremlin ruso escapen de la detención en Rusia. No fue una decisión fácil, pero ¿fue la correcta? Las opiniones difieren. Rusia, Bielorrusia y varios países occidentales, con la participación

Miembros Público