Reddit заблокировал Bing из-за ИИ, а не сделки с Google
После того, как результаты Reddit перестали появляться в поисковых системах, кроме Google на прошлой неделе, компания наконец-то выступила с объяснениями, в основном приуменьшая проблему поиска и заявляя, что устала от компаний, обучающих AI на своих данных бесплатно.
«Мы столкнулись с тем, что Microsoft, Anthropic и Perplexity ведут себя так, как будто весь контент в Интернете доступен им бесплатно для использования», - сказал CEO Reddit Стив Хадфилд в интервью The Verge. «...что поставило нас в положение блокировки тех, кто не хочет соглашаться с тем, как мы хотим, чтобы наши данные использовались или не использовались».
Хадфилд обвинил Microsoft в обучении своего AI на данных Reddit, собранных через Bing, а также в продаже этих данных через API Bing. Похоже, что удаление поиска Reddit было в основном побочным эффектом блокировки этого процесса, хотя компания также была недовольна тем, как поисковая система Bing использует AI для резюмирования своих постов без необходимости переходить к ним пользователям.
Но как борьба с AI может повредить поиску? Несмотря на то, что они могут казаться совершенно разными технологиями, и AI, и поиск зависят от «веб-пауков», которые сканируют Интернет, собирая данные, которые можно хранить, отображать или использовать в других местах. Такая техника необходима для работы поисковых систем так, как они работают, но ее также можно использовать для обучения AI. Когда веб-сайты обновляют свои файлы для блокировки веб-пауков, это ломает и то, и другое.
Поскольку Хадфилд большую часть времени говорил об AI, кажется, что суть проблемы в том, что Reddit не хочет, чтобы компании обучались на данных своих пользователей без какого-либо контроля, и Хадфилд сказал The Verge, что компании, подобные Microsoft, Anthropic и Perplexity, отказались вести переговоры.
«Без этих соглашений у нас нет никакого контроля или знаний о том, как наши данные отображаются или для чего они используются». CEO сказал, что это «действительно раздражало» блокировать эти компании.
Но это не значит, что Reddit полностью альтруистичен, ведь в этом году компания подписала лицензионную сделку на $60 миллионов в год, которая позволяет Google обучать свой AI на пользовательских постах, что также объясняет, почему посты Reddit по-прежнему свободно отображаются в поиске Google. Аналогичным образом, OpenAI также может обучаться на постах Reddit, и его грядущий SearchGPT сможет ссылаться на них, хотя точная сумма, уплаченная Reddit за сделку с ChatGPT, не разглашается.
Вместо того чтобы выступать против AI, Reddit хочет участвовать в принятии решений о том, что происходит с его данными. И, конечно же, получать за это деньги.
The Verge сказал, что Хадфилд ссылался на недавний комментарий CEO Microsoft AI Мустафы Сулеймана как на пример того типа поведения, которое хочет предотвратить. На дискуссии с CNBC’s Andrew Ross Sorkin на фестивале «Аспен идей», исполнительный директор сказал, что контент «уже на открытой сети...был «бесплатным программным обеспечением», если хотите».
Это, безусловно, творческое толкование закона об авторском праве, но оно не уникально для Microsoft. Несмотря на сделку Google с Reddit, в июле прошлого года Gizmodo заметил изменение в политике конфиденциальности Google, в котором говорилось, что она использует «общедоступную информацию» для обучения своих моделей AI, не признавая того, что Google не владеет всем, что публикуется в Интернете.
Пока неясно, как именно Google определяет «общедоступную информацию», но эта новая сделка Reddit, возможно, прольет свет на этот вопрос. Пока обучение AI, похоже, переходит от бесплатного для всех к тому, что те, кто может себе это позволить, заставят компании платить (при условии, что получение прибыли от продажи контента, созданного пользователями до того, как AI вообще существовал, считается заслуженным в ваших глазах). Наряду с Reddit, Vox Media, материнская компания The Verge, также заключила сделку с OpenAI, как и The Atlantic. А остальные из нас, похоже, придется дожидаться регулирования, которое медленно реагирует на AI за пределами ЕС.
В ответ на это некоторые энтузиасты технологий начали обсуждать ситуацию на форумах Reddit AI, выражая свои опасения по поводу конфиденциальности данных и монетизации пользовательского контента.
Кроме того, техносообщество на Reddit AI начало дискуссию о том, могут ли подобные действия компаний, подобных Microsoft и Google, установить опасный прецедент в отрасли, потенциально приводя к менее открытому и демократическому Интернету.