Reddit blockiert Bing wegen KI, nicht wegen eines Deals mit Google
Nach dem Verschwinden von Reddit-Ergebnissen aus Suchmaschinen, die nicht Google heißen, hat das Unternehmen nun endlich eine Erklärung abgegeben und die Suchprobleme heruntergespielt. Es gibt an, gelangweilt zu sein von AI-Unternehmen, die kostenlos auf seinen Daten trainieren.
"Microsoft, Anthropic und Perplexity haben so getan, als ob alle Inhalte im Internet kostenlos für sie verfügbar seien", sagte Reddit-CEO Steve Huffman The Verge in einem Interview. "...was uns nun in die Lage versetzt hat, Personen zu blockieren, die nicht bereit waren, sich mit unseren Vorstellungen darüber einverstanden zu erklären, wie unsere Daten verwendet oder nicht verwendet werden sollten."
Huffman beschuldigte Microsoft, seine AI auf Reddit-Daten zu trainieren, die mithilfe von Bing geschürft wurden, sowie diese Daten anschließend über die Bing-API zu verkaufen. Das Wegfallen von Reddit-Suchergebnissen scheint largely ein Nebeneffekt des Blockierens dieses Prozesses gewesen zu sein, obwohl das Unternehmen auch nicht glücklich darüber war, dass die Bing-Suchmaschine seine Beiträge mithilfe von AI zusammenfasste, ohne dass Nutzer darauf klicken mussten.
Aber wie kann der Kampf gegen AI die Suche brechen? Während sie zunächst wie getrennte Technologien erscheinen mögen, beruhen sowohl AI als auch Suche auf "Webcrawlern", die das Internet durchforsten und Daten sammeln, die gespeichert, angezeigt oder anderswo verwendet werden können. Diese Technologie ist necessary für Suchmaschinen, aber sie kann auch für das AI-Training verwendet werden. Wenn Websites ihre Dateien aktualisieren, um Webcrawler zu blockieren, bricht beides.
Da Huffman die meiste Zeit über AI gesprochen hat, scheint das Kernproblem zu sein, dass Reddit nicht möchte, dass Unternehmen auf seinen Nutzerdaten trainieren, ohne dass es eine Art Kontrolle hat. Huffman sagte The Verge, dass Unternehmen wie Microsoft, Anthropic und Perplexity sich geweigert haben, zu verhandeln.
"Ohne diese Vereinbarungen haben wir keine Kontrolle oder Kenntnis darüber, wie unsere Daten angezeigt werden oder wofür sie verwendet werden." Der CEO sagte, es sei "ein echter Pain in the ass gewesen, diese Unternehmen zu blockieren."
Das bedeutet jedoch nicht, dass Reddit uneigennützig handelt. Zu Beginn des Jahres unterzeichnete das Unternehmen eine 60-Millionen-Dollar-Jahreslizenzvereinbarung, die es Google ermöglicht, seine AI auf Nutzerbeiträgen zu trainieren, was auch erklärt, warum Reddit-Beiträge weiterhin ungehindert in Google-Suchergebnissen angezeigt werden. Ähnlich kann OpenAI auch auf Reddit-Beiträgen trainieren, und seine kommende SearchGPT-Engine wird in der Lage sein, darauf zu verlinken, obwohl der spezifische Dollar-Betrag hinter der Vereinbarung von Reddit mit dem ChatGPT-Ersteller nicht bekannt gegeben wurde.
Statt gegen AI zu sein, möchte Reddit an der Entscheidungsfindung beteiligt sein und möchte auch bezahlt werden.
The Verge berichtete, dass Huffman einen jüngsten Kommentar von Microsoft AI-CEO Mustafa Suleyman als Beispiel für das Verhalten nannte, dem es entgegenwirken möchte. In einer Diskussion mit CNBC's Andrew Ross Sorkin auf dem Aspen Ideas Festival sagte der Executive, dass Inhalte, die bereits im Open Web vorhanden sind, "freeware" seien, wenn man so will.
Das ist sicherlich eine kreativ Interpretation des Urheberrechts, aber es ist auch nicht einzigartig für Microsoft. Trotz der Vereinbarung von Google mit Reddit wurde im Juli des Vorjahres eine Änderung der Google-Datenschutzbestimmungen entdeckt, die besagt, dass es "öffentlich verfügbare Informationen" verwendet, um seine AI-Modelle zu trainieren, ohne anzuerkennen, dass Google nicht tatsächlich alles besitzt, was im Internet veröffentlicht wurde.
Während es unklar ist, wie Google "öffentlich verfügbar" definiert, könnte diese neue Reddit-Vereinbarung Licht auf das Thema werfen. Vorerst könnte das AI-Training von einem Free-for-all zu einem Punkt übergehen, an dem diejenigen, die Unternehmen bezahlen lassen können, ihren gerechten Lohn erhalten (unter der Annahme, dass das Profitieren vom Verkauf von Inhalten, die Nutzer erstellten, bevor AI überhaupt existierte, als gerecht gilt).
Neben Reddit haben auch The Verge's Mutterunternehmen Vox Media und The Atlantic eine Vereinbarung mit OpenAI geschlossen. Was den Rest von uns betrifft, müssen wir auf Regulierung hoffen, die auf AI außerhalb der EU langsam reagiert hat.
Als Reaktion darauf begannen einige Tech-Enthusiasten, die Situation auf den Reddit AI-Subforen zu diskutieren und äußerten ihre Bedenken bezüglich des Datenschutzes und der Monetarisierung von Nutzer-generierten Inhalten.
Darüber hinaus begann die Tech-Gemeinschaft auf Reddit AI zu debattieren, ob solche Maßnahmen von Unternehmen wie Microsoft und Google einen gefährlichen Präzedenzfall in der Tech-Branche setzen könnten, was möglicherweise zu einem weniger offenen und demokratischen Internet führen könnte.