Vermischtes
Newsroom

Warum Nachrichten-Webseiten ChatGPT und Co. blocken

Warum Nachrichten-Webseiten ChatGPT und Co. blocken Barbara Brandstetter

Und wie Medienhäuser ihre Inhalte schützen, erklärt Barbara Brandstetter. Welchen Trends die Professorin für Wirtschaftsjournalismus sonst noch auf der Spur ist.

Berlin – Künstliche Intelligenz (KI) revolutioniert die Medienbranche. Allerdings haben viele Medienhäuser etwas dagegen, dass KI-Anbieter ihre Inhalte nutzen. So verweigern 60 Prozent der am meisten genutzten Nachrichten-Webseiten in Deutschland KI-Crawlern den Zugang zu ihren Inhalten. Crawler werden von KI-Unternehmen wie OpenAI oder Google eingesetzt, um mit Hilfe der Daten im Netz ihre Chatbots zu trainieren. Und natürlich auch, um Antworten zu aktuellen Ereignissen zur Verfügung stellen zu können, analysiert Barbara Brandstetter im aktuellen „kress pro“.


Richard Fletcher vom Reuters Insti­tute for the Study of Journalism hat Ende 2023 die 15 am meisten genutzten Nachrichten-Seiten in zehn Ländern (Brasilien, Dänemark, Deutschland, Indien, Mexiko, Norwegen, Polen, Spanien, Großbritannien und die USA) dahingehend untersucht, inwiefern sie Crawlern von KI-Unternehmen den Zugang zu ihren Inhalten gestatten. 

 

Die Studie kommt zum Ergebnis, dass knapp die Hälfte der untersuchten Medien in den zehn Ländern (48 Prozent) Crawler von OpenAI blockieren. Weniger restriktiv sind die Medienhäuser beim KI-Crawler von Google: Diesem verwehren gerade einmal 24 Prozent der analysierten Webseiten den Zugang. Der Autor begründet dies damit, dass OpenAI mit ChatGPT prominenter ist und zudem auch stärker genutzt wird als Bard/Gemini von Google. Es könnte auch sein, dass Medien zurückhaltender sind, Crawler von Google zu blockieren, weil sie negative Auswirkungen auf die Suchmaschinen-Ergebnisse fürchten.


Medienhäuser nennen laut Studie verschiedene Gründe, warum sie KI-Konzernen den Zugang zu ihren Inhalten verwehren. Einige Anbieter wie etwa die „New York Times“ vertreten die Ansicht, dass die KI-Unternehmen für die Nutzung zahlen sollten. Die Weltmarke hat im Dezember 2023 Klage gegen OpenAI und Microsoft wegen Urheberrechtsverletzung eingereicht. Die Konzerne hätten ohne Zustimmung Millionen ihrer Artikel verwendet, um ihre Chatbots zu trainieren.


Andere Medienhäuser fürchten, die KI könnte mit ihren Inhalten falsche Informationen generieren, was sich wiederum negativ auf die Glaubwürdigkeit der Medienmarke auswirken könnte. Etliche Medien sehen es auch kritisch, dass ihre Inhalte ohne Hinweis auf die Quelle verwendet werden. Denn wenn die Nutzer keinen Link mehr zur Nachrichtenwebseite erhalten, entfällt eine relevante Möglichkeit, neue Abonnenten zu gewinnen.

 

Starke Unterschiede bei den Ländern
Während knapp die Hälfte der untersuchten Seiten in den zehn Ländern OpenAI den Zugang verweigert, gibt es laut Studie durchaus Medienhäuser, die es begrüßen, wenn die Chatbots mit Hilfe ihrer Inhalte trainiert werden. So haben einige wenige Unternehmen wie etwa Axel Springer in Deutschland eine Vereinbarung mit OpenAI geschlossen.


Um festzustellen, welche Nachrichtenseiten der KI den Zugang sperren, hat der Studienautor das Internetarchiv Wayback Machine genutzt. Dabei kommt er zum Ergebnis, dass der Anteil der restriktiven Medienhäuser je nach Land stark variiert. Während in den USA 79 Prozent der Medien OpenAI den Zugang verwehren, liegt der Anteil in Polen und Mexiko bei gerade einmal 20 Prozent. Und während in Spanien und Polen nur 7 Prozent Googles KI-Crawler blockieren, sind es in Deutschland 60 Prozent. Auch zeigen die Daten, dass Medien in vielen Ländern den Zugang von Anfang an untersagt haben. Lediglich Anbieter in Spanien, Mexiko und Polen hätten erst später reagiert. Generell seien nördliche Länder restriktiver als solche im Süden.


Die Studie macht auch Unterschiede bei den verschiedenen Medienkategorien aus. So blockieren Nachrichten-Webseiten mit einer großen Reichweite eher die Crawler als solche mit geringer Reichweite. Besonders restriktiv beim Zugang zu den Inhalten verhalten sich Printmarken – Tageszeitungen wie die „New York Times“ oder Magazine wie der „Spiegel“.


Laut Studie schließen mehr als die Hälfte der traditionellen Printtitel OpenAI aus (57 Prozent). Bei Fernseh- und Radiostationen wie BBC oder CNN untersagen 48 Prozent den Zugang, bei den klassischen digitalen Medien (HuffPost, Yahoo) liegt der Anteil bei 31 Prozent. Für Google ergibt sich ein ähnliches Bild. Danach blockieren 32 Prozent der Printmedien den Zugang, bei den Fernsehsendern sind es 19 und bei den digitalen Medien 17 Prozent.


Die KI-Unternehmen haben auf die Kritik der Medien bereits reagiert. So hat OpenAI mit der Veröffentlichung des neusten Web-Crawlers im August 2023 eine Anleitung veröffentlicht, wie dieser blockiert werden kann. Auch Google hat im September eine entsprechende Opt-out-Möglichkeit angeboten. Die Studie geht davon aus, dass den KI-Unternehmen aufgrund der restriktiven Haltung der Medien weniger Inhalte zur Verfügung stehen, um die Chatbots zu trainieren. Das wiederum dürfte sich negativ auf die Qualität der von der KI generierten Antworten auswirken.


Nach Einschätzung des Autors dürften einige Medienhäuser künftig die Blockade aufheben – etwa, weil sie Abkommen mit den KI-Unternehmen schließen. Oder aber, wenn die Nachteile ihres restriktiven Handelns die Vorteile überwiegen.

 

  • Vertrieb: Wie Bundle den Umsatz steigern
  • USA: Hohe Preise für Printabos
  • Audio: Wie Werbung auf Dauer wirkt

Zu dem Studien

 

Barbara Brandstetter  ist Professorin für Wirtschaftsjournalismus an der Hochschule Neu-Ulm.