Die Deals von OpenAI mit Verlagen könnten den Konkurrenten Ärger bereiten

Der Rechtsstreit zwischen OpenAI und der New York Times um Daten zum Trainieren seiner KI-Modelle könnte noch andauern. Aber OpenAI macht Fortschritte bei Verträgen mit anderen Verlagen, darunter einigen der größten Nachrichtenverlage Frankreichs und Spaniens.

OpenAI am Mittwoch angekündigt dass es Verträge mit Le Monde und Prisa Media unterzeichnet hat, um französische und spanische Nachrichteninhalte in den ChatGPT-Chatbot von OpenAI zu bringen. In einem Blogbeitrag sagte OpenAI, dass die Partnerschaft die Berichterstattung über aktuelle Ereignisse der Organisationen – von Marken wie El País, Cinco Días, As und El Huffpost – den ChatGPT-Benutzern dort präsentieren wird, wo es Sinn macht, und außerdem einen Beitrag zu OpenAIs überhaupt leisten wird -Erweiterndes Volumen an Trainingsdaten.

OpenAI schreibt:

In den kommenden Monaten können ChatGPT-Benutzer über ausgewählte Zusammenfassungen mit Namensnennung und erweiterten Links zu den Originalartikeln mit relevanten Nachrichteninhalten dieser Herausgeber interagieren und so den Benutzern die Möglichkeit geben, auf zusätzliche Informationen oder verwandte Artikel von ihren Nachrichtenseiten zuzugreifen … Das tun wir Wir verbessern ChatGPT kontinuierlich und unterstützen die wichtige Rolle der Nachrichtenbranche bei der Bereitstellung verlässlicher Informationen in Echtzeit für Benutzer.

OpenAI hat zu diesem Zeitpunkt Lizenzverträge mit einer Handvoll Inhaltsanbietern bekannt gegeben. Jetzt schien es eine gute Gelegenheit zu sein, Bilanz zu ziehen:

  • Stock-Mediathek Shutterstock (für Bilder, Videos und Musik-Trainingsdaten)
  • Die Associated Press
  • Axel Springer (Inhaber u.a. von Politico und Business Insider)
  • Le Monde
  • Prisa Media

Wie viel zahlt OpenAI jeweils? Nun ja, das sagt man nicht – zumindest nicht öffentlich. Aber wir können abschätzen.

Die Information gemeldet im Januar, dass OpenAI Verlagen zwischen 1 und 5 Millionen US-Dollar pro Jahr für den Zugriff auf Archive zum Trainieren seiner GenAI-Modelle anbot. Das sagt uns nicht viel über die Shutterstock-Partnerschaft. Aber was die Artikellizenzierung betrifft – vorausgesetzt, dass die Berichterstattung von The Information korrekt ist und sich diese Zahlen seitdem nicht geändert haben – gibt OpenAI zwischen 4 und 20 Millionen US-Dollar pro Jahr für Nachrichten aus.

Das könnte ein paar Cent für OpenAI sein, dessen größter Gewinn bei über 11 Milliarden US-Dollar liegt und dessen Jahresumsatz kürzlich 2 Milliarden US-Dollar überstieg (pro Financial Times). Aber wie Hunter Walk, Partner bei Homebrew und Mitbegründer von Screendoor, kürzlich überlegte, ist es substanziell genug, um möglicherweise KI-Konkurrenten zu verdrängen, die ebenfalls Lizenzvereinbarungen verfolgen.

Gehen schreibt auf seinem Blog:

[I]Wenn das Experimentieren durch Lizenzverträge im Wert von neunstelligen Beträgen eingeschränkt wird, erweisen wir der Innovation keinen Gefallen … Die Kürzung der Schecks für „Eigentümer“ von Trainingsdaten stellt für Herausforderer eine enorme Eintrittsbarriere dar. Wenn Google, OpenAI und andere große Technologieunternehmen ausreichend hohe Kosten erzielen können, verhindern sie implizit den zukünftigen Wettbewerb.

Ob es heute eine Eintrittsbarriere gibt, ist fraglich. Viele – wenn nicht die meisten – KI-Anbieter haben sich dafür entschieden, den Zorn der IP-Inhaber auf sich zu ziehen, indem sie sich dafür entschieden haben, die Daten, auf deren Grundlage sie KI-Modelle trainieren, nicht zu lizenzieren. Es gibt Hinweise darauf, dass es sich beispielsweise um die kunstgenerierende Plattform Midjourney handelt Ausbildung auf Disney-Filmstills – und Midjourney hat keinen Deal mit Disney.

Die schwierigere Frage, mit der man sich auseinandersetzen muss, ist: Sollte die Lizenzierung einfach die Kosten für Geschäfte und Experimente im KI-Bereich sein?

Walk würde dagegen argumentieren. Er befürwortet einen von der Regulierungsbehörde auferlegten „sicheren Hafen“, der jeden KI-Anbieter – sowie kleine Start-ups und Forscher – vor rechtlicher Haftung schützt, solange er sich an bestimmte Transparenz- und ethische Standards hält.

Interessanterweise vor kurzem das Vereinigte Königreich versucht um etwas in dieser Richtung zu kodifizieren und die Verwendung von Text- und Data-Mining für die KI-Schulung von urheberrechtlichen Erwägungen auszunehmen, solange sie Forschungszwecken dient. Doch diese Bemühungen scheiterten letztendlich.

Ich bin mir nicht sicher, ob ich in seinem „Safe Harbor“-Vorschlag so weit gehen würde, wenn man bedenkt, welche Auswirkungen KI auf eine bereits destabilisierte Nachrichtenbranche zu haben droht. Ein aktuelles Modell von The Atlantic gefunden Wenn eine Suchmaschine wie Google KI in die Suche integrieren würde, würde sie die Anfrage eines Benutzers in 75 % der Fälle beantworten, ohne dass ein Klick auf die Website erforderlich wäre.

Aber vielleicht da Ist Raum für Ausgliederungen.

Verlage sollten bezahlt werden – und zwar fair. Gibt es jedoch nicht ein Ergebnis, bei dem sie bezahlt werden und die Herausforderer der etablierten KI-Anbieter – sowie Akademiker – Zugang zu denselben Daten erhalten? wie solche Amtsinhaber? Das sollte ich denken. Zuschüsse sind eine Möglichkeit. Eine weitere Möglichkeit sind größere VC-Schecks.

Ich kann nicht sagen, dass ich die Lösung habe, insbesondere angesichts der Tatsache, dass die Gerichte noch nicht entschieden haben, ob – und in welchem ​​Umfang – Fair Use KI-Anbieter vor Urheberrechtsansprüchen schützt. Aber es ist wichtig, dass wir diese Dinge herausfinden. Andernfalls könnte die Branche durchaus in eine Situation geraten, in der der akademische „Brain Drain“ unvermindert anhält und nur wenige mächtige Unternehmen Zugang zu riesigen Pools an wertvollen Schulungsangeboten haben.

tch-1-tech