Metas neues Lama Der Start von 2 zeigte die explosionsartige Zunahme des Interesses an Open-Source-LLMs (Large Language Models) und der Start wurde als das erste Open-Source-LLM von Big Tech mit einer kommerziellen Lizenz angekündigt.
Bei all der Aufregung vergisst man leicht die wahre Unsicherheit über rechtliche Fragen wie geistiges Eigentum (IP) und Urheberrecht im Bereich der generativen KI. Im Allgemeinen geht man davon aus, dass Unternehmen, die LLMs erstellen, sich um regulatorische Risiken kümmern müssen.
Es ist eine gefährliche Annahme, ohne die Giftpille der generativen KI zu berücksichtigen: Derivate.
Das Verständnis der Risiken, die von der Giftpille der generativen KI ausgehen, gibt Technologieführern in Unternehmen auch die Werkzeuge an die Hand, diese zu bewältigen.
Während „abgeleitete Werke“ im Urheberrecht eine besondere rechtliche Behandlung genießen, gibt es nur wenige Präzedenzfälle für Gesetze oder Vorschriften, die sich damit befassen Daten Derivate, die dank Open-Source-LLMs immer häufiger an Bedeutung gewinnen werden.
Wenn ein Softwareprogramm Ausgabedaten basierend auf Eingabedaten generiert, welche Ausgabedaten sind eine Ableitung der Eingabedaten? Alles davon? Etwas davon? Nichts davon?
Ein vorgelagertes Problem, wie eine Giftpille, breitet die Ansteckungsgefahr in der Derivatekette aus und erweitert den Umfang jeglicher Ansprüche, je näher wir den tatsächlichen rechtlichen Herausforderungen in Bezug auf geistiges Eigentum in LLMs kommen.
Unsicherheit über die rechtliche Behandlung von Datenderivaten ist in der Softwarebranche der Status quo.
Warum verändern LLMs das Spiel? Es ist ein perfekter Sturm aus drei Kräften:
- Zentralisierung. Erst mit dem Aufkommen von LLMs konnte eine einzelne Software variable Ausgaben erzeugen, die auf unzählige Arten anwendbar waren. LLMs produzieren nicht nur Text und Bilder, sondern auch Code, Audio, Video und reine Daten. In ein paar Jahren, lange bevor sich die Rechtsprechung zu Eigentum an geistigem Eigentum und Urheberrechten rund um LLMs klärt, wird die Nutzung von LLM allgegenwärtig sein und die Gefährdung erhöhen, wenn das Risiko über die LLM-Anbieter hinaus auf die LLM-Nutzer übergehen würde. Dies gilt nicht nur für urheberrechtliche Risiken, sondern auch für Risiken im Zusammenhang mit anderen möglichen Schäden, die durch Halluzinationen, Voreingenommenheit usw. verursacht werden.
- Anreize. Urheberrechtsinhaber haben einen Anreiz, sich für eine möglichst breite Definition von LLM-Derivaten einzusetzen, da sie den Umfang ihrer Schadensersatzansprüche erweitert. Perverserweise tun dies auch die großen Plattformunternehmen, wenn sie in ihrem totalen Krieg mit anderen Plattformen Lizenzbeschränkungen verhängen. Die Llama 2-Lizenz ist ein typisches Beispiel: Abschnitt 1.bv verhindert die Verwendung von Llama zur „Verbesserung“ von Nicht-Lama-LLMs. Unscharfe Definitionen kommen den Rechteinhabern und demjenigen zugute, der über die größte juristische Kriegskasse verfügt.