Der Kampf zwischen Open Source und proprietärer Software ist allgemein bekannt. Doch die Spannungen, die in Softwarekreisen seit Jahrzehnten vorherrschen, sind nun auch auf den aufstrebenden Bereich der künstlichen Intelligenz übergesprungen, und es kommt zu heftigen Kontroversen.
Die New York Times hat vor kurzem veröffentlichte eine überschwängliche Einschätzung von Meta-CEO Mark Zuckerberg, der bemerkte, dass sein Engagement für „Open Source AI“ ihn im Silicon Valley wieder populär gemacht habe. Das Problem ist jedoch, dass Metas große Sprachmodelle mit der Marke Llama nicht wirklich Open Source sind.
Oder sind Sie?
Den meisten Schätzungen zufolge ist das nicht der Fall. Aber es zeigt, dass das Konzept der „Open-Source-KI“ in den kommenden Jahren nur noch mehr Debatten auslösen wird. Dies ist etwas, was die Open Source Initiative (OSI) versucht, unter der Leitung des Exekutivdirektors Stefano Maffulli (siehe Bild oben), der seit über zwei Jahren im Rahmen einer weltweiten Initiative, die Konferenzen, Workshops, Podiumsdiskussionen, Webinare, Berichte und mehr umfasst, an diesem Problem arbeitet.
KI ist kein Softwarecode
Das OSI ist Verwalter der Open Source-Definition (OSD) seit mehr als einem Vierteljahrhundert, in dem festgelegt wird, wie der Begriff „Open Source“ auf Software angewendet werden kann oder sollte. Eine Lizenz, die dieser Definition entspricht, kann legitimerweise als „Open Source“ betrachtet werden, obwohl sie eine Spektrum an Lizenzen von äußerst freizügig bis nicht ganz so freizügig.
Allerdings ist die Übertragung veralteter Lizenzierungs- und Namenskonventionen von Software auf KI problematisch. Joseph JacksOpen-Source-Evangelist und Gründer der VC-Firma OSS-Kapitalgeht sogar so weit zu sagen, dass es „keine Open-Source-KI”, und merkt an, dass „Open Source ausdrücklich für Software-Quellcode erfunden wurde.“
Im Gegensatz dazu sind „Neural Network Weights“ (NNWs) – ein Begriff, der in der Welt der künstlichen Intelligenz verwendet wird, um die Parameter oder Koeffizienten zu beschreiben, durch die das Netzwerk während des Trainingsprozesses lernt – in keiner sinnvollen Weise mit Software vergleichbar.
„Neurale Netzgewichte sind kein Software-Quellcode; sie sind weder für Menschen lesbar noch debuggbar“, bemerkt Jacks. „Außerdem lassen sich die Grundrechte von Open Source nicht in gleicher Weise auf NNWs übertragen.“
Dies führte dazu, dass Jacks und OSS Capital-Kollegen Heather Meeker Zu eine eigene Definition findenrund um das Konzept der „offenen Gewichte“.
Bevor wir also überhaupt zu einer sinnvollen Definition von „Open-Source-KI“ gekommen sind, können wir bereits einige der inhärenten Spannungen erkennen, die auf dem Weg dorthin entstehen. Wie können wir uns auf eine Definition einigen, wenn wir uns nicht darauf einigen können, dass das „Ding“, das wir definieren, existiert?
Maffulli stimmt, soweit es wichtig ist, zu.
„Der Punkt ist richtig“, sagte er gegenüber Tech. „Eine unserer ersten Debatten war, ob wir es überhaupt Open-Source-KI nennen sollten, aber jeder verwendete den Begriff bereits.“
Dies spiegelt einige der Herausforderungen im weiteren KI-Bereich wider, wo es viele Debatten darüber gibt, ob das, was wir heute „KI“ nennen, ist wirklich KI oder einfach nur leistungsstarke Systeme, die darauf trainiert sind, Muster in riesigen Datenmengen zu erkennen. Doch die Kritiker haben sich größtenteils damit abgefunden, dass die Bezeichnung „KI“ existiert und es keinen Sinn hat, dagegen anzukämpfen.
OSI wurde 1998 gegründet und ist eine gemeinnützige, gemeinnützige Organisation, die an einer Vielzahl von Open-Source-bezogenen Aktivitäten rund um Interessenvertretung, Bildung und deren Kernaufgabe arbeitet: der Open-Source-Definition. Heute ist die Organisation auf Sponsoring angewiesen und hat angesehene Mitglieder wie Amazon, Google, Microsoft, Cisco, Intel, Salesforce und Meta.
Metas Engagement bei OSI ist derzeit besonders bemerkenswert, da es sich um das Konzept der „Open-Source-KI“ handelt. Obwohl Meta seinen KI-Hut aufhängt auf dem Open-Source-Peghat das Unternehmen erhebliche Einschränkungen hinsichtlich der Verwendung seiner Llama-Modelle eingeführt: Natürlich können sie für Forschungs- und kommerzielle Zwecke kostenlos verwendet werden, aber App-Entwickler mit mehr als 700 Millionen monatlichen Nutzern müssen bei Meta eine spezielle Lizenz anfordern, die Meta nach eigenem Ermessen gewährt.
Einfach ausgedrückt: Metas Big-Tech-Brüder können pfeifen, wenn sie wollen.
Metas Sprache rund um seine LLMs ist etwas formbar. Während das Unternehmen seine Llama 2-Modell Open Sourcemit der Ankunft von Llama 3 im April wich es etwas von der Terminologie ab, mit Phrasen wie „offen verfügbar“ und „offen zugänglich“. Aber an manchen Stellen ist es bezieht sich immer noch auf das Modell als „Open Source“.
„Alle anderen, die an der Diskussion beteiligt sind, sind sich vollkommen einig, dass Llama selbst nicht als Open Source betrachtet werden kann“, sagte Maffulli. „Die Leute, mit denen ich gesprochen habe und die bei Meta arbeiten, wissen, dass das ein bisschen weit hergeholt ist.“
Darüber hinaus könnten einige argumentieren, dass hier ein Interessenkonflikt besteht: Ein Unternehmen, das den Wunsch gezeigt hat, sich an der Marke Open Source zu bereichern, stellt den Verwaltern „der Definition“ auch noch Geld zur Verfügung?
Dies ist einer der Gründe, warum das OSI versucht, seine Finanzierung zu diversifizieren und sich kürzlich einen Zuschuss von der Sloan-Stiftungdas dabei hilft, die globale Initiative mehrerer Interessengruppen zur Erreichung der Open Source AI Definition zu finanzieren. Tech kann enthüllen, dass sich dieser Zuschuss auf rund 250.000 US-Dollar beläuft, und Maffulli hofft, dass dies den Eindruck seiner Abhängigkeit von Unternehmensfinanzierungen verändern kann.
„Das ist eines der Dinge, die das Sloan-Stipendium noch deutlicher macht: Wir könnten uns jederzeit von Metas Geld verabschieden“, sagte Maffulli. „Das hätten wir sogar vor diesem Sloan-Stipendium tun können, denn ich weiß, dass wir Spenden von anderen bekommen werden. Und Meta weiß das sehr gut. Sie mischen sich in nichts davon ein. [process]Microsoft, GitHub, Amazon oder Google sind dazu nicht in der Lage – sie wissen ganz genau, dass sie sich nicht einmischen können, weil die Struktur der Organisation das nicht zulässt.“
Arbeitsdefinition von Open-Source-KI
Der aktuelle Entwurf der Open Source AI Definition befindet sich bei Version 0.0.8bestehend aus drei Kernteilen: der „Präambel“, die den Auftrag des Dokuments darlegt, der Open-Source-KI-Definition selbst und einer Checkliste, die die Komponenten durchgeht, die für ein Open-Source-kompatibles KI-System erforderlich sind.
Gemäß dem aktuellen Entwurf sollte ein Open-Source-KI-System die Freiheit gewähren, das System für beliebige Zwecke zu verwenden, ohne eine Genehmigung einzuholen. Anderen sollte es gestattet sein, die Funktionsweise des Systems zu untersuchen und seine Komponenten zu prüfen, und das System für beliebige Zwecke zu ändern und freizugeben.
Eine der größten Herausforderungen betrifft jedoch die Daten – das heißt, kann ein KI-System als „Open Source“ eingestuft werden, wenn das Unternehmen den Trainingsdatensatz nicht für andere zugänglich gemacht hat? Laut Maffulli ist es wichtiger zu wissen, woher die Daten stammen und wie ein Entwickler die Daten beschriftet, Duplikate entfernt und gefiltert hat. Und auch Zugriff auf den Code zu haben, der verwendet wurde, um den Datensatz aus seinen verschiedenen Quellen zusammenzustellen.
„Es ist viel besser, diese Informationen zu kennen, als den einfachen Datensatz ohne den Rest zu haben“, sagte Maffulli.
Obwohl es schön wäre, Zugriff auf den gesamten Datensatz zu haben (OSI macht dies zu einer „optionalen“ Komponente), ist dies laut Maffulli in vielen Fällen weder möglich noch praktikabel. Dies könnte daran liegen, dass der Datensatz vertrauliche oder urheberrechtlich geschützte Informationen enthält, die der Entwickler nicht weitergeben darf. Darüber hinaus gibt es Techniken zum Trainieren von Modellen für maschinelles Lernen, bei denen die Daten selbst nicht tatsächlich mit dem System geteilt werden. Dazu werden Techniken wie föderiertes Lernen, differenzielle Privatsphäre und homomorphe Verschlüsselung verwendet.
Und dies verdeutlicht perfekt die grundlegenden Unterschiede zwischen „Open-Source-Software“ und „Open-Source-KI“: Die Absichten mögen ähnlich sein, aber sie sind nicht eins zu eins vergleichbar, und diese Ungleichheit versucht das OSI in seiner Definition zu erfassen.
In der Software sind Quellcode und Binärcode zwei Ansichten desselben Artefakts: Sie spiegeln dasselbe Programm in unterschiedlicher Form wider. Trainingsdatensätze und die anschließend trainierten Modelle sind jedoch unterschiedliche Dinge: Sie können denselben Datensatz verwenden und werden nicht unbedingt in der Lage sein, dasselbe Modell konsistent neu zu erstellen.
„Während des Trainings treten zahlreiche statistische und zufällige Logikprozesse auf, die es nicht auf die gleiche Weise wie Software replizieren können“, fügte Maffulli hinzu.
Ein Open-Source-KI-System sollte also leicht reproduzierbar sein und klare Anweisungen enthalten. Und hier kommt die Checklisten-Aspekt der Open-Source-KI-Definition ins Spiel, die auf einer kürzlich veröffentlichte wissenschaftliche Arbeit mit dem Titel „Das Model Openness Framework: Förderung von Vollständigkeit und Offenheit für Reproduzierbarkeit, Transparenz und Benutzerfreundlichkeit in der künstlichen Intelligenz.“
In diesem Dokument wird das Model Openness Framework (MOF) vorgeschlagen, ein Klassifizierungssystem, das Machine-Learning-Modelle „auf der Grundlage ihrer Vollständigkeit und Offenheit“ bewertet. Das MOF fordert, dass bestimmte Komponenten der KI-Modellentwicklung „unter geeigneten offenen Lizenzen enthalten und veröffentlicht werden“, darunter Trainingsmethoden und Details zu den Modellparametern.
Stabiler Zustand
Die offizielle Einführung der Definition wird von der OSI als „stabile Version“ bezeichnet, ähnlich wie es ein Unternehmen mit einer Anwendung tun würde, die vor ihrer Veröffentlichung ausgiebig getestet und debuggt wurde. Die OSI bezeichnet dies bewusst nicht als „finale Version“, da sich Teile davon wahrscheinlich noch weiterentwickeln werden.
„Wir können nicht wirklich erwarten, dass diese Definition 26 Jahre lang Bestand hat, wie die Open-Source-Definition“, sagte Maffulli. „Ich erwarte nicht, dass sich der obere Teil der Definition – etwa ‚Was ist ein KI-System?‘ – stark ändern wird. Aber die Teile, auf die wir uns in der Checkliste beziehen, diese Komponentenlisten, hängen von der Technologie ab? Wer weiß, wie die Technologie morgen aussehen wird.“
Die stabile Open Source AI Definition wird voraussichtlich vom Vorstand abgesegnet werden auf der All Things Open-Konferenz Ende Oktober, und in den darauffolgenden Monaten startete das OSI eine globale Roadshow auf fünf Kontinenten, um „vielfältigeren Input“ darüber zu erhalten, wie „Open-Source-KI“ künftig definiert werden soll. Doch die endgültigen Änderungen dürften kaum mehr als „kleine Anpassungen“ hier und da sein.
„Das ist die letzte Etappe“, sagte Maffulli. „Wir haben eine Version der Definition mit allen Funktionen erreicht; wir haben alle Elemente, die wir brauchen. Jetzt haben wir eine Checkliste, mit der wir überprüfen, ob es darin keine Überraschungen gibt; es gibt keine Systeme, die ein- oder ausgeschlossen werden sollten.“