Moonvalley möchte ethischere Videomodelle entwickeln

Moonvalley moechte ethischere Videomodelle entwickeln

Die breite Verfügbarkeit von Tools zum Aufbau generativer KI hat zu einer kambrischen Explosion von Start-ups in diesem Bereich geführt. Auch reichlich Kapital hat nicht geschadet – ebenso wenig wie die sinkenden Kosten für die erforderliche technische Infrastruktur.

Tatsächlich besteht bei einer der auffälligsten Anwendungen der generativen KI, dem generativen Video, die Gefahr einer Übersättigung. Labore wie Genmo, Haiper Und Rhymes AI bringen Modelle in Eile auf den Markt, und in einigen Fällen unterscheiden sie sich kaum vom bisherigen Stand der Technik.

Naeem Talukdar glaubt, dass Vertrauen – nicht unbedingt die Fähigkeiten eines Models – einige generative Videoprojekte von den anderen unterscheiden wird. Deshalb gründet er Mondtalein in Los Angeles ansässiges Startup, das angeblich „transparentere“ generative Videotools entwickelt.

Talukdar leitete das Produktwachstum bei Zapier, bevor er das von Y Combinator unterstützte Unternehmen Draft gründete, das einen Marktplatz für Unternehmens-KI-Inhalte betrieb. Er rekrutierte Mateusz Malinowski und Mik Binkowski, um Moonvalley zu gründen – beide ehemalige Wissenschaftler bei DeepMind, wo sie Techniken zur Videoerzeugung studierten.

„Wir waren davon überzeugt, dass die Videoerzeugung Medien und Unterhaltung verändern würde, aber die Start-ups, die wir in diesem Bereich gesehen haben, verfügten nicht über die notwendigen Eigenschaften, um erfolgreich zu sein“, sagte Talukdar gegenüber Tech. „Bestehende Unternehmen standen Künstlern, Kreativen und der gesamten Branche zutiefst feindlich gegenüber.“

Talukdar bringt es auf den Punkt, dass die meisten generativen KI-Unternehmen Modelle auf der Grundlage öffentlicher Daten trainieren, von denen einige ausnahmslos urheberrechtlich geschützt sind. Das argumentieren diese Unternehmen faire Nutzung Die Lehre schirmt die Praxis ab. Zum Beispiel hat OpenAI bestand darauf dass Modelle ohne urheberrechtlich geschütztes Material nicht richtig trainiert werden können, und Suno hat argumentiert, dass sich wahlloses Training nicht von einem Kind unterscheidet, das seine eigenen Rocksongs schreibt, nachdem es sich das Genre angehört hat.

Einige Mitglieder des Gründungsteams von Moonvalley. (LR): Mateusz Malinowski, Byrn Mooser, Mikolaj Binkowski und John Thomas. Mikolaj Binkowski und John Thomas.Bildnachweis:Monvalley

Aber das hat die Rechteinhaber nicht aufgehalten von der Einreichung von Beschwerden oder Unterlassungserklärungen einreichen.

Die Anbieter sind trotzdem ziemlich dreist geworden Klagen gegen sie häufen sich. Anfang des Jahres bestritt die ehemalige CTO von OpenAI, Mira Murati, nicht direkt, dass Sora, das Videomodell von OpenAI, auf YouTube-Clips trainiert wurde – im Aussehen Verstoß der Nutzungsbestimmungen von YouTube. An anderer Stelle a 404 Medienbericht schlägt vor, dass Runway, ein generatives Video-Startup, ohne Erlaubnis YouTube-Filmmaterial von Kanälen von Disney und YouTubern wie MKBHD geklaut hat.

Das kanadische KI-Startup Viggle gibt offen zu, dass es YouTube-Videos als Antrieb für seine Videomodelle nutzt. Und wie die meisten seiner Konkurrenten bietet es keinen Rückgriff auf Urheber, deren Werke möglicherweise in die Ausbildung geraten sind.

„Generative Modelle müssen Urheberrechte, Marken und Ähnlichkeitsrechte respektieren“, sagte Talukdar. „Deshalb arbeiten wir bei unseren Modellen eng mit den Machern zusammen.“

Moonvalley, das noch nicht über ein vollständig geschultes Videomodell verfügt, behauptet, eines der wenigen Unternehmen zu sein, das ausschließlich lizenzierte Daten von Inhaltseigentümern verwendet, die sich dafür entschieden haben. Um seine Grundlagen abzudecken, beabsichtigt Moonvalley, den Erstellern die Möglichkeit zu geben, die Entfernung ihrer Inhalte aus seinen Modellen zu beantragen, Kunden die Möglichkeit zu geben, ihre Daten jederzeit zu löschen, und eine Entschädigungsrichtlinie anzubieten, um Benutzer vor Urheberrechtsverletzungen zu schützen.

Der Ansatz ähnelt dem von Adobe, das seine Firefly-Videomodelle auf lizenzierten Inhalten seiner Adobe Stock-Plattform trainiert. Talukdar würde nicht sagen, wie viel Moonvalley seinen Mitwirkenden für Clips zahlt, aber es könnte eine ganze Menge sein. Bloomberg gemeldet dass Adobe etwa 120 US-Dollar pro 40–45 Minuten Video anbot.

Um es klarzustellen: Moonvalley beschafft keine Inhalte selbst. Es arbeitet mit namentlich nicht genannten Partnern zusammen, die sich um die Lizenzvereinbarungen kümmern und Videos in Datensätze packen, die Moonvalley kauft.

Diese Partner – sogenannte „Datenbroker“ – sind dank des generativen KI-Booms heutzutage sehr gefragt. Der Markt für KI-Trainingsdaten ist erwartet innerhalb eines Jahrzehnts von derzeit rund 2,5 Milliarden US-Dollar auf fast 30 Milliarden US-Dollar wachsen.

„Wir lizenzieren hochwertige Daten aus mehreren Quellen, die direkt mit den Urhebern zusammenarbeiten und sie für die Nutzung ihrer Inhalte gut entlohnen“, fügte Talukdar hinzu. „Wir stellen sicher, dass wir einen qualitativ hochwertigen und vielfältigen Datensatz verwenden.“

Im Gegensatz zu einigen „ungefilterten“ Videomodellen, die ohne weiteres das Abbild einer Person in Clips einfügen, ist Moonvalley auch bestrebt, Leitplanken für seine kreativen Werkzeuge zu schaffen. Wie Sora von OpenAI blockieren die Modelle von Moonvalley bestimmte Inhalte, wie z. B. NSFW-Phrasen, und erlauben es den Leuten nicht, sie dazu aufzufordern, Videos von bestimmten Personen oder Prominenten zu erstellen.

Natürlich gibt es keinen perfekten Filter, aber Talukdar sagt, dass dieses „Red-Teaming“ ein zentraler Bestandteil der Veröffentlichungsstrategie von Moonvalley sein wird.

„Da sich die Beziehung zwischen Medien und KI weiterhin rasant und nicht ohne Skepsis weiterentwickelt, möchte sich Moonvalley als vertrauenswürdigster Partner für Medienorganisationen etablieren“, sagte er.

Aber kann Moonvalley wirklich mithalten?

Wie bereits erwähnt, verfolgen Google, Meta und unzählige andere generative Videos – mit unterschiedlichem Grad an ethischer Überlegung. Tech-Giganten ändern ihre Nutzungsbedingungen, um sich einen Datenvorteil zu verschaffen: Google trainiert sein Veo-Videomodell auf YouTube-Videos, während Meta seine Modelle auf Instagram- und Facebook-Inhalten trainiert.

Moonvalley hofft, Marken und Kreativhäuser anzusprechen, aber einige Anbieter haben dort bereits bedeutende Fortschritte gemacht. Runway hat kürzlich einen Vertrag mit Lionsgate unterzeichnet, um ein maßgeschneidertes Modell für den Filmkatalog des Studios zu trainieren; Stabilitäts-KI rekrutiert „Avatar“-Regisseur James Cameron in seinen Vorstand; und OpenAI hat sich mit zusammengetan Marken Und unabhängige Direktoren um Soras Potenzial zu demonstrieren.

Dann ist da noch Adobe, das es auf die Zielgruppe von Moonvalley abgesehen hat: Künstler und Content-Ersteller, die (zumindest aus rechtlicher Sicht) „sicherere“ generative Videotools wollen.

Die Herausforderung für Moonvalley ist dreifach. Es muss die Kunden davon überzeugen, dass seine Tools mit dem, was bereits auf dem Markt ist, konkurrenzfähig sind. Es muss genügend Start- und Landebahn aufgebaut werden, um Nachfolgemodelle trainieren und betreuen zu können. Und es muss sich eine treue Kundenbasis sichern, die nicht kurzfristig zu einem anderen Anbieter wechselt.

Viele Künstler und Kreative sind verständlicherweise misstrauisch gegenüber generativer KI, da sie die Film- und Fernsehbranche auf den Kopf zu stellen droht. Ein 2024 Studie Die von der Animation Guild, einer Gewerkschaft, die Hollywood-Animatoren und Cartoonisten vertritt, in Auftrag gegebene Studie schätzt, dass bis 2026 mehr als 100.000 US-amerikanische Film-, Fernseh- und Animationsjobs durch KI zerstört werden.

„Unser Fokus liegt auf der Entwicklung von Tools, die Entwicklern dabei helfen, immer großartigere und immersivere Inhalte zu erstellen“, sagte Talukdar, als ich ihn nach dem Risiko fragte, dass Kreative durch generative KI ihren Job verlieren.

An der Start- und Landebahnfront hat Moonvalley’s einige Fortschritte gemacht: Das Unternehmen hat kürzlich 70 Millionen US-Dollar in einer von General Catalyst und Khosla Ventures gemeinsam geleiteten Startkapitalfinanzierungsrunde unter Beteiligung von Bessemer Ventures eingesammelt. Damit werden die Forschung und Entwicklung sowie die Einstellung von Mitarbeitern bei Moonvalley finanziert.

Derzeit beschäftigt das Unternehmen etwa 30 Mitarbeiter, die zuvor bei DeepMind, Meta, Microsoft und TikTok gearbeitet haben, sagt Talukdar.

„Was uns von anderen Unternehmen unterscheidet, ist die Produktorientierung“, fügte er hinzu. „Während der Kern unseres Unternehmens in der Schulung hochmoderner generativer Modelle liegt, liegt unser Fokus auf der Entwicklung äußerst leistungsfähiger kreativer Werkzeuge, um diese Modelle in leistungsstarke Geräte für professionelle Entwickler, Studios und Marken zu verwandeln.“

Talukdar sagt, es sei geplant, das erste Modell von Moonvalley noch in diesem Jahr herauszubringen. Das Unternehmen muss sich beeilen, wenn es die kommenden Veröffentlichungen von Black Forest Labs, Luma Labs, Mitten auf der Reiseund der Elefant im Raum.

tch-1-tech