Diese Woche in der KI: OpenAI und Verlage sind Zweckpartner

Diese Woche in der KI OpenAI und Verlage sind Zweckpartner

Mit einer so schnelllebigen Branche wie der KI Schritt zu halten, ist eine große Herausforderung. Bis eine KI das für Sie übernehmen kann, finden Sie hier eine praktische Zusammenfassung der neuesten Entwicklungen aus der Welt des maschinellen Lernens sowie bemerkenswerter Forschungsarbeiten und Experimente, die wir nicht gesondert behandelt haben.

Übrigens plant Tech, bald einen KI-Newsletter herauszubringen. Bleiben Sie dran. In der Zwischenzeit erhöhen wir die Häufigkeit unserer halbregelmäßigen KI-Kolumne, die bisher etwa zweimal im Monat erschien, auf wöchentlich – halten Sie also Ausschau nach weiteren Ausgaben.

Diese Woche in KI, OpenAI angekündigt dass es einen Vertrag mit News Corp, dem neuen Verlagsriesen, geschlossen hat, um von OpenAI entwickelte generative KI-Modelle anhand von Artikeln von News Corp-Marken zu trainieren, darunter Das Wall Street Journal, Financial Times und MarketWatch. Die Vereinbarung, die die Unternehmen als „mehrjährig“ und „historisch“ beschreiben, gibt OpenAI auch das Recht, als Antwort auf bestimmte Fragen News Corp-Titel in Apps wie ChatGPT anzuzeigen – vermutlich in Fällen, in denen die Antworten ganz oder teilweise aus News Corp-Veröffentlichungen stammen.

Klingt nach einem Gewinn für beide Seiten, oder? News Corp erhält für seine Inhalte eine Finanzspritze – über 250 Millionen Dollar. Berichten zufolge — in einer Zeit, in der die Aussichten für die Medienbranche noch düsterer als sonst. (Generative KI hat nicht geholfenund drohte den Empfehlungsverkehr von Veröffentlichungen erheblich reduzieren.) Unterdessen muss sich OpenAI, das an mehreren Fronten mit Urheberrechtsinhabern wegen Streitigkeiten um die faire Verwendung kämpft, um einen kostspieligen Gerichtsstreit weniger Sorgen machen.

Aber der Teufel steckt im Detail. Beachten Sie, dass der News Corp-Deal ein Enddatum hat – wie alle Content-Lizenzverträge von OpenAI.

Das an und für sich ist kein böser Wille von OpenAI. Unbefristete Lizenzen sind in den Medien eine Seltenheit, wenn man bedenkt, dass alle Beteiligten die Möglichkeit haben, den Vertrag neu zu verhandeln. Es Ist ein wenig verdächtig angesichts der jüngsten Kommentare von OpenAI-CEO Sam Altman über die schwindende Bedeutung von Trainingsdaten für KI-Modelle.

In einem Auftritt im „All-In“-Podcast sagte Altman sagte dass er „definitiv [doesn’t] Ich denke, es wird ein Wettrüsten geben für [training] Daten“, denn „wenn Modelle intelligent genug werden, sollte es irgendwann nicht mehr um mehr Daten gehen – zumindest nicht für das Training.“ An anderer Stelle schreibt er erzählt James O’Donnell vom MIT Technology Review äußerte sich „optimistisch“, dass OpenAI – und/oder die KI-Industrie insgesamt – „einen Weg finden wird aus [needing] immer mehr Trainingsdaten.“

Die Modelle sind noch nicht so „intelligent“, was OpenAI dazu veranlasst, Berichten zufolge experimentieren sie mit synthetischen Trainingsdaten und durchforste die Weiten des Internets – und YouTube — für organische Quellen. Aber nehmen wir an, sie werden eines Tages nicht brauchen viele zusätzliche Daten, um sich sprunghaft zu verbessern. Wo bleiben die Herausgeber, insbesondere nachdem OpenAI ihre gesamten Archive durchsucht hat?

Worauf ich hinaus will, ist, dass die Verlage – und die anderen Inhaltseigentümer, mit denen OpenAI zusammengearbeitet hat – offenbar nur kurzfristige Partner aus Eigennutz sind, nicht viel mehr. Durch Lizenzverträge neutralisiert OpenAI effektiv eine rechtliche Bedrohung – zumindest bis die Gerichte entscheiden, wie Fair Use im Zusammenhang mit KI-Training anzuwenden ist – und kann einen PR-Erfolg feiern. Die Verlage erhalten dringend benötigtes Kapital. Und die Arbeit an KI, die diesen Verlagen ernsthaft schaden könnte, geht weiter.

Hier sind einige weitere bemerkenswerte KI-Geschichten der letzten Tage:

  • Spotifys KI-DJ: Spotifys Erweiterung um die Funktion „KI-DJ“, die den Benutzern personalisierte Songauswahlen vorstellt, war der erste Schritt des Unternehmens in eine KI-Zukunft. Jetzt entwickelt Spotify eine alternative Version dieses DJs, die Spanisch sprechen wird, schreibt Sarah.
  • Metas KI-Rat: Meta gab am Mittwoch die Schaffung eines KI-Beirat. Es gibt jedoch ein großes Problem: Es sind nur weiße Männer dabei. Das wirkt ein wenig unsensibel, wenn man bedenkt, dass marginalisierte Gruppen am ehesten unter den Folgen der Unzulänglichkeiten der KI-Technologie leiden werden.
  • FCC schlägt Offenlegungen zur KI vor: Die Federal Communications Commission (FCC) hat eine Vorschrift erlassen, wonach KI-generierte Inhalte in politischen Anzeigen offengelegt – aber nicht verboten werden müssen. Devin hat die ganze Geschichte.
  • Beantworten von Anrufen mit Ihrer Stimme: Truecaller, der weithin bekannte Anrufer-ID-Dienst, wird es Kunden bald ermöglichen, seinen KI-gestützten Assistenten zu nutzen, um Anrufe in ihrem eigen Stimme, dank einer neuen Partnerschaft mit Microsoft.
  • Humane erwägt einen Verkauf: Humane, das Unternehmen hinter dem vielbeachteten Ai Pin, dessen Markteinführung letzten Monat nicht gerade rosig ausfiel, ist auf der Suche nach einem Käufer. Das Unternehmen hat sich Berichten zufolge einen Preis zwischen 750 Millionen und einer Milliarde Dollar gesetzt und der Verkaufsprozess befindet sich noch in der Anfangsphase.
  • TikTok setzt auf generative KI: TikTok ist das neueste Technologieunternehmen, das generative KI in sein Anzeigengeschäft integriert. Am Dienstag gab das Unternehmen bekannt, dass es eine neue TikTok Symphony AI-Suite für Marken auf den Markt bringt. Die Tools werden Marketingfachleuten dabei helfen, Skripte zu schreiben, Videos zu produzieren und ihre aktuellen Anzeigenressourcen zu verbessern, berichtet Aisha.
  • KI-Gipfel in Seoul: Bei einem KI-Sicherheitsgipfel im südkoreanischen Seoul einigten sich Regierungsvertreter und Führungskräfte der KI-Branche darauf, in diesem sich rasch entwickelnden Bereich grundlegende Sicherheitsmaßnahmen anzuwenden und ein internationales Sicherheitsforschungsnetzwerk aufzubauen.
  • Die KI-PCs von Microsoft: Im Rahmen zweier Keynotes während seiner jährlichen Entwicklerkonferenz Build in dieser Woche stellte Microsoft eine neue Reihe von Windows-Rechnern (und Surface-Laptops) vor, die es Copilot+ PCs nennt, sowie generative KI-gestützte Funktionen wie Recall, das Benutzern hilft, Apps, Dateien und andere Inhalte wiederzufinden, die sie sich in der Vergangenheit angesehen haben.
  • Das Stimmendebakel von OpenAI: OpenAI entfernt eine der Stimmen aus der Text-to-Speech-Funktion von ChatGPT. Benutzer fanden, dass die Stimme namens Sky Scarlett Johansson (die schon früher KI-Charaktere gespielt hat) unheimlich ähnlich sei – und Johansson selbst gab eine Erklärung ab, in der sie sagte, sie habe einen Rechtsbeistand engagiert, um sich nach der Sky-Stimme zu erkundigen und genaue Details zu ihrer Entwicklung zu erfahren.
  • Britisches Gesetz zum autonomen Fahren: Die britischen Vorschriften für selbstfahrende Autos sind nach der königlichen Zustimmung nun offiziell. Dies ist der letzte Schritt, den ein Gesetz durchlaufen muss, bevor es gesetzlich verankert wird.

Mehr maschinelles Lernen

Diese Woche gibt es ein paar interessante KI-nahe Forschungsarbeiten für Sie. Der produktive Forscher der University of Washington, Shyan Gollakota, schlägt wieder zu mit einem Paar Kopfhörer mit Geräuschunterdrückung, die Sie dazu auffordern können, Blockieren Sie alles außer der Person, der Sie zuhören möchten. Während Sie die Kopfhörer tragen, drücken Sie einen Knopf, während Sie die Person ansehen. Daraufhin wird die Stimme aus dieser bestimmten Richtung abgetastet. Mit dieser Information wird eine Engine zur akustischen Ausgrenzung betrieben, die Hintergrundgeräusche und andere Stimmen herausfiltert.

Die Forscher unter der Leitung von Gollakota und mehreren Doktoranden nennen das System Target Speech Hearing und stellten es letzte Woche auf einer Konferenz in Honolulu vor. Es ist sowohl als Hilfsmittel zur Barrierefreiheit als auch als Alltagsoption nützlich und man kann sich vorstellen, dass sich eines der großen Technologieunternehmen dieses Feature für die nächste Generation von High-End-Kopfhörern abschaut.

Chemiker an der EPFL sind es offensichtlich leid, 18 Aufgaben zu erledigen, denn sie haben ein Modell namens ChemCrow trainiert, das diese Aufgaben übernimmt. Nicht echte Aufgaben wie Titrieren und Pipettieren, sondern Planungsarbeiten wie das Durchforsten von Literatur und das Planen von Reaktionsketten. ChemCrow erledigt natürlich nicht alles für die Forscher, sondern fungiert eher als natürliche Sprachschnittstelle für das gesamte Set und verwendet je nach Bedarf die Such- oder Berechnungsoption.

Bildnachweise: EPFL

Der Hauptautor des Artikels, in dem ChemCrow vorgestellt wird, sagte, es sei „analog zu einem menschlichen Experten mit Zugriff auf einen Taschenrechner und Datenbanken“, also einem Doktoranden, der also hoffentlich an etwas Wichtigerem arbeiten oder die langweiligen Teile überspringen kann. Erinnert mich ein bisschen an Coscientist. Was den Namen angeht, so ist er „weil Krähen dafür bekannt sind, gut mit Werkzeugen umgehen zu können“. Gut genug!

Die Robotiker von Disney Research arbeiten hart daran, die Bewegungen ihrer Kreationen realistischer zu gestalten, ohne jede Bewegungsmöglichkeit manuell animieren zu müssen. Ein neues Papier, das sie im Juli bei SIGGRAPH präsentieren werden, zeigt eine Kombination aus prozedural generierter Animation und einer Künstlerschnittstelle zum Optimieren dieser Animationen. All dies funktioniert an einem echten zweibeinigen Roboter (einem Groot).

Die Idee ist, dass der Künstler eine Fortbewegungsart kreieren kann – federnd, steif, instabil – und die Ingenieure müssen nicht jedes Detail umsetzen, sondern nur sicherstellen, dass es innerhalb bestimmter Parameter liegt. Die Bewegung kann dann spontan ausgeführt werden, wobei das vorgeschlagene System die genauen Bewegungen improvisiert. Man kann damit rechnen, dies in ein paar Jahren in Disney World zu sehen …

tch-1-tech