Über 100.000 YouTube-Videos wurden verwendet, um KI zu trainieren

Was haben MrBeast, John Oliver und das Wall Street Journal gemeinsam? Die Transkripte ihrer YouTube-Videos wurden verwendet, um die KI zu trainieren, die von Unternehmen wie Anthropic, Nvidia, Apple und Salesforce verwendet wird.

Eine Untersuchung von Wired und Proof News ergab, dass dieser Datensatz mit dem Namen „YouTube Subtitles“ Transkripte von mehr als 173.000 YouTube-Videos auf über 48.000 verschiedenen Kanälen enthält.

Dieses KI-Scraping ist ein Problem in der gesamten Technologiebranche. Die Künstlerin und Gründerin der App Cara, Jingna Zhang, hat versucht, Künstler zu schützen, indem sie eine soziale Plattform aufgebaut hat, die sie nicht verkauft. Und die University of Chicago arbeitet an Nightshade, einem Programm, das ein Bild „vergiften“ kann, um zu begrenzen, was eine KI daraus herauslesen kann.

Aber können sich Entwickler wirklich davor schützen, als nächstes dran zu sein? Mehr dazu in der Tech Minute.

tch-1-tech