Diese Woche in der KI: Generative KI überflutet akademische Zeitschriften mit Spam

Diese Woche in der KI Generative KI ueberflutet akademische Zeitschriften

Hallo Leute und willkommen beim regelmäßigen KI-Newsletter von Tech.

In dieser Woche im Bereich KI beginnt die generative KI damit, akademische Veröffentlichungen mit Spam zu überfluten – eine entmutigende neue Entwicklung an der Desinformationsfront.

In einem Beitrag auf Retraction Watcheinem Blog, das die jüngsten Rücknahmen akademischer Studien verfolgt, schrieben die Assistenzprofessoren für Philosophie Tomasz Żuradzk und Leszek Wroński über drei von Addleton Academic Publishers veröffentlichte Zeitschriften, die offenbar vollständig aus KI-generierten Artikeln bestehen.

Die Artikel der Zeitschriften folgen demselben Muster und sind vollgestopft mit Schlagwörtern wie „Blockchain“, „Metaverse“, „Internet der Dinge“ und „Deep Learning“. Sie führen dieselbe Redaktion auf – von der zehn Mitglieder bereits verstorben sind – und eine unscheinbare Adresse in Queens, New York, die wie ein Haus aussieht.

„Wo liegt also das Problem?“, fragen Sie sich vielleicht. Ist das Durchstöbern von KI-generierten Spam-Inhalten nicht einfach der Preis für Geschäfte im Internet heutzutage?

Nun ja. Aber die gefälschten Zeitschriften zeigen, wie einfach es ist, die Systeme zu manipulieren, mit denen Forscher bei Beförderungen und Einstellungen bewertet werden – und das könnte ein Vorbote für Wissensarbeiter in anderen Branchen sein.

Auf mindestens einem weit verbreiteten Bewertungssystem, CiteScore, rangieren die Zeitschriften in den Top 10 für philosophische Forschung. Wie ist das möglich? Sie zitieren sich gegenseitig in großem Umfang. (CiteScore berücksichtigt Zitate in seinen Berechnungen.) Żuradzk und Wroński stellen fest, dass von 541 Zitaten in einer von Addletons Zeitschriften 208 aus anderen gefälschten Veröffentlichungen des Verlegers stammen.

„[These rankings] „Sie dienen Universitäten und Fördereinrichtungen häufig als Indikatoren für die Qualität der Forschung“, schreiben Żuradzk und Wroński. „Sie spielen eine entscheidende Rolle bei Entscheidungen über akademische Auszeichnungen, Einstellungen und Beförderungen und können daher die Publikationsstrategien von Forschern beeinflussen.“

Man könnte argumentieren, dass CiteScore das Problem ist – es handelt sich eindeutig um ein fehlerhaftes Maß. Und das ist kein falsches Argument. Aber es ist auch nicht falsch zu sagen, dass generative KI und ihr Missbrauch Systeme stören, von denen der Lebensunterhalt der Menschen auf unerwartete – und möglicherweise ziemlich schädliche – Weise abhängt.

Es gibt eine Zukunft, in der generative KI uns dazu bringt, Systeme wie CiteScore zu überdenken und neu zu gestalten, damit sie gerechter, ganzheitlicher und integrativer werden. Die düsterere Alternative – und die, die sich jetzt abspielt – ist eine Zukunft, in der generative KI weiterhin Amok läuft, Chaos anrichtet und Berufsleben ruiniert.

Ich hoffe wirklich, dass wir bald den Kurs korrigieren.

Nachricht

Der Soundtrack-Generator von DeepMind: DeepMind, Googles KI-Forschungslabor, entwickelt nach eigenen Angaben KI-Technologie zur Generierung von Soundtracks für Videos. Die KI von DeepMind nimmt die Beschreibung eines Soundtracks (z. B. „pulsierende Quallen unter Wasser, Meereslebewesen, Ozean“) und kombiniert sie mit einem Video, um Musik, Soundeffekte und sogar Dialoge zu erstellen, die zu den Figuren und dem Ton des Videos passen.

Ein Roboter-Chauffeur: Forscher an der Universität Tokio haben einen „muskuloskelettalen Humanoiden“ namens Musashi entwickelt und trainiert, um ein kleines Elektroauto durch eine Teststrecke zu fahren. Ausgestattet mit zwei Kameras, die menschliche Augen ersetzen, kann Musashi die Straße vor ihm „sehen“ sowie die in den Seitenspiegeln des Autos reflektierten Ansichten.

Eine neue KI-Suchmaschine: Genspark, eine neue KI-gestützte Suchplattform, nutzt generative KI, um benutzerdefinierte Zusammenfassungen als Antwort auf Suchanfragen zu schreiben. Bisher hat das Unternehmen 60 Millionen US-Dollar von Investoren, darunter Lanchi Ventures, eingesammelt. In der letzten Finanzierungsrunde wurde das Unternehmen nach der Finanzierung mit 260 Millionen US-Dollar bewertet, eine respektable Zahl, da Genspark gegen Konkurrenten wie Perplexity antritt.

Wie viel kostet ChatGPT?: Wie viel kostet ChatGPT, die ständig wachsende KI-gestützte Chatbot-Plattform von OpenAI? Diese Frage ist schwieriger zu beantworten, als Sie vielleicht denken. Um den Überblick über die verschiedenen verfügbaren ChatGPT-Abonnementoptionen zu behalten, haben wir einen aktualisierten Leitfaden zu den ChatGPT-Preisen zusammengestellt.

Forschungspapier der Woche

Autonome Fahrzeuge sind je nach Standort und Situation mit einer endlosen Vielfalt an Grenzfällen konfrontiert. Wenn Sie auf einer zweispurigen Straße unterwegs sind und jemand den linken Blinker setzt, bedeutet das dann, dass er die Spur wechseln wird? Oder dass Sie ihn überholen sollten? Die Antwort hängt möglicherweise davon ab, ob Sie auf der I-5 oder der Autobahn unterwegs sind.

Eine Gruppe von Forschern von Nvidia, USC, UW und Stanford zeigt in einem gerade bei CVPR veröffentlichten Artikel, dass viele mehrdeutige oder ungewöhnliche Umstände dadurch gelöst werden können, dass man – man kann es kaum glauben – eine KI das örtliche Fahrerhandbuch lesen lässt.

Ihre Large Language Driving Assistant oder LLaDagibt LLM Zugriff auf das Fahrhandbuch eines Staates, Landes oder einer Region – nicht einmal Feinabstimmungen. Lokale Regeln, Gebräuche oder Beschilderungen sind in der Literatur zu finden, und wenn ein unerwarteter Umstand wie Hupen, Fernlicht oder eine Schafherde auftritt, wird eine entsprechende Aktion (rechts ranfahren, anhalten, abbiegen, zurückhupen) ausgelöst.

Bildnachweise: Nvidia

Es handelt sich keineswegs um ein vollständiges End-to-End-Fahrsystem, aber es zeigt einen alternativen Weg zu einem „universellen“ Fahrsystem, das immer noch Überraschungen bereithält. Und vielleicht auch eine Möglichkeit für den Rest von uns herauszufinden, warum wir angehupt werden, wenn wir unbekannte Gegenden besuchen.

Modell der Woche

Am Montag hat Runway, ein Unternehmen, das generative KI-Tools für die Erstellung von Film- und Bildinhalten entwickelt, enthüllt Gen-3 Alpha. Gen-3 wurde anhand einer großen Anzahl von Bildern und Videos aus öffentlichen und internen Quellen trainiert und kann aus Textbeschreibungen und Standbildern Videoclips generieren.

Laut Runway bietet Gen-3 Alpha eine „deutliche“ Verbesserung der Generierungsgeschwindigkeit und -treue gegenüber Runways vorherigem Flaggschiff-Videomodell Gen-2 sowie eine feinere Kontrolle über die Struktur, den Stil und die Bewegung der erstellten Videos. Gen-3 kann außerdem so angepasst werden, dass es „stilistisch kontrolliertere“ und konsistentere Charaktere ermöglicht, so Runway, und zielt auf „spezifische künstlerische und erzählerische Anforderungen“ ab.

Gen-3 Alpha hat seine Grenzen – darunter die Tatsache, dass die maximale Filmlänge 10 Sekunden beträgt. Runway-Mitbegründer Anastasis Germanidis verspricht jedoch, dass es nur das erste von mehreren Videogenerierungsmodellen einer Next-Gen-Modellfamilie ist, die auf Runways verbesserter Infrastruktur trainiert wird.

Gen-3 Alpha ist nur das neueste generative Videosystem von mehreren, die in den letzten Monaten auf den Markt gekommen sind. Andere sind Sora von OpenAI, Dream Machine von Luma und Veo von Google. Gemeinsam drohen sie, die Film- und Fernsehbranche, wie wir sie kennen, auf den Kopf zu stellen – vorausgesetzt, sie können Urheberrechtliche Herausforderungen.

Wundertüte

Ihre nächste Bestellung bei McDonald’s wird nicht von einer KI entgegengenommen.

McDonald’s diese Woche angekündigt dass die Fast-Food-Kette die automatisierte Bestellannahme-Technologie, die sie seit fast drei Jahren testet, aus mehr als 100 ihrer Restaurants entfernen wird. Die Technologie – gemeinsam mit IBM entwickelt und in den Drive-Ins der Restaurants installiert – machte im vergangenen Jahr Schlagzeilen, weil sie dazu neigt, Kunden falsch zu verstehen und Fehler zu machen.

Ein kürzlich Stück in Takeout deutet darauf hin, dass die KI bei Fast-Food-Betreibern im Allgemeinen an Einfluss verliert, die sich vor nicht allzu langer Zeit noch begeistert über die Technologie und ihr Potenzial zur Effizienzsteigerung (und Senkung der Arbeitskosten) geäußert haben. Presto, ein wichtiger Akteur im Bereich KI-gestützter Drive-Thru-Spuren, hat kürzlich einen wichtigen Kunden, Del Taco, verloren und steht vor steigenden Verlusten.

Das Problem ist Ungenauigkeit.

McDonald’s-CEO Chris Kempczinski erzählt CNBC berichtete im Juni 2021, dass seine Spracherkennungstechnologie in etwa 85 % der Fälle genau war, dass aber bei etwa einer von fünf Bestellungen menschliches Personal helfen musste. Die beste Version des Presto-Systems erledigt laut Takeout nur etwa 30 % der Bestellungen ohne die Hilfe eines Menschen.

Während KI also dezimierend In bestimmten Segmenten der Gig Economy scheint es, dass manche Jobs – insbesondere jene, die das Verständnis einer Vielzahl von Akzenten und Dialekten erfordern – nicht durch Automatisierung wegfallen können. Zumindest im Moment.

tch-1-tech