Hallo Leute, willkommen zum regelmäßigen KI-Newsletter von Tech. Wenn Sie dies jeden Mittwoch in Ihrem Posteingang haben möchten, melden Sie sich hier an.
Diese Woche ist das Tech-Team (einschließlich Ihnen) auf der jährlichen Disrupt-Konferenz von TC in San Francisco. Wir haben eine große Auswahl an Rednern aus der KI-Branche, der Wissenschaft und der Politik, daher dachte ich, ich würde anstelle meines üblichen Kommentars einen Blick auf einige der großartigen Inhalte werfen, die Ihnen bevorstehen.
Mein Kollege Devin Coldewey wird den CEO von Perplexity, Aravind Srinivas, auf der Bühne interviewen. Die KI-gestützte Suchmaschine ist auf dem Vormarsch und erreichte kürzlich 100 Millionen Suchanfragen pro Woche – sie wird aber auch von Dow Jones von News Corp wegen etwas verklagt, das der Verlag als „Content-Kleptokratie“ bezeichnet.
Kirsten Korosec, Transportredakteurin bei TC, wird sich bei einem Kaminfeuer mit Zoox-Mitbegründer und CTO Jesse Levinson unterhalten. Levinson, der seit einem Jahrzehnt mitten in der autonomen Fahrzeugtechnologie tätig ist, bereitet das zu Amazon gehörende Robotaxi-Unternehmen nun auf sein nächstes großes Abenteuer vor – und wir werden darüber berichten.
Wir werden auch ein Panel darüber veranstalten, wie KI das Internet mit Desinformation überschwemmt – mit Pamela San Martin, Mitglied des Meta Oversight Board, Imran Ahmed, CEO des Center for Countering Digital Hate, und Brandie Nonnecke, Gründerin des CITRIS Policy Lab der UC Berkeley. Das Trio wird diskutieren, wie generative KI-Tools mit zunehmender Verbreitung von einer Reihe von Akteuren, darunter auch staatlichen Akteuren, missbraucht werden, um Deepfakes zu erstellen und Desinformation zu verbreiten.
Und wir hören von Jingna Zhang, CEO von Cara, Sarah Myers West, Co-Geschäftsführerin des AI Now Institute, und Aleksandra Pedraszewska von ElevenLabs über die rechtlichen und ethischen Minenfelder der KI. Der kometenhafte Aufstieg der KI hat neue ethische Dilemmata geschaffen und alte verschärft, während die Klagen nach links und rechts fallen. Dies bedroht sowohl neue als auch etablierte KI-Unternehmen sowie die Schöpfer und Arbeiter, deren Arbeit die Modelle speist. Das Panel wird sich mit all dem befassen – und noch mehr.
Das ist nur ein kleiner Auszug dessen, was diese Woche auf dem Programm steht. Erwarten Sie Auftritte von KI-Experten wie Elizabeth Kelly, Direktorin des US AI Safety Institute, Scott Wiener, Senator von Kalifornien, Jessica Newman, Co-Direktorin des Berkeley AI Policy Hub, Amit Jain, CEO von Luma AI, Mikey Shulman, CEO von Suno, und Kakul Srivastava, CEO von Splice.
Nachricht
Apple Intelligence startet: Durch ein kostenloses Software-Update können iPhone-, iPad- und Mac-Benutzer auf die ersten KI-gestützten Apple Intelligence-Funktionen von Apple zugreifen.
Bret Taylors Startup sammelt neues Geld: Sierra, das vom OpenAI-Vorsitzenden Bret Taylor mitbegründete KI-Startup, hat in einer Finanzierungsrunde 175 Millionen US-Dollar gesammelt, die das Startup mit 4,5 Milliarden US-Dollar bewertet.
Google erweitert KI-Übersichten: Die KI-Übersichten der Google-Suche, die oben auf der Ergebnisseite eine Momentaufnahme der Informationen anzeigen, werden in mehr als 100 Ländern und Gebieten eingeführt.
Generative KI und Elektroschrott: Die immensen und schnell fortschreitenden Rechenanforderungen von KI-Modellen könnten dazu führen, dass die Industrie bis 2030 das Elektroschrottäquivalent von mehr als 10 Milliarden iPhones pro Jahr entsorgt, prognostizieren Forscher.
Open Source, jetzt definiert: Die Open Source Initiative, eine langjährige Institution mit dem Ziel, alles rund um Open Source zu definieren und zu „verwalten“, hat diese Woche Version 1.0 ihrer Definition von Open Source KI veröffentlicht.
Meta veröffentlicht seinen eigenen Podcast-Generator: Meta hat eine „offene“ Implementierung der viralen Funktion zum Generieren eines Podcasts in Googles NotebookLM veröffentlicht.
Forschungspapier der Woche
Google sagt Es lehrte ein Modell, Fotos von Handschriften in „digitale Tinte“ umzuwandeln.
Das Modell InkSight wurde darauf trainiert, geschriebene Wörter auf einer Seite zu erkennen und Striche auszugeben, die in etwa einer Handschrift ähneln. Das Ziel, sagen die Google-Forscher hinter dem Projekt, bestand darin, „die Flugbahndetails der Handschrift auf Strichebene zu erfassen“, damit ein Benutzer die resultierenden Striche in der Notiz-App seiner Wahl speichern kann.
InkSight ist nicht perfekt. Google stellt fest, dass es Fehler macht. Das Unternehmen behauptet jedoch auch, dass das Modell in einer Reihe von Szenarien, einschließlich schwierigen Lichtverhältnissen, eine gute Leistung erbringt.
Hoffen wir, dass damit keine Unterschriften gefälscht werden.
Modell der Woche
Cohere for AI, das gemeinnützige Forschungslabor des KI-Startups Cohere, hat eine neue Familie textgenerierender Modelle namens Aya Expanse veröffentlicht. Die Modelle können Texte in 23 verschiedenen Sprachen schreiben und verstehen, und Cohere behauptet, dass sie bei bestimmten Benchmarks Modelle, darunter Metas Llama 3.1 70B, übertreffen.
Laut Cohere war eine Technik namens „Datenarbitrage“ der Schlüssel zum Training von Aya Expanse. Inspiriert durch die Art und Weise, wie Menschen lernen, indem sie sich für einzigartige Fähigkeiten an verschiedene Lehrer wenden, wählte Cohere besonders leistungsfähige mehrsprachige „Lehrer“-Modelle aus, um synthetische Trainingsdaten für Aya Expanse zu generieren.
Synthetische Daten haben ihre Probleme. Einige Studien deuten darauf hin, dass eine übermäßige Abhängigkeit davon zu Modellen führen kann, deren Qualität und Vielfalt zunehmend schlechter werden. Cohere sagt jedoch, dass Datenarbitrage dies wirksam abmildert. Wir werden bald sehen, ob die Behauptung einer Prüfung standhält.
Wundertüte
Der Advanced Voice Mode von OpenAI, die realistisch klingende Sprachfunktion des Unternehmens für ChatGPT, ist jetzt kostenlos in der mobilen ChatGPT-App für Benutzer in der EU, der Schweiz, Island und Norwegen sowie in Liechtenstein verfügbar. Bisher mussten Benutzer in diesen Regionen ChatGPT Plus abonnieren, um den erweiterten Sprachmodus nutzen zu können.
A jüngste In einem Artikel in der New York Times wurden die Vor- und Nachteile des erweiterten Sprachmodus hervorgehoben, beispielsweise die Abhängigkeit von Tropen und Stereotypen, wenn versucht wird, so zu kommunizieren, wie es die Benutzer wünschen. Der erweiterte Sprachmodus ist bei TikTok wegen seiner unheimlichen Fähigkeit, Stimmen und Akzente nachzuahmen, in die Luft geflogen. Einige Experten warnen jedoch davor, dass dies zu einer emotionalen Abhängigkeit von einem System führen könnte, das weder Intelligenz noch Empathie besitzt.