Diese Woche in der KI: OpenAIs neues Strawberry-Modell ist zwar intelligent, aber träge

Hallo Leute, willkommen zum regelmäßigen KI-Newsletter von Tech. Wenn Sie ihn jeden Mittwoch in Ihrem Posteingang haben möchten, melden Sie sich hier an.

Wenn man einem Artikel in The Information Glauben schenken darf, steht in dieser Woche im Bereich KI die nächste große Produktankündigung von OpenAI unmittelbar bevor.

Die Informationen gemeldet am Dienstag, dass OpenAI plant, in den nächsten zwei Wochen Strawberry zu veröffentlichen, ein KI-Modell, das sich selbst effektiv auf Fakten überprüfen kann. Strawberry wird ein eigenständiges Produkt sein, aber in ChatGPT, die KI-gestützte Chatbot-Plattform von OpenAI, integriert sein.

Berichten zufolge ist Strawberry bei Programmier- und Mathematikproblemen besser als andere hochkarätige generative KI-Modelle (einschließlich OpenAIs eigenem GPT-4o). Und es vermeidet einige der Denkfallen, die diese Modelle normalerweise zum Stolpern bringen. Aber die Verbesserungen haben ihren Preis: Strawberry soll langsam sein – ziemlich langsam. Quellen berichten The Information, dass das Modell 10 bis 20 Sekunden braucht, um eine einzige Frage zu beantworten.

Zugegeben, OpenAI wird Strawberry wahrscheinlich als Modell für unternehmenskritische Aufgaben positionieren, bei denen Genauigkeit von größter Bedeutung ist. Dies könnte bei Unternehmen Anklang finden, von denen viele von den Einschränkungen der heutigen generativen KI-Technologie frustriert sind. Umfrage Diese Woche fand der HR-Spezialist Peninsula heraus, dass Ungenauigkeiten ein Hauptanliegen für 41 % der Unternehmen sind, die generative KI erforschen, und Gartner sagt voraus dass ein Drittel aller Projekte zur generativen KI bis zum Jahresende aufgrund von Hindernissen bei der Einführung aufgegeben werden.

Während einige Unternehmen die Verzögerung beim Chatbot vielleicht nicht stört, denke ich, dass es dem Durchschnittsmenschen nicht egal sein wird.

Abgesehen von halluzinatorischen Tendenzen sind die heutigen Modelle schnell – unglaublich schnell. Wir haben uns daran gewöhnt; die Geschwindigkeit macht Interaktionen sich natürlicher anfühlentatsächlich. Wenn Strawberrys „Verarbeitungszeit“ tatsächlich um eine Größenordnung länger ist als die bestehender Modelle, wird es schwierig sein, den Eindruck zu vermeiden, dass Strawberry in irgendeiner Hinsicht ein Rückschritt ist.

Das setzt das beste Szenario voraus: dass Strawberry die Fragen durchgängig richtig beantwortet. Wenn es immer noch fehleranfällig ist, wie die Berichterstattung vermuten lässt, werden die langen Wartezeiten noch schwerer zu verkraften sein.

OpenAI steht zweifellos unter Druck, Ergebnisse zu liefern, während es Milliarden in KI-Schulungen und Personalanstrengungen steckt. Seine Investoren und potenziellen neuen Geldgeber hoffen, dass sie eher früher als später eine Rendite sehen, so kann man sich vorstellen. Aber es ist ein Fehler, ein unausgereiftes Modell wie Strawberry herauszubringen – und zu überlegen, eine Gebühr zu verlangen. wesentlich mehr dafür – scheint nicht ratsam.

Ich denke, es wäre klüger, die Technologie ein wenig reifen zu lassen. Da das Rennen um generative KI immer härter wird, kann sich OpenAI diesen Luxus vielleicht nicht leisten.

Nachricht

Apple führt visuelle Suche ein: Die Kamerasteuerung, die neue Taste auf dem iPhone 16 und 16 Plus, kann das starten, was Apple „visuelle Intelligenz“ nennt – im Grunde eine umgekehrte Bildsuche kombiniert mit einer gewissen Texterkennung. Das Unternehmen arbeitet mit Drittanbietern, darunter Google, zusammen, um Suchergebnisse zu ermöglichen.

Apple gibt KI auf: Devin schreibt darüber, dass viele der generativen KI-Funktionen von Apple im Grunde ziemlich simpel sind – ganz im Gegensatz zu dem, was das bombastische Marketing des Unternehmens glauben machen möchte.

Audible trainiert KI für Hörbücher: Audible, Amazons Hörbuch-Geschäft, sagte, es werde KI einsetzen, die auf Stimmen professioneller Sprecher trainiert wurde, um neue Hörbuchaufnahmen zu erstellen. Sprecher werden für alle Hörbücher, die mit ihren KI-Stimmen erstellt werden, Titel für Titel vergütet, wobei die Lizenzgebühren geteilt werden.

Musk bestreitet Tesla-xAI-Deal: Elon Musk wehrte sich gegen eine Bericht des Wall Street Journal dass eines seiner Unternehmen, Tesla, über eine Umsatzbeteiligung mit einem anderen seiner Unternehmen, xAI, gesprochen hat, um die generativen KI-Modelle des letzteren nutzen zu können.

Bing erhält Tools zum Beseitigen von Deepfake-Geheimnissen: Microsoft kooperiert nach eigenen Angaben mit StoppNCII – eine Organisation, die es Opfern von Rachepornos ermöglicht, einen digitalen Fingerabdruck expliziter Bilder zu erstellen, egal ob echt oder nicht – um dabei zu helfen, nicht einvernehmliche Pornografie aus den Bing-Suchergebnissen zu entfernen.

Googles „Frag Fotos“ startet: Googles KI-gestützte Suchfunktion Ask Photos wurde Ende letzter Woche für ausgewählte Google Photos-Nutzer in den USA eingeführt. Mit Ask Photos können Sie komplexe Anfragen stellen, wie etwa „Zeigen Sie das beste Foto aus jedem der Nationalparks, die ich besucht habe“, „Was haben wir das letzte Mal in diesem Restaurant bestellt?“ und „Wo haben wir letzten August gezeltet?“

USA und EU unterzeichnen KI-Vertrag: Bei einem Gipfeltreffen in der vergangenen Woche unterzeichneten die USA, Großbritannien und die EU einen Vertrag zur KI-Sicherheit, der vom Europarat (COE), einer internationalen Organisation für Standards und Menschenrechte, ausgearbeitet wurde. Der COE beschreibt den Vertrag als „den ersten internationalen rechtsverbindlichen Vertrag, der sicherstellen soll, dass der Einsatz von KI-Systemen vollständig mit den Menschenrechten, der Demokratie und der Rechtsstaatlichkeit vereinbar ist.“

Forschungspapier der Woche

Jeder biologische Prozess hängt von Interaktionen zwischen Proteinen ab, die entstehen, wenn Proteine ​​sich aneinander binden. „Bindeproteine“ – Proteine, die sich an bestimmte Zielmoleküle binden – finden Anwendung in der Arzneimittelentwicklung, der Krankheitsdiagnose und mehr.

Doch die Herstellung von Bindeproteinen ist oft ein mühsames und kostspieliges Unterfangen – und birgt das Risiko des Scheiterns.

Auf der Suche nach einer KI-gestützten Lösung entwickelte Googles KI-Labor DeepMind AlphaProteoein Modell, das vorhersagt, welche Proteine ​​an Zielmoleküle binden. Anhand einiger Parameter kann AlphaProteo ein Kandidatenprotein ausgeben, das an einer angegebenen Bindungsstelle an ein Molekül bindet.

In Tests mit sieben Zielmolekülen erzeugte AlphaProteo Proteinbinder mit einer 3- bis 300-fach besseren „Bindungsaffinität“ (also Molekülbindungsstärke) als mit früheren Methoden zur Bindungsfindung. Darüber hinaus war AlphaProteo das erste Modell, das erfolgreich einen Binder für ein Protein entwickelte, das mit Krebs und Komplikationen infolge von Diabetes (VEGF-A) in Zusammenhang steht.

DeepMind räumt jedoch ein, dass AlphaProteo beim achten Testversuch fehlschlug – und dass eine starke Bindung normalerweise nur der erste Schritt bei der Schaffung von Proteinen ist, die für praktische Anwendungen nützlich sein könnten.

Modell der Woche

Es gibt ein neues, äußerst leistungsfähiges Modell generativer KI – und jeder kann es herunterladen, optimieren und ausführen.

Das Allen Institute for AI (AI2) entwickelte zusammen mit dem Startup Contextual AI ein textgenerierendes englischsprachiges Modell namens OLMoEdas über eine 7-Milliarden-Parameter-Mixtur-of-Experts-Architektur (MoE) verfügt. („Parameter“ entsprechen in etwa den Problemlösungsfähigkeiten eines Modells, und Modelle mit mehr Parametern schneiden im Allgemeinen – aber nicht immer – besser ab als Modelle mit weniger Parametern.)

MoEs zerlegen Datenverarbeitungsaufgaben in Unteraufgaben und delegieren sie dann an kleinere, spezialisierte „Experten“-Modelle. Sie sind nicht neu. Was OLMoE jedoch bemerkenswert macht – abgesehen von der Tatsache, dass es eine offene Lizenz hat – ist die Tatsache, dass es bei einer Reihe von Anwendungen und Benchmarks viele Modelle seiner Klasse übertrifft, darunter Metas Llama 2, Googles Gemma 2 und Mistrals Mistral 7B.

Mehrere Varianten von OLMoE sowie die Daten und der Code, die zu ihrer Erstellung verwendet wurden, sind auf GitHub verfügbar.

Wundertüte

Diese Woche war Apple-Woche. Das Unternehmen veranstaltete am Montag eine Veranstaltung, bei der es neue iPhones, Apple Watch-Modelle und Apps ankündigte. Hier ist eine Zusammenfassung für den Fall, dass Sie nicht dabei sein konnten.

Apple Intelligence, Apples Suite von KI-gestützten Diensten, wurde erwartungsgemäß im Fernsehen gezeigt. Apple bekräftigte, dass ChatGPT auf mehrere wichtige Arten in das Erlebnis integriert werden würde. Aber seltsamerweise gab es keine Erwähnung von KI-Partnerschaften über den zuvor angekündigten OpenAI-Deal hinaus – obwohl Apple solche Partnerschaften Anfang des Sommers leicht angedeutet hatte.

Im Juni bestätigte SVP Craig Federighi auf der WWDC 2024 Apples Pläne, künftig mit weiteren Drittanbietermodellen zu arbeiten, darunter Googles Gemini. „Im Moment gibt es nichts anzukündigen“, sagte er, „aber das ist unsere allgemeine Richtung.“

Seitdem herrscht Funkstille.

Vielleicht dauert es länger als erwartet, den notwendigen Papierkram zu erledigen – oder es gab einen technischen Rückschlag. Oder vielleicht ist Apples mögliche Investition in OpenAI einigen Modellpartnern nicht geheuer.

Wie dem auch sei, es scheint, dass ChatGPT in absehbarer Zukunft das einzige Drittanbietermodell in Apple Intelligence sein wird. Tut mir leid, Gemini-Fans.

tch-1-tech