Siri und Google Assistant setzen auf generative KI, um neues Leben einzuhauchen

Von der Keynote der WWDC 2024 nächste Woche hängt viel ab. Die Bedeutung der Präsentation ist weit höher als die üblichen Marktbewegungen nach der Veranstaltung. Der Druck auf Tim Cook und sein Team, die Ware abzuliefern, ist im wahrsten Sinne des Wortes sogar noch höher als im Vorfeld der Vision Pro-Ankündigung im letzten Jahr.

Am Montag wird Apple seine KI-Pläne vorstellen. Das Thema schwebt seit einigen Jahren wie ein großes Fragezeichen über Cupertino, da Konkurrenten wie Google und Microsoft generative KI angenommen haben. Es besteht ein breiter Branchenkonsens darüber, dass Systeme, die auf großen Sprachmodellen wie ChatGPT und Gemini basieren, die Art und Weise, wie wir mit unseren Geräten interagieren, tiefgreifend beeinflussen werden.

Apple wird voraussichtlich eine Partnerschaft mit OpenAI bekannt geben, die die Intelligenz des Unternehmens auf das iPhone und den Mac bringen wird. Apples kurzfristige Strategie ist eine tiefe Integration zwischen bestehenden Eigenschaften und generativer KI, mit Siri im Mittelpunkt. Seit seinem Debüt im Jahr 2011 hat Apple darauf gedrängt, den Sprachassistenten zu einem integralen Bestandteil aller seiner Betriebssysteme zu machen.

In den vergangenen 13 Jahren hat Siri jedoch nicht die Revolution erreicht, die Apple versprochen hatte. Dafür gibt es viele Gründe, der wichtigste ist jedoch die Leistungsfähigkeit. Das Konzept eines künstlichen Sprachassistenten existierte Jahrzehnte vor Siri, aber niemand hat es aus gutem Grund vollständig geknackt. Da Telefonhersteller und App-Entwickler Smartphones in Alleskönner verwandelt haben, sind die Aufgaben dieser Assistenten immer komplexer geworden.

So beeindruckend wie die Das Stanford Research Institute Die Arbeit war, die Technologie für ein reibungsloses Erlebnis war einfach noch nicht bereit. Siri-Mitbegründer Norman Winarsky befasste sich mit der zugrunde liegendes Problem im Jahr 2018 und stellte fest, dass Apples ursprünglicher Plan ein weitaus eingeschränkterer Assistent war, der Dinge wie Unterhaltung und Reisen abdeckte. „Das sind schwierige Probleme, und wenn man ein Unternehmen ist, das mit bis zu einer Milliarde Menschen zu tun hat, werden die Probleme noch schwieriger“, bemerkte Winarsky damals. „Sie suchen wahrscheinlich nach einem Grad an Perfektion, den sie nicht erreichen können.“

Auch die generative KI ist noch nicht so perfekt – zumindest noch nicht. Halluzinationen sind immer noch ein Problem. Genau deshalb fühlt es sich auch nach dem großen Rummel der letzten Jahre noch so an, als wären wir noch in der Babyphase. Wenn überhaupt, würde ich sagen, dass Google zum Beispiel an manchen Stellen zu aggressiv vorgegangen ist. Das beste Beispiel dafür ist die Entscheidung des Unternehmens, Gemini-Ergebnisse ganz oben bei den Suchergebnissen anzuzeigen.

Wenn etwas in der weltweit dominierenden Suchmaschine gegenüber vertrauenswürdigen Ressourcen priorisiert wird, muss es die Dinge so richtig wie irgend möglich machen und nicht, wissen Sie, den Leuten sagen, sie sollen Kleber essen. Google bezeichnet die Gemini-Ergebnisse als ein Produkt seiner „Search Labs“, aber den meisten Nutzern ist sicherlich nicht klar, was das im Hinblick auf die Produktreife bedeutet, und sie haben auch keine Lust, für weitere Informationen weiterzuklicken.

In den letzten Jahren habe ich mehrere Forscher getroffen, die den Begriff „Magie“ verwendet haben, um die Ergebnisse der „Black Box“ rund um große Sprachmodelle zu beschreiben. Das soll keine Kritik an der erstaunlichen Arbeit sein, die in diesem Bereich geleistet wird, sondern vielmehr die Erkenntnis, dass es noch so viel gibt, was wir über die Technologie nicht wissen.

Arthur C. Clarke drückte es am besten aus: „Jede hinreichend fortschrittliche Technologie ist von Magie nicht zu unterscheiden.“

In einem Punkt ist Google jedoch gezielter vorgegangen: bei der Integration von Gemini in Android. Anstatt Assistant komplett zu ersetzen, hat Google seine generative KI-Plattform in verschiedene Anwendungen integriert. Benutzer können Gemini auch zu ihrer Standardeinstellung machen, indem sie es der Assistant-Taste auf Pixel-Geräten zuweisen. Diese Implementierung erfordert zumindest bisher bewusstes Handeln seitens des Benutzers.

Obwohl Gemini Android noch nicht vollständig erobert hat, deutet Google deutlich an, dass es in nicht allzu ferner Zukunft Assistant vollständig ersetzen wird. Ich habe letzten Monat bei I/O schon fast mit einer Ankündigung in dieser Richtung gerechnet, bin aber froh, dass man sich letztendlich dafür entschieden hat, Gemini mehr Zeit zum Reifen zu geben.

Ob der Name „Assistant“ erhalten bleibt, ist letztlich eine Markenentscheidung. Apple seinerseits hängt sehr stark am Namen Siri. Schließlich hat das Unternehmen mehr als ein Jahrzehnt damit verbracht, das Produkt den Verbrauchern schmackhaft zu machen. Früher oder später wird jedoch die generative KI den Markt der intelligenten Assistenten erobern.

Sprachassistenten erleben im Allgemeinen einen existenziellen Moment. Intelligente Lautsprecher sind ein breiterer Indikator für Plattformen wie Siri, Alexa und Google Assistant. Die Lieferungen sind zurückgegangennachdem sie während der Pandemie heiß gelaufen ist. Es ist unfair, die Kategorie als zum Scheitern verurteilt zu bezeichnen, aber auf lange Sicht wird sie es sein, wenn sie nicht den richtigen Anschub bekommt.

Generative KI ist als logischer Nachfolger vorgesehen, doch die erste Runde der auf diesen Modellen basierenden Hardwaregeräte, darunter Humane Ai Pin und Rabbit R1, zeigt nur, wie weit diese Kategorie noch gehen muss, bevor sie für den Mainstream-Benutzer als durchgängiges Erlebnis angesehen werden kann.

Am Montag wird Apple endlich seine Karten auf den Tisch legen. Während Gerüchte darauf hindeuten, dass das Unternehmen nach dem Zusammenbruch seiner Elektroautos eine Reihe von Mitarbeitern in den Bereich generative KI versetzt, deuten alle Anzeichen darauf hin, dass Apple der Konkurrenz einen deutlichen Vorsprung abgetreten hat. Daher ist eine Partnerschaft mit einem amtierenden Kraftpaket wie OpenAI der logischste Schachzug.

Kurz nachdem die Siri-Übernahme bekannt gegeben wurde, wurde Steve Jobs gefragt, ob das Unternehmen versuche, Google mit seinen eigenen Waffen zu schlagen. „Es ist ein KI-Unternehmen“, bemerkte Jobs. „Wir steigen nicht in das Suchgeschäft ein. Das interessiert uns nicht. Andere Leute machen das gut.“

Der Ansatz des Unternehmens zur generativen KI befindet sich derzeit an derselben Stelle. Zum jetzigen Zeitpunkt kann Apple OpenAI nicht mit seinen eigenen Waffen schlagen, also geht es stattdessen eine Partnerschaft mit dem Unternehmen ein. Aber selbst die besten der aktuellen Modelle haben noch einen weiten Weg vor sich, bevor sie bereit sind, die aktuelle Generation intelligenter Assistenten vollständig zu ersetzen.

tch-1-tech