Ein paar Stunden Nach der großen Enthüllung heute Morgen öffnete Humane seine Türen für eine Handvoll Presse. Das Büro befindet sich in einem unscheinbaren Gebäude im Stadtteil SoMa in San Francisco und ist die Heimat der Hardware-Designteams des Startups.
In einem Büro nebenan sind die Produktingenieure von Humane untergebracht, während das Elektrotechnik-Team in einem dritten Raum direkt gegenüber arbeitet. Das Unternehmen betreibt auch ein Büro in New York, der Löwenanteil der 250 Mitarbeiter ist jedoch hier in San Francisco ansässig.
Heutzutage wird ein großer Teil des Raums von einer Reihe von Demo-Stationen eingenommen (mit einem strikten Filmverbot), an denen verschiedene Ai-Pins in verschiedenen Stadien unbekleidet ausgelegt sind, um ihre äußeren Machenschaften zu entlarven. Bevor sie jedoch an diesen teilnehmen, stehen die Mitbegründer von Humane vor einer kleinen Gruppe von Stühlen und flankieren einen Flachbildschirm, auf dem die Vision des Unternehmens dargelegt wird.
CEO Bethany Bongiorno gibt einen kurzen Überblick über die Geschichte des Unternehmens und beginnt damit, wie sie an ihrem ersten Tag bei Apple den Mitbegründer und Präsidenten Imran Chaudhri traf. Die gesamte Unternehmensgeschichte geht auf den früheren Arbeitgeber zurück. Dort haben sie CTO Patrick Gates abgeworben, zusammen mit etwa 90 weiteren ehemaligen Apple-Mitarbeitern.
Chaudhri seinerseits beschreibt die Geschichte des Unternehmens als eine von S-Kurven – 15-Jahres-Technologiezyklen, die die Grundlage für das bilden, was als nächstes kommt, und letztendlich den Weg für das bereiten, was als nächstes kommt. „Die letzte Ära hat ein Plateau erreicht“, erzählt er dem Raum und gibt an, dass das Smartphone „16 Jahre alt“ sei – obwohl auch dies ein augenzwinkernder Seitenhieb auf seine früheren Arbeitgeber zu sein scheint, deren erstes iPhone 2007 auf den Markt kam.
Er beschreibt Humanes erstes Produkt als „eine neue Denkweise, ein neues Gefühl für Möglichkeiten“. Es sei ein Versuch, „KI zu produzieren“, fügt er hinzu. Die persönliche Präsentation ist deutlich fundierter, als frühere Videos vermuten lassen. Es stimmt, dass die Aussagen immer noch großspurig und umfassend sind und das am Revers getragene Gerät als den nächsten Schritt auf einer Computerreise kontextualisieren, die mit raumgroßen Großrechnern begann, aber das Gespräch wird etwas pragmatischer, wenn das Gerät vor uns liegt.
Das Gerät in Streichholzschachtelgröße verfügt über einen Snapdragon-Prozessor und 32 GB lokalen Speicher. Bei der Kamera handelt es sich um einen 12-Megapixel-Sensor, der für ein Smartphone konzipiert, aber in das Humane-eigene Modul integriert ist. Es gibt einen Beschleunigungsmesser und ein Gyroskop sowie einen Tiefen- und Flugzeitsensor. Wie die Produkte von Apple wird es in Kalifornien entworfen und hauptsächlich in Asien hergestellt.
Der größte Teil des Äußeren des Geräts wird von einem Touchpanel eingenommen, auf dem sich die meisten Bordkomponenten befinden, sowie von einem Akku, der vier bis fünf Stunden lang aufgeladen werden soll. Darüber beherbergt eine Art Kameraleiste die oben genannten Sensoren sowie das Laserprojektionssystem – mit Abstand der visuell beeindruckendste Aspekt der ganzen Angelegenheit. Die Kameraleiste ist nach unten geneigt. Laut Humane haben sie den Stift an verschiedenen Körpertypen getestet und sich für ein Design entschieden, das für Benutzer mit größeren Brüsten geeignet ist.
Das Unternehmen teilte mir außerdem mit, dass es die Laserprojektion mit einem Spektrum verschiedener Hauttöne getestet habe, um sicherzustellen, dass sie sichtbar sei. Obwohl die Projektionen optisch fesselnd sind, werden sie als zweitrangiges Merkmal eines im Wesentlichen sprachorientierten Produkts betrachtet. Wenn Sie sich jedoch in einer Umgebung befinden, die zu laut oder zu leise ist, um den kleinen, nach oben gerichteten Lautsprecher an der Oberseite des Geräts unterzubringen, tippen Sie auf das Touchpad und die Kamera macht sich an die Arbeit und sucht nach einer Hand. Sobald es entdeckt wird, beginnt es zu projizieren.
Chaudhri demonstrierte die Funktion während eines TED-Talks im Mai. Ein oder zwei Minuten später ertönt ein inszenierter Anruf von Bongiorno, den die Stecknadel in Textform auf seine Handfläche projiziert. Von hier aus kann er mit der Handfläche den Anruf annehmen oder ablehnen, wobei das System die Bewegung erkennt und entsprechend reagiert.
Die Laser können jedoch weit mehr darstellen. Die zeigen Texte aus Nachrichten an, durch die Sie mit einer Pinch-Geste auf derselben Hand scrollen können. Sie können sogar eine rudimentäre Vorschau der von Ihnen aufgenommenen Bilder anzeigen, obwohl der grüne Laser die subtilen Feinheiten eines Fotos nicht optimal hervorhebt.
Der AI Pin hat ein gewisses Gewicht, was jedoch durch den im Lieferumfang enthaltenen „Batterie-Booster“ etwas ausgeglichen wird, wodurch die volle Batterielebensdauer etwa neun Stunden beträgt. Das Produkt wird außerdem mit einer eiförmigen Hülle geliefert, die dem Produkt eine weitere volle Ladung verleiht. Sie können entweder den Pin, den Booster oder beide hineinstecken und sie rasten magnetisch ein. Der Ladevorgang erfolgt über eine Reihe von Pins auf der Rückseite des Geräts. Ebenfalls im Lieferumfang enthalten ist ein Ladepad für den Heimgebrauch.
Bongiorno bestätigte frühere Berichte über eine erste Charge von 100.000 Einheiten. „Ich denke, wie bei jedem Hardware-Startup wollen wir sicherstellen, dass wir für alle Szenarien konservativ planen“, sagt sie. „Für uns ging es am Anfang wirklich darum, was im Hinblick auf die Nachfrage konservativ, richtig und verantwortungsvoll zu tun ist und uns eine Option einzuräumen, wenn unsere Nachfrage über 100.000 steigt.“
Sie fügt hinzu, dass sich bis gestern mehr als 110.000 Menschen für die Warteliste angemeldet hätten – wobei diese Zahl eher ein Zeichen von Neugier als von tatsächlichen Kaufplänen sei, da keine Anzahlung erforderlich sei. Die Liste ist ebenfalls global, wobei das Gerät nur in den USA vorbestellt werden kann, wo es irgendwann „Anfang nächsten Jahres“ in den Handel kommen wird. Die erste Wartelistengruppe erhält „vorrangigen Zugang“ zum Kauf des Produkts.
Das Herzstück des Geräts ist KI. Es gehört zu den ersten Hardwareprodukten, die auf der aktuellen Welle der Begeisterung für generative KI mitmachen, aber es wird sicherlich nicht das letzte sein. Der Name Sam Altman ist seit seiner Bekanntgabe eng mit dem Startup verbunden. Ich frage, wie eng Altman und OpenAI an der Entwicklung des Produkts beteiligt waren.
„Sam führte unsere Serie A im Jahr 2020 an. Imran war sich ganz klar darüber im Klaren, dass Sam das Ziel der Serie A war und er unbedingt dabei sein wollte“, sagt Bongiorno. „Ich denke, es gab großen gegenseitigen Respekt und große Begeisterung für das, was wir alle für die Zukunft im Computerbereich hielten. Er war ein unglaublicher Fürsprecher und Unterstützer von uns und greift jedes Mal zum Telefon, wenn wir Rat und Anleitung brauchen. Wir haben mit dem OpenAI-Team zusammengearbeitet. Unser Engineering-Team hat eng zusammengearbeitet.“
Laut Chaudhri ist GPT einer von vielen LLMs, die vom System genutzt werden. Er bestätigte außerdem, dass GPT-4 zu den Instanzen gehören wird, die das System nutzt. Letztendlich sind die genauen KI-Systeme, die für eine bestimmte Aufgabe eingesetzt werden, jedoch von Natur aus eher unklar. Auf sie wird von Fall zu Fall zugegriffen, basierend auf der Festlegung der angemessenen Vorgehensweise durch den Pin.
Dies gilt auch für webbasierte Abfragen. Das System durchsucht eine Vielzahl verschiedener Suchmaschinen und Ressourcen wie Wikipedia. Einige werden offizielle Content-Partner sein, andere nicht. Bisher sind die tatsächlichen Partner begrenzt. Es gibt OpenAI und Microsoft sowie Tidal, das als Standard-Musik-App des Systems dient. Ein Beispiel aus einer unserer Demos lautete „Spiele von Prince produzierte Musik“ und nicht das einfachere „Spiele Prince“.
„Ein Teil unserer KI ist proprietär. Wir bauen unsere eigenen KIs und nutzen dann Dinge wie GPT und Modelle von OpenAI“, sagt Bongiorno. „Wir können LLMs und viele Dienste anderer Leute hinzufügen, und unser Ziel ist es, die Plattform für alle zu sein und Zugang zu vielen verschiedenen KI-Erlebnissen und -Diensten zu ermöglichen, sodass das Geschäftsmodell so strukturiert ist, dass es uns ermöglicht.“ das zu tun. Und ich denke, wir werden über verschiedene Einnahmemodelle nachdenken, die wir auch hinzufügen können, sowie über verschiedene Einnahmequellen auf der Plattform.“
Das Ziel besteht darin, das Erlebnis nahtlos zu gestalten, sowohl im Hinblick auf die Vorgänge im Back-End mit LLMs als auch auf Websuchen und -aktualisierungen. Das System ist so konzipiert, dass es im Hintergrund kontinuierlich Aktualisierungen durchführt und neue Funktionen hinzufügt. Mithilfe des integrierten GPS werden auch zusätzlicher Kontext verwendet, einschließlich kürzlich gestellter Fragen und des Standorts.
Auch Fotos sind ein großer Teil des Puzzles. Die Bordkamera verfügt über einen Ultraweitwinkel mit einem Sichtfeld von 120 Grad. Es gibt keinen Autofokus, sondern eine feste Brennweite. Zumindest im Licht der SF-Büros sahen die Fotos solide aus. Es gibt einen guten Teil der Computerfotografie, die außerhalb von Geräten durchgeführt wird, einschließlich der Berücksichtigung, ob der Stift beim Aufnehmen einer Aufnahme gerade ist, und der entsprechenden Ausrichtung des endgültigen Bildes.
Hier fühlt sich alles noch sehr früh an, aber es ist klar, dass viel Sorgfalt (und Geld) in das Produkt geflossen ist. Die Nachfrage ist hier vielleicht das größte Fragezeichen. Hat Humane wirklich eine Killer-App gefunden? Für Smartwatch-Hersteller ist Gesundheit schon lange die Antwort. Allerdings spielt das Gesundheitstracking hier eine deutlich geringere Rolle.
Das Produkt kommt eigentlich nicht in direkten Kontakt mit der Haut des Trägers, daher sind die Gesundheitsdaten, die es tatsächlich erfassen kann, begrenzt und können möglicherweise nicht nur als Schrittzähler dienen – obwohl diese Funktion derzeit ebenfalls nicht unterstützt wird. Das derzeit größte gesundheitsbezogene Feature ist das Kalorienzählen, das Ihnen mithilfe einer unbenannten Lebensmittelidentifizierungsplattform eines Drittanbieters insbesondere sagt, wie viele Kalorien und andere Nährwertangaben in dem Lebensmittel enthalten sind, das Sie in die Kamera halten.
Der Preis wird sicherlich eine Hürde für das unerprobte Gerät sein – 699 US-Dollar sind für Smartphone-Verhältnisse im Grunde nichts, aber für ein Produkt der ersten Generation und einen neuen Formfaktor ist es eine Menge verlangt. Die zusätzlichen 24 US-Dollar pro Monat helfen auch nicht, obwohl Bongiorno hinzufügt: „Sie bekommen eine Telefonnummer; Sie erhalten unbegrenzte Gespräche, Textnachrichten und Daten; Sie erhalten zusätzlich zu all unseren KI-Diensten so viele KI-Anfragen, wie Sie möchten. Heute sehen wir, wie viel Aufregung rund um ChatGPT herrscht, wo die Leute bereits dafür zahlen.“
Wenn Sie in diesem Monat jedoch nicht zahlen, ist das Produkt bis zum Beginn des Abonnements praktisch ein Briefbeschwerer.
Bevor unsere Sitzung endet, frage ich Chaudhri, wie das Unternehmen ausgerechnet am Revers gelandet ist, insbesondere wenn am Kopf getragene Displays schon seit einiger Zeit als Standard gelten. Sicherlich setzt sein ehemaliger Arbeitgeber Apple mit seinem kommenden Vision Pro auf das Gesicht.
„Kontextuelles Rechnen wurde immer als etwas angesehen, das man auf dem Gesicht tragen muss“, sagt er. „Da gibt es einfach eine Menge Probleme. Viele Menschen tragen eine Brille, die man aus einem ganz bestimmten Grund aufsetzt. Es dient entweder dazu, Ihnen das Sehen zu erleichtern oder Ihre Augen zu schützen. Das ist eine sehr persönliche Entscheidung – die Form Ihres Rahmens, das Gewicht Ihres Rahmens. Alles fließt in etwas ein, das so einzigartig ist wie Sie. Wenn Sie sich die Macht des Kontexts ansehen und erkennen, dass darin das Hindernis für kontextbezogene Berechnungen liegt, muss es einen anderen Weg geben. Also fingen wir an, nach dem Stück zu suchen, das es uns ermöglicht, viel persönlicher zu sein? Wir sind auf die Tatsache gekommen, dass wir alle Kleidung tragen. Wie können wir also ein Gerät schmücken, das uns einen Kontext auf unserer Kleidung gibt?“