Computer-Vision-Anwendungen erhalten einen enormen Aufschwung durch Fortschritte bei Smartphones in Kombination mit KI, die dabei hilft, die Lücken dessen zu schließen, was alltägliche Geräte nicht sehen können. Mit diesen Tools rief ein Startup aus München an Jenseits der Präsenz glaubt, dass darin der Schlüssel zu dem liegt, was als nächstes kommt: hyperrealistische Avatare, die genauso aussehen und klingen wie ihre menschlichen Gegenstücke und in Echtzeit-Konversationssituationen verwendet werden können.
Das Startup gab heute bekannt, dass es seine erste externe Finanzierung erhalten habe, eine Pre-Seed-Runde in Höhe von 3,1 Millionen US-Dollar. Das deutsche Unternehmen HV Capital führt die Runde an, an der sich auch zehn Gründer, Alba VC und Einzelpersonen von Meta, DeepMind und Zalando beteiligen.
Beyond Presence hat seine Technologie noch nicht wirklich auf die Welt gebracht, aber es ist nah dran, sagte Awais Shafique, CEO und Mitbegründer des Startups, gegenüber Tech.
Ein Teil des neuen Kapitals werde für die Weiterentwicklung der Grundmodelle des Unternehmens verwendet, sagte er, und ein Teil werde die Veröffentlichung der öffentlichen Betaversion bis Ende dieses Monats finanzieren.
Bisher stehen etwa 300 Unternehmen auf der Warteliste für das Produkt, für das es wahrscheinlich erste Bewerbungen in Bereichen wie Kundenservice und -support, Personalbeschaffung, Vertrieb und E-Learning geben wird. In all diesen Bereichen möchten Unternehmen die Interaktion mit Benutzern ausweiten, ohne mehr Mitarbeiter einstellen und schulen zu müssen.
Wie hat es ein Startup also geschafft, bereits vor der Markteinführung eines Produkts eine Multimillionen-Dollar-Runde einzusammeln und ohne Fremdfinanzierung so weit zu einem ressourcenintensiven KI-Unternehmen zu kommen? Die Antwort liegt im Hintergrund der Gründer.
Shafique war zuvor Mitbegründer von Presize, einem Computer-Vision-Startup, das die Maße eines Benutzers genau messen konnte, indem es einen Clip aufzeichnete, in dem sich der Benutzer einmal vor einer Smartphone-Kamera umdrehte. Diese Messungen könnten dann dazu verwendet werden, Kleidung online zu kaufen. Das Münchner Startup hatte in seinem Heimatland einen übergroßen Bekanntheitsgrad, da die Gründer 2020 an der deutschen TV-Version von „Höhle der Drachen“/„Shark Tank“ teilnahmen und dort die rekordverdächtige Summe von 650.000 Euro einsammelten.
Dann rein April 2022stellte sich heraus, dass Meta Presize übernommen hatte. Der Preis und das genaue Datum der Transaktion wurden nie bekannt gegeben, aber einige starke Signale deuten auf einen großartigen Ausstieg hin.
Aus SEC-Einreichungen geht hervor, dass Meta zwischendurch ausgegeben hat 774 Millionen US-Dollar von Januar bis März 2022, und 1,15 Milliarden US-Dollar im ersten Halbjahr 2022 auf Akquisitionen. Presize war der einzige Deal, der zu diesem Zeitpunkt öffentlich bekannt gegeben wurde. Die Wikipedia-Liste der Meta-Akquisitionen wurde inzwischen mit einer viel bescheideneren Schätzung bearbeitet: 100 Millionen Dollar.
Mit der Angelegenheit vertraute Quellen teilten Tech mit, dass in diesem Fall ein Dealwert im unteren neunstelligen Bereich genauer sei als ein zehnstelliger Wert.
Unabhängig davon, wo Presize in dieser Spanne lag, kamen er und seine Mitgründer nach Shafiques Schätzung sehr gut davon, da das Startup nur „ein paar Millionen“ eingesammelt hatte.
„Es ist lukrativ genug, dass wir nicht arbeiten müssen“, sagte er in einem Interview.
(Sie arbeiten sowieso alle noch. Neben Shafiques neuestem Startup sind auch die anderen Mitbegründer von Presize, Leon Szeli und Tomislav Tomov, immer noch bei Meta und arbeiten an seinen generativen KI-Projekten. Sie bleiben jedoch weiterhin mit Shafique in Kontakt beide investieren in Beyond Presence.)
Im Kern zielte Presize darauf ab, ein heikles Computer-Vision-Problem zu lösen, und das ist auch das Ziel von Beyond Presence.
Zugegebenermaßen waren meine ersten Gedanken zum Pitch von Beyond Presence skeptisch.
Digitale Avatare sind kein Neuland. Sie gibt es nicht nur schon seit Jahrzehnten, sondern sie haben in letzter Zeit auch durch die neuesten Innovationen in den Bereichen KI und Datenverarbeitung, ganz zu schweigen von der Begeisterung für alles, was mit Chatbots zu tun hat, an Aufmerksamkeit – und vielleicht auch etwas Hype – zugenommen.
Es gibt auch keine klaren Vorstellungen davon, was im Bereich Avatare als langfristiges Geschäft funktionieren wird. Einige, wie Hyper und Ready Player Me (unterstützt von Amazon bzw. a16z), stützen sich auf die Gaming-Kultur und die Theorie, die Avatare haben sollten nicht Seien Sie realistische Versionen der Menschen, die sie verwenden. Diejenigen, die ihre Identität verbergen möchten, um ihre Privatsphäre zu wahren, könnten sich für diese Ansätze gegenüber denen entscheiden, die ihr genaues Abbild nachbilden.
Andere, wie Synthesia, dürfen erstellen Bildnisse von Menschen. Sie erfordern jedoch Studiobesuche und sind nicht die Grundlage des Hauptprodukts, das bescheidene Geräte wie Telefonkameras verwendet, um Ihre Gesichtsausdrücke zu erfassen und Avatare mit Strom zu versorgen nicht Sieh aus wie du.
Und einige andere versuchen, Tools zu entwickeln, mit denen Sie über alltägliche Geräte interagieren können – darunter Veed und Deepbrain.
Beyond Presence strebt nicht nur einen Avatar an, der im Handumdrehen mit Ihrem Telefon erstellt werden kann, sondern auch einen, der wie Sie aussieht und in Echtzeit-Konversationssituationen ohne Drehbuch verwendet werden kann. So etwas wie eine Videoversion der textbasierten Chatbots, die von OpenAI, Anthropic, Meta und vielen anderen angeboten werden.
Das Startup ist natürlich nicht das einzige in diesem Bereich. Zoom scheint an hyperrealistischen benutzerdefinierten Avataren zu arbeiten, und auch CommonGround entwickelt etwas in ähnliche Richtung.
Derzeit konzentriert sich Beyond Presence darauf, in der Videokomponente seines Produkts etwas Einzigartiges zu schaffen.
Eleven Labs treibt den Sprachteil des Erlebnisses voran, und GPT von OpenAI ist das generative KI-Modell, das den Inhalt treibt. Geschäftskunden können flexibel wechseln, welches Modell sie nutzen.
„Sie können uns auch alles überlassen, [or use] jedes LLM, das Sie möchten, oder jeden Sprachagenten, den Sie möchten. Und dann machen wir das Gesicht darüber“, sagte er. Mit dieser Funktion werde dem Umstand Rechnung getragen, dass Unternehmenskunden beispielsweise bereits mit bestimmten LLM-Anbietern zusammenarbeiten oder keine proprietären Daten extern teilen möchten, betonte er.
Es gibt ein interessantes Detail zu den frühen Finanzierungsentscheidungen von Beyond Presence: Es stellte sich heraus, dass das Unternehmen Anfang des Jahres zur Teilnahme am Y Combinator zugelassen wurde, sich jedoch aus dem prestigeträchtigen Inkubator zurückzog.
Obwohl YC definitiv Zugang zu großartigen Netzwerken bietet, haben Shafique und sein Mitbegründer Felix Altenberger (CTO und ehemaliger Deep-Learning-Spezialist bei Presize) beschlossen, nicht auf Gerechtigkeit und Autonomie zu verzichten, um darauf zuzugreifen.
Während YC-Partner möglicherweise ihren eigenen Beitrag dazu geleistet haben, wie das Unternehmen durch Verkäufe wachsen könnte, sagte Shafique, dass er und Altenberger einen „horizontalen“ Ansatz verfolgten, den sie verfolgen wollten.
„Wir wollten uns stärker auf die Ebene der Kerntechnologie und des Basismodells konzentrieren“, sagte er.
Tech hat einen KI-fokussierten Newsletter! Melden Sie sich hier an, um es jeden Mittwoch in Ihrem Posteingang zu erhalten.