Der Gründer, der die KI von Snap entwickelt hat, bringt eine flotte neue Version von Video-Chatbots auf den Markt

Ein Deep-Learning-Wissenschaftler, dessen letztes Startup von Snap übernommen wurde, um seinen My AI-Chatbot zu entwickeln, hat Startkapital für sein neuestes Projekt gesammelt: eine Plattform für den Aufbau und Betrieb videobasierter Konversations-KI-Agenten in Echtzeit.

eSelfwie das Startup genannt wird, kommt heute mit 4,5 Millionen US-Dollar in der Kasse aus der Tarnung, um in den Wettlauf um die Entwicklung lebendiger, interaktiver und realistischerer KI-Assistenten einzusteigen. Der anfängliche Schwerpunkt liegt auf Branchen wie Bildung, Vertrieb, Finanzdienstleistungen, Immobilien sowie Gesundheit und Wellness.

Die erste Aussage von eSelf ist, dass die aktuelle Abfrage-/Interaktionsantwortzeit seiner Agenten unter 1,7 Sekunden liegt – was nach eigenen Angaben schneller und damit lebensechter ist als Sprachantworten anderer führender Unternehmen wie OpenAI. Das israelische Startup hat ein „No-Code“-Erstellungsstudio gestartet, mit dem seine Kunden ihre eigenen Agenten erstellen können. Diese Agenten können gängige Apps wie Calendly, Salesforce und andere bedienen, um Termine zu planen, auf Begleitinhalte zuzugreifen und auf Daten zu verweisen, genau wie es ein menschlicher Assistent tun würde.

eSelf sagt, dass es heimlich bereits „Millionen“ Echtzeitgespräche ermöglicht hat. Zu den aktuellen Kunden zählen Christie’s Real Estate und die brasilianische Bank AGI.

Explorer-Investitionenein Unternehmen aus Portugal, führte die Runde unter Beteiligung von Ridge Ventures und strategischen Angel-Investoren wie Eyal Manor, ehemaliger VP of Engineering bei YouTube und Chief Product and Engineering Officer bei Twilio, an.

eself
Bildnachweis:eSelf (öffnet sich in einem neuen Fenster) unter einer Lizenz.

eSelf wurde von Dr. Alan Bekker (CEO) und Eylon Shoshan (CTO) mitbegründet und hat eine ungewöhnliche Entstehungsgeschichte.

Bekker, der in Tel Aviv lebt, erzählt mir, dass sein ursprünglicher Wunsch darin bestand, Rabbiner zu werden – ein Ehrgeiz, aus dem er sich nach mehreren Jahren seines Studiums verflüchtigte, sagte er, nachdem er sich an den Oberrabbiner seiner Schule gewandt und große Fragen über Gott gestellt hatte und Glaube und dass er mit den Antworten, die er als Gegenleistung erhielt, nicht zufrieden war.

„Ich kam nach Hause zu meiner Frau Lisa“, sagte er. „Ich habe ihr gesagt, dass ich nicht mehr an Gott glaube.“

Ob er das am Ende in Einklang gebracht hat oder nicht, weiß ich nicht. Aber es scheint, dass er tat Entdecken Sie nach diesem dramatischen Moment eine andere Art von Religion.

„Meine Leidenschaft galt immer dem Verständnis der Menschen und unserer Welt im Allgemeinen“, sagte er. Schon während seiner Studienzeit interessierte er sich schon lange für Mathematik, weshalb er die Rabbinerschule abbrach und sich an die Universität wandte, um Ingenieurwesen, Physik und Informatik zu studieren.

Er habe sich „völlig aus Versehen“ für einen Kurs über maschinelles Lernen angemeldet, sagte er, und dieser habe ihm einen Einblick in eine andere Art von Allwissenheit gegeben.

„Mit Mathematik kann man natürliche Sprache, Vision und Sprache verstehen“, sagte er. „Es war überwältigend.“

Erstes Startup für 100 Millionen US-Dollar verkauft

Durch einen Doktortitel, viele Forschungsarbeiten und viele Kredite (inzwischen zurückgezahlt) wurde Bekker schnell zu einem Spezialisten für Spracherkennung, neuronale Netze und Deep Learning. Außerdem verspürte er einen unternehmerischen Drang und, wie sich herausstellte, ein Talent für sprichwörtliches Erkennen wohin der Puck geht.

Sein erstes Startup war Voca, das sich auf die Entwicklung von KI-Sprachassistenten für Callcenter konzentrierte. Es fing an, große Kunden wie American Express und TNT (heute Teil von FedEx) zu gewinnen, und dann kam Snap an die Tür. Wie wir damals berichteten, erwarb Snap das Startup im Jahr 2020 für 100 Millionen US-Dollar, es gab jedoch kaum Hinweise darauf, wie es die Technologie nutzen würde.

Bekker übernahm die Rolle des Leiters für Conversational AI bei Snap, wo er ein Team leitete, das … Conversational AI-Technologie entwickelte. Aber es dauerte fast drei Jahre, und bis die Technologiewelt mit der viralen Ankunft der generativen KI auf den Kopf gestellt wurde, bis sie endlich in einem Produkt landete.

Als Snapchat im Jahr 2023 seinen Konversations-Chatbot My AI auf den Markt brachte, war Bekker bereits ein Jahr nicht mehr im Unternehmen. Vielleicht genauso gut: Meine KI hatte seit ihrer Veröffentlichung gemischte (und einige ziemlich negative) Reaktionen.

(Bekker erzählt uns, dass er zwar an der Technologie beteiligt war, aber nicht an der Entwicklung des Produkts oder der Integration mit Snapchat.)

In der Zwischenzeit begann er darüber nachzudenken, wie die nächste Generation von KI-Agenten aussehen könnte: Anstelle von sprach- und textbasierten Abfragen mit textbasierten Antworten sah er das Potenzial für ein interaktiveres und menschlicheres Produkt, das Video und Sprache nutzt die Antwort.

Bekker gründete eSelf gemeinsam mit Shoshan, der in Israels 8200-Einheit seine ersten Erfahrungen gesammelt hat und ein Spezialist für die Verarbeitung natürlicher Sprache ist.

In der Technologiewelt wimmelt es immer mehr von Unternehmen, die auf das abzielen, was heute als „agentische“ Chance bezeichnet wird.

Durch die Nutzung der Fortschritte in der generativen KI ist eine Reihe von Unternehmen entstanden, die daran arbeiten, Antworten zu liefern, die nicht nur genauer, sondern auch glaubwürdiger sind, da die Form – ein „Mensch“ mit einer „Stimme“ – sie liefert.

Unternehmen wie H, Eleven Labs, Amazon, Anthropic, die neu eingeführten /dev/agents, LinkedIn und OpenAI erstellen Bausteine, um Agenten für die Ausführung verschiedener Aufgaben zu erstellen. Startups und etablierte Akteure wie Salesforce bringen auch Agenten für bestimmte Anwendungsfälle auf den Markt, z. B. beim Einkaufen, bei der Unterstützung von Vertriebs- und Umsatzteams in Unternehmen sowie beim Design.

Es ist noch sehr früh, aber es wird sich lohnen, zu beobachten, welche davon bei zahlenden Nutzern Anklang finden und welche Start-ups Investoren gewinnen, um ihnen beim Wachstum zu helfen.

Das heißt, wenn man davon ausgeht, dass sich irgendetwas davon durchsetzen und einige der wesentlichen Gating-Faktoren überwinden wird. Ein Bereich, der sich als großer Geldfresser erwiesen hat, ist der Aufbau und die Schulung von Modellen. Bekker sagte, dass eSelf nicht von Grund auf eigene LLMs aufgebaut habe. Stattdessen wurden unter anderem von Meta erstellte Lama-Modelle verfeinert. „Kunden, die einen Chatbot haben, der beispielsweise auf GPT aufbaut, können auf diesen umsteigen“, sagte er, „aber die Latenz wird länger sein.“

tch-1-tech