Kalender-Apps sind für die Produktivität unerlässlich, aber es ist schwierig, sie ausreichend von der Kernnutzung zu unterscheiden, um ein nachhaltiges Wachstum zu erzielen. Y-Combinator-unterstützt Übermächtigein KI-gestützter Protokollierer für Ihre Meetings, bei dem keine Aufzeichnungs-Bots erforderlich sind, ist auf dieses Hindernis gestoßen und entwickelt sich nun zu einem neuen Anbieter Vapiein API-Anbieter, mit dem jeder ganz einfach einen natürlich klingenden sprachbasierten KI-gestützten Assistenten erstellen kann.
Superpowered wurde 2020 von Jordan Dearsley und Nikhil Gupta gegründet. Doch nach dreijähriger Arbeit sagte Dearsley, das Team wolle an dem anspruchsvolleren Produkt arbeiten. Das Unternehmen stellt das ursprüngliche Produkt nicht ein, da das Startup sagte, dass Superpowered profitabel ist – es ist dabei, jemanden zu engagieren, der es betreibt. Y Combinator sagte im Juni, dass mehr als 10.000 Menschen das Produkt wöchentlich nutzen, das Unternehmen gab jedoch keine aktualisierten Zahlen bekannt.
Bis heute hat Superpowered/Vapi 2,1 $ Startkapital von Investoren wie Kleiner Perkins und Abstract Ventures eingesammelt.
Wechseln Sie zu Vapi
Das Unternehmen bietet Vapi als API an, mit der Entwickler mithilfe von Eingabeaufforderungen einen Bot erstellen können – dieser wird dann hinter eine Telefonnummer gestellt. Darüber hinaus bietet es eine SDK-Integration, sodass Entwickler den Bot in Websites und mobile Apps einbetten können.
Dearsley teilte Tech per E-Mail mit, dass die Idee, Vapi zu bauen, auf einem persönlichen Problem beruhte. Er war nach San Francisco gezogen und begann, seine Freunde und Familie zu vermissen, die in einer anderen Zeitzone lebten. Er baute einen KI-Bot, der an eine Telefonnummer am anderen Ende angeschlossen war, um mit jemandem zu sprechen und seine Gedanken zu ordnen.
„Mir hat es gefallen, aber ich war ständig frustriert darüber, wie unnatürlich es war. Es war nicht so, als würde man mit einer Person reden. Die Stimme klang verstimmt, es dauerte lange, bis sie reagierte, und sie unterbrach mich, während ich sprach.“ er sagte.
„Also habe ich weiter daran gearbeitet und bin damit spazieren gegangen. Irgendwann faszinierte uns dieses Gesprächsproblem. Es ist wirklich schwer, etwas menschlich erscheinen zu lassen. Sprachassistenten Heute sind klobig und rundenbasiert, wir wollen etwas bauen, das sich menschlich anfühlt.“
Technisch gesehen arbeitet Vapi derzeit an einer Reihe von APIs von Drittanbietern, um eine robuste Sprachkonversationsplattform aufzubauen. Beispielsweise werden Lösungen von Twilio für die Telefonie, Deepgram für die Transkription, Daily für Audio-Streaming, OpenAI für Antworten usw. verwendet PlayHT für Text-to-Speech.
ScaleConvo, ein Startup im YC-Winterpaket für 2024, nutzt Vapi bereits, um Konversations-Bots für Vertriebsteams und Immobilienverwaltungsunternehmen auf den Markt zu bringen. Allerdings gab Vapi seine anderen Kunden nicht bekannt. Das Unternehmen öffnet seine API mit Vapi Phone- und Vapi Web-Produkte noch heute.
Herausforderungen für Vapi
Laut Magnus Revan, einem ehemaligen Gartner-Analysten und Chief Product Officer beim multimodalen Konversations-Startup Openstream.ai, besteht eine der größten Herausforderungen für das Startup darin, die Latenz zu reduzieren.
„OpenAI-Modelle benötigen zwischen 2 und 10 Sekunden, um eine Antwort zu generieren – während beim Telefon der Goldstandard darin besteht, 700 ms zwischen dem Ende des Gesprächs des Benutzers und dem Beginn des Gesprächs durch den „Bot“ zu vergehen. Und es ist wirklich schwierig, mit leistungsfähigen Modellen (Open-Source-Modellen mit hoher Parameteranzahl wie LLaMA2 70B) eine Latenz von unter einer Sekunde zu erreichen“, sagte Revan.
Derzeit hat Vapi eine Latenzzeit von 1,2–2 Sekunden, abhängig von verschiedenen Faktoren. Dearsley geht davon aus, dass die Latenz dank Vapis eigener Arbeit und den Verbesserungen von OpenAI im nächsten Monat auf unter eine Sekunde gesenkt werden kann.
Mohamed Musbah, ein Angel-Investor bei Vapi, sagte auch, dass sich die Lösung des Startups mit den allgemeinen Fortschritten bei API verbessern werde.
„Da OpenAI und andere ihre Modelle verbessern, wird die Plattform von Vapi leistungsfähiger und mit besseren Wissensdatenbanken, Funktionen zur Codeausführung und größeren Kontextfenstern ausgestattet. Vapis Fokus auf die Lösung der größten Reibungspunkte in der Sprachkommunikation wird sein Vorteil sein, da die Nachfrage der Benutzer nach Sprachassistenten wächst“, sagte er.
Allerdings liegt die Verantwortung eher bei der Verbesserung anderer Lösungen als bei Vapi selbst. Dearsley sagte, dass die Abhängigkeit von anderen APIs die Verteidigungsfähigkeit von Vapi verringert, wenn große Unternehmen in diesen Bereich vordringen. Das Team sagte jedoch, dass es einen Vorteil habe, da es eine Infrastruktur aufgebaut habe, die Tausende von Anrufen gleichzeitig bearbeiten könne. Dearsley betonte, dass das Team mit der Einführung der Web- und Telefon-API von Vapi für die Öffentlichkeit auch versuchen wird, eigene Modelle für Audio-zu-Audio-Lösungen zu entwickeln.