Mit Retell AI können Unternehmen „Sprachagenten“ erstellen, um Telefonanrufe zu beantworten

Callcenter setzen auf Automatisierung. Es gibt eine Debatte darüber ob das eine gute Sache istaber es passiert – und möglicherweise beschleunigt es sich.

Nach Angaben des Forschungsunternehmens TechSci Research könnte der weltweite Markt für Contact Center-KI von 2,4 Milliarden US-Dollar im Jahr 2022 auf fast 3 Milliarden US-Dollar im Jahr 2028 wachsen planen, im nächsten Jahr irgendeine Form von KI einzuführen.

Die Motivation liegt auf der Hand: Callcenter wollen Kosten senken und gleichzeitig ihren Betrieb ausbauen.

„Unternehmen mit starkem Callcenter-Betrieb, die ohne die Einschränkungen menschlicher Contact-Center-Agenten schnell skalieren möchten, sind sehr empfänglich für die Einführung effektiver KI-Sprachagentenlösungen“, sagte Unternehmerin Evie Wang gegenüber Tech. „Dieser Ansatz senkt nicht nur die Gesamtkosten, sondern verkürzt auch die Wartezeiten.“

Wang ist einer der Mitbegründer von KI noch einmal erzählen, das eine Plattform bietet, mit der Unternehmen KI-gestützte „Sprachagenten“ erstellen können, die Kundenanrufe beantworten und grundlegende Aufgaben wie die Terminplanung ausführen. Die Agenten von Retell basieren auf einer Kombination aus großen Sprachmodellen (LLMs), die genau auf Anwendungsfälle im Kundenservice abgestimmt sind, und einem Sprachmodell, das dem von den LLMs generierten Text eine Stimme verleiht.

Zu den Kunden von Retell zählen einige Contact-Center-Betreiber, aber auch kleine und mittelständische Unternehmen, die regelmäßig ein hohes Anrufvolumen bewältigen, wie das Telemedizinunternehmen Ro. Sie können mithilfe der Low-Code-Tools der Plattform Sprachagenten erstellen oder ein benutzerdefiniertes LLM (z. B. ein offenes Modell wie Metas Llama 3) hochladen, um das Erlebnis weiter anzupassen.

„Wir investieren viel in das Sprachgesprächserlebnis, da wir dies als den wichtigsten Aspekt des KI-Sprachagentenerlebnisses betrachten“, sagte Wang. „Wir betrachten KI-Sprachagenten nicht als bloße Spielzeuge, die man mit ein paar Eingabezeilen erstellen kann, sondern vielmehr als Werkzeuge, die Unternehmen einen erheblichen Mehrwert bieten und komplexe Arbeitsabläufe ersetzen können.“

Retell funktionierte in meinen kurzen Tests recht gut, zumindest auf der Anrufseite.

Ich habe über das Demoformular auf der Website von Retell einen Anruf mit einem Retell-Bot vereinbart. Der Bot führte mich durch den Prozess der Planung eines hypothetischen Zahnarzttermins und stellte Fragen wie mein bevorzugtes Datum und meine bevorzugte Uhrzeit, meine Telefonnummer usw.

Ich kann nicht sagen, dass die synthetische Stimme des Bots in puncto Realismus die beste war, die ich je gehört habe – schon gar nicht auf Augenhöhe mit Eleven Labs oder der Text-to-Speech-API von OpenAI. Wang sagte zu Retells Verteidigung, dass sich das Team hauptsächlich darauf konzentriert habe, die Latenz zu reduzieren und Grenzfälle zu bewältigen, wie etwa Unterbrechungen, die in einem Gespräch auftreten könnten.

Die Latenz Ist niedrig: In meinem Test reagierte der Bot nahezu ohne zu zögern auf meine Antworten und Anschlussfragen. Und es blieb seinem Drehbuch treu. So sehr ich es auch versuchte, ich konnte es nicht verwirren oder zu einem Verhalten veranlassen, das es nicht tun sollte. (Als ich den Bot nach meinen Zahnakten fragte, bestand er darauf, dass ich mit dem Büroleiter spreche.)

Sind Plattformen wie Retell also die Zukunft des Callcenters?

Vielleicht. Für grundlegende Aufgaben wie die Terminplanung ist die Automatisierung sehr sinnvoll, weshalb wahrscheinlich sowohl Startups als auch große Technologieunternehmen Lösungen anbieten, die direkt mit denen von Retell konkurrieren. (Siehe Parloa, PolyAI, Contact Center AI von Google Cloud usw.)

Es ist eine niedrig hängende – und scheinbar umsatzgenerierende – Frucht. Retell behauptet, Hunderte von Kunden zu haben, die alle pro Gesprächsminute mit einem Sprachagenten zahlen. Retell hat bisher insgesamt 4,53 Millionen US-Dollar an Kapital aufgebracht, mit freundlicher Genehmigung von Unterstützern wie Y Combinator (wo das Unternehmen gegründet wurde).

Aber bei komplizierteren Fragen ist sich die Jury nicht einig, insbesondere angesichts der Tendenz von LLMs, Fakten zu erfinden und aus der Bahn zu geraten, selbst wenn Schutzmaßnahmen vorhanden sind.

Während Retells Ambitionen wachsen, bin ich gespannt, wie das Unternehmen die vielen bekannten technischen Herausforderungen in diesem Bereich meistert. Zumindest Wang scheint von Retells Ansatz überzeugt zu sein.

„Mit dem Aufkommen von LLMs und den jüngsten Durchbrüchen in der Sprachsynthese wird die Konversations-KI gut genug, um wirklich spannende Anwendungsfälle zu schaffen“, sagte Wang. „Mit einer Latenz von unter einer Sekunde und der Möglichkeit, die KI zu unterbrechen, haben wir beispielsweise beobachtet, dass Benutzer in ausführlicheren Sätzen sprachen und sich so unterhielten, wie sie es mit einer anderen Person tun würden. Wir versuchen, Entwicklern das Erstellen, Testen, Bereitstellen und Überwachen von KI-Sprachagenten zu erleichtern, um ihnen letztendlich dabei zu helfen, die Produktionsreife zu erreichen.“

tch-1-tech