Warum dieses KI-Startup auf sprachgesteuerte Bots setzt, um die Einführung von KI in Indien voranzutreiben

Warum dieses KI Startup auf sprachgesteuerte Bots setzt um die Einfuehrung

Wenn Ihr Zielmarkt 22 Amtssprachen hat und die Menschen dort über 19.000 Dialekte sprechen, ist es dann sinnvoll, einen Nur-Text-KI-Chatbot anzubieten, der am besten in ein paar Sprachen funktioniert?

Das ist die Frage Indisches KI-Startup Sarvam hat daran gearbeitet, dieses Problem zu lösen, und am Dienstag eine Reihe von Angeboten auf den Markt gebracht, darunter einen sprachgesteuerten KI-Bot, der mehr als 10 indische Sprachen unterstützt, da man darauf spekuliert, dass die Menschen im Land lieber in ihrer eigenen Sprache mit einem KI-Modell sprechen würden, als mit ihm per Text zu chatten. Das Startup bringt außerdem ein kleines Sprachmodell, ein KI-Tool für Anwälte sowie ein Audio-Sprachmodell auf den Markt.

„Die Leute sprechen lieber in ihrer eigenen Sprache. Heutzutage ist es extrem schwierig, in indischen Sprachen zu tippen“, sagte Vivek Raghavan, Mitbegründer von Sarvam AI, gegenüber Tech.

Das in Bengaluru ansässige Startup, das sich in erster Linie an Unternehmen und Betriebe richtet, bietet seine sprachgesteuerten KI-Bots für eine Reihe von Branchen an, insbesondere für solche, die auf Kundensupport angewiesen sind. Als Beispiel nannte es einen seiner Kunden: Sri Mandir, ein Startup, das religiöse Inhalte anbietet, nutzt Sarvams KI-Agenten zur Annahme von Zahlungen und hat bisher mehr als 270.000 Transaktionen abgewickelt.

Das Unternehmen sagte, seine KI-Sprachagenten könnten auf WhatsApp und in einer App eingesetzt werden und sogar mit herkömmlichen Sprachanrufen funktionieren.

Mit der Unterstützung von Peak XV und Lightspeed plant Sarvam, den Preis für seine KI-Agenten ab 1 ₹ (ungefähr 1 Cent) pro Nutzungsminute festzulegen.

Bildnachweise: Sarvam

Das Startup baut seine sprachgesteuerten KI-Agenten auf einem grundlegenden, kleinen Sprachmodell namens Sarvam 2B auf, das mit einem Datensatz von 4 Billionen Token trainiert wird. Laut Raghavan wird das Modell vollständig mit synthetischen Daten trainiert.

KI-Experten raten oft zur Vorsicht bei der Verwendung synthetischer Daten – im Wesentlichen Daten, die von einem großen Sprachmodell generiert werden, das darauf abzielt, reale Daten zu replizieren – zum Trainieren anderer KI-Modelle, da LLMs dazu neigen, zu halluzinieren und Informationen zu erfinden, die möglicherweise nicht genau sind. Das Trainieren von KI-Modellen mit solchen Daten kann dazu führen, solche Ungenauigkeiten zu verschlimmern.

Raghavan sagte, Sarvam habe sich für die Verwendung synthetischer Daten entschieden, da die Verfügbarkeit von Inhalten in indischer Sprache im offenen Web äußerst begrenzt sei. Das Startup habe Modelle entwickelt, um die Daten zu bereinigen und zu verbessern, die zunächst zur Generierung der synthetischen Datensätze verwendet wurden, fügte er hinzu.

Der Gründer behauptete, dass Sarvam 2B ein Zehntel von allem Vergleichbaren in der Branche kosten wird. Das Startup stellt das Modell als Open Source zur Verfügung und hofft, dass die Community darauf aufbauen wird.

„Obwohl die großen grundlegenden Sprachmodelle sehr spannend sind, können Sie mit kleinen Sprachmodellen ein besseres, spezifischeres, kostengünstigeres und latenzärteres Erlebnis erzielen“, sagte Raghavan. „Wenn Sie in einer Woche oder einem Monat ein oder zwei Abfragen durchführen möchten, sollten Sie die großen Sprachmodelle verwenden. Für Anwendungsfälle, die Millionen von Interaktionen täglich erfordern, sind meiner Meinung nach jedoch kleinere Modelle besser geeignet.“

Das Startup bringt außerdem ein Audio-Sprachmodell namens Shuka auf den Markt, das auf seinem Audio-Decoder Saaras v1 und Metas Llama3-8B Instruct basiert. Dieses Modell wird ebenfalls als Open Source bereitgestellt, sodass Entwickler die Übersetzungs-, TTS- und anderen Module des Startups zum Erstellen von Sprachschnittstellen verwenden können.

Und es gibt ein weiteres Produkt mit der Bezeichnung „A1“ – eine generative KI-Workbench für Anwälte, die Vorschriften nachschlagen, Dokumente erstellen, redigieren und Daten extrahieren kann.

Sarvam gehört zu einer kleinen Gruppe indischer Startups, die sich für Anwendungsfälle einsetzen, die den Interessen des Landes entsprechen und die Bemühungen der Regierung unterstützen, eine eigene, maßgeschneiderte KI-Infrastruktur zu entwickeln.

Regierungen auf der ganzen Welt streben zunehmend nach „souveräner KI“ – KI-Infrastruktur, die auf nationaler Ebene entwickelt und kontrolliert wird. Das angebliche Ziel solcher Bemühungen ist es, den Datenschutz zu schützen, das Wirtschaftswachstum anzukurbeln und die KI-Entwicklung an den jeweiligen kulturellen Kontext anzupassen. Die USA und China investieren derzeit am meisten in diesem Bereich, und Indien folgt mit seinem „IndiaAI“-Programm und sprachspezifischen Modellen.

Eine der Initiativen im Rahmen des IndiaAI-Programms heißt IndiaAI Compute Capacity und sieht die Errichtung eines Supercomputers mit mindestens 10.000 GPUs vor. Eines der entwickelten Modelle, genannt Bhashini, zielt darauf ab, den Zugang zu digitalen Diensten in verschiedenen indischen Sprachen zu demokratisieren.

Raghavan sagte, sein Startup sei bereit, zum IndiaAI-Programm beizutragen. „Wenn sich die Gelegenheit ergibt, werden wir mit der Regierung zusammenarbeiten“, sagte er im Interview.

tch-1-tech