Voller neuer Barmittel will AssemblyAI sein KI-as-a-Service-Geschäft – Tech – ausbauen

Voller neuer Barmittel will AssemblyAI sein KI as a Service Geschaeft – Tech –

Modelle für maschinelles Lernen im großen Maßstab sind das Herzstück schlagzeilenträchtiger Technologien wie DALL-E 2 von OpenAI und LaMDA von Google. Sie sind zweifellos beeindruckend und in der Lage, Bilder und Texte zu erzeugen, die überzeugend genug sind, um als menschliches Werk durchzugehen. Aber die Entwicklung der Modelle kostete enorm viel Zeit und Rechenleistung – ganz zu schweigen von Geld. Allein DALL-E 2 wurde 2 Wochen lang auf 256 GPUs trainiert, was sich laut einem auf Kosten von rund 130.000 US-Dollar beläuft, wenn es auf Amazon Web Services-Instanzen trainiert würde schätzen.

Kleinere Unternehmen haben Mühe, Schritt zu halten, weshalb sich viele an „AI-as-a-Service“-Anbieter wenden, die die anspruchsvolle Arbeit der Erstellung von Modellen übernehmen und für den Zugriff darauf über eine API Gebühren erheben. Einer dieser Anbieter ist AssemblyAIdas sich speziell auf Speech-to-Text- und Textanalysedienste konzentriert.

AssemblyAI gab heute bekannt, dass es 30 Millionen US-Dollar in einer von Insight Partners angeführten Serie-B-Runde mit Beteiligung von gesammelt hat Die Mitbegründer von Y Combinator und Stripe, John und Patrick Collison, Nat Friedman und Daniel Gross. Miteinander ausgehen, AssemblyAI hat 64 Millionen US-Dollar aufgebracht, die laut Gründer und CEO Dylan Fox gegenüber Tech in den Ausbau der Forschungs- und Ingenieurteams des Unternehmens und in die Schulung von KI-Modellen für Rechenzentrumskapazitäten investiert werden.

Fox gründete AssemblyAI nach einer zweijährigen Tätigkeit bei Cisco, wo er an maschinellem Lernen für Collaboration-Produkte arbeitete. Davor gründete er YouGive1, eine Organisation, die mit Unternehmen zusammenarbeitete, um Kunden mit Produktangeboten im Austausch gegen gemeinnützige Spenden zu belohnen.

„Ich suchte für frühere Projekte nach Spracherkennungs- und NLP-APIs (Natural Language Processing) und startete AssemblyAI, nachdem ich 2017 gesehen hatte, wie begrenzt und ungenau die verfügbaren Optionen waren“, sagte Fox in einem E-Mail-Interview mit Tech. „Das Ziel des Unternehmens ist die Erforschung und Bereitstellung modernster KI-Modelle für NLP und Spracherkennung und die Bereitstellung dieser Modelle für Entwickler in sehr einfachen Softwareentwicklungskits und APIs, die kostenlos und einfach zu integrieren sind.“

AssemblyAI bietet KI-gestützte, API-basierte Dienste in über 80 Sprachen für die automatische Transkription, Themenerkennung und Inhaltsmoderation sowie „Autokapitel“, die Audio- und Videodateien in „Kapitel“ mit Zusammenfassungen für jedes unterteilen. Über die Plattform können Entwickler verschiedene APIs aufrufen, um Aufgaben wie „Identifizieren der Sprecher in diesem Gespräch“ oder „Überprüfen dieses Podcasts auf verbotene Inhalte“ zu relativ geringen Kosten durchzuführen, beginnend bei 0,00025 $ pro Audiosekunde.

Bildnachweis: AssemblyAI

„Wir trainieren massive KI-Modelle auf Hunderten von GPUs mit Milliarden von Parametern“, sagte Fox. „Parameter“ bezieht sich auf die Größe der Modelle; Im Allgemeinen sind größere Modelle anspruchsvoller. „Durch die Nutzung der Fortschritte in der KI-Forschung verbessern wir die Genauigkeit aller unserer KI-Modelle weiterhin dramatisch und bringen neue auf den Markt“, fuhr er fort. „ÖUnsere ‚AutoTrain‘-Funktion ermöglicht es der API, aus einer zufälligen Stichprobe von Kundendaten zu lernen, um sich im Laufe der Zeit automatisch zu verbessern.“

AssemblyAI ist nicht der einzige Akteur im geschäftigen KI-as-a-Service-Sektor. NLPCloud bietet über APIs sofort einsatzbereite NLP-Modelle, während Sayso eine API erstellt hat, um akzentuiertes Englisch nahezu in Echtzeit von einem Akzent in einen anderen zu ändern. Nicht umsonst haben Amazon, Google und Microsoft eine Vielzahl von API-basierten KI-Produkten, die auf Anwendungen wie Textanalyse, Bilderkennung, Text-to-Speech, Speech-to-Text und mehr abzielen.

Aber Fox sagt, dass AssemblyAI weiterhin schnell wächst, angetrieben von die Pandemie und – im weiteren Sinne – der Aufstieg der Fernarbeit. Audio und Video werden in eine wachsende Zahl von Produkten integriert, stellt er fest, wie Videokonferenzen und sogar Dating-Apps. Das führte pProduktteams, um nach Möglichkeiten zu suchen, um zusätzliche, hochwertige Funktionen auf Audio- und Videodaten aufzubauen.

„Diese Funktionen sehen aus wie Vertrauens- und Sicherheitsteams bei Social-Media-Unternehmen, die die Inhaltsmoderation von Audiobeiträgen automatisieren, oder Werbeplattformen, die automatisch in Podcasts und Videos gesprochene Themen identifizieren, Tools für die Zusammenarbeit, die lesbare Transkripte, Zusammenfassungen und Schlüsselwörter für Videobotschaften bereitstellen, die auf ihren Plattformen geteilt werden. und Telefonieunternehmen, die intelligentere Contact-Center-Plattformen und Revenue-Intelligence-Produkte entwickeln, die Kundensupport- und Vertriebsanrufe analysieren können“, sagte Fox. „AssemblyAI entwickelt sich schnell zur bevorzugten API-Plattform für diese Produktteams, um diese KI-infundierten Funktionen zusätzlich zu Audio- und Videodaten in ihren Produkten bereitzustellen.“

Fox sagt, dass AssemblyAI jetzt „Hunderte“ zahlende Kunden unter seinen mehr als 10.000 Benutzern hat. Seit Anfang 2022 ist die Nutzerbasis um das Dreifache gestiegen, während die Einnahmen – die Fox nicht offenlegen wollte – um das Dreifache gestiegen sind.

„[We’re] Verarbeitung von Millionen von API-Aufrufen jeden Tag“, sagte Fox. „Wir planen, unser KI-Forschungsteam in den nächsten sechs Monaten zu verdreifachen und Millionen von Dollar in GPU-Hardware zu investieren, um größere und komplexere KI-Modelle zu trainieren das wird den Umschlag sprengen.“

Fox glaubt, dass das Wachstum AssemblyAI für das kommende Jahr gut positionieren wird – was auch immer der Gegenwind bringen mag. In einer Zeit, in der Entlassungen zur Regel werden und die Finanzierung schwierig ist, sagt er, dass AssemblyAI dem Trend entgegenwirken wird, indem es die Größe seines 52-köpfigen Teams bis Ende des Jahres nahezu verdoppeln wird.

„Wir hatten kaum in unsere Serie-A-Finanzierung eingetaucht, die wir erst vor ein paar Monaten im Februar von Accel abgeschlossen hatten, und waren nicht aktiv beim Fundraising. Aber wir hatten Kontakt mit Rebecca [Liu-Doyle] von Insight und hatte das Gefühl, dass sie, Insight insgesamt und das zusätzliche Kapital uns wirklich helfen würden [spur] unser Wachstum noch weiter vorantreiben“, sagte Fox. „EINWenn sich der Markt öffnet, müssen wir in der Lage sein, uns sowohl als dominierender Anbieter in diesem Bereich zu etablieren als auch die wachsenden Erwartungen der Kunden zu unterstützen – mit genaueren KI-Modellen, die die von ihnen entwickelten Funktionen und Produkte unterstützen können.“



tch-1-tech