Unitary AI erhält 15 Millionen US-Dollar für seinen multimodalen Ansatz zur Moderation von Videoinhalten

Die Moderation von Inhalten ist in der Welt der Online-Medien weiterhin ein umstrittenes Thema. Neue Vorschriften und öffentliches Anliegen werden es wahrscheinlich noch viele Jahre lang als Priorität behalten. Aber bewaffnete KI und andere technische Fortschritte machen die Lösung immer schwieriger. Ein Startup aus Cambridge, England, rief an Einheitliche KI glaubt, einen besseren Weg zur Bewältigung der Moderationsherausforderung gefunden zu haben – durch die Verwendung eines „multimodalen“ Ansatzes, um die Analyse von Inhalten im komplexesten Medium überhaupt zu unterstützen: Video.

Heute kündigt Unitary eine Finanzierung in Höhe von 15 Millionen US-Dollar an, um von der Marktdynamik zu profitieren. Die Serie A – angeführt vom führenden europäischen VC Creandum, unter Beteiligung von Paladin Capital Group und Plural – findet statt, da das Geschäft von Unitary wächst. Die Zahl der klassifizierten Videos ist in diesem Jahr von 2 Millionen auf 6 Millionen pro Tag gestiegen (die Milliarden von Bildern abdecken), und die Plattform fügt nun neben Englisch auch weitere Sprachen hinzu. Es wurde abgelehnt, die Namen der Kunden preiszugeben, es wurde jedoch angegeben, dass die ARR inzwischen in Millionenhöhe liegt.

Unitary nutzt die Mittel, um in weitere Regionen zu expandieren und mehr Talente einzustellen. Unitary gibt seine Bewertung nicht bekannt; Zuvor wurden weniger als 2 Millionen US-Dollar und mehr eingesammelt 10 Millionen Dollar bei der Anschubfinanzierung; Zu den weiteren Investoren zählen unter anderem Carolyn Everson, die ehemalige Meta-Managerin.

In den letzten Jahren haben Dutzende Startups verschiedene Aspekte der künstlichen Intelligenz genutzt, um Tools zur Inhaltsmoderation zu entwickeln.

Und wenn man darüber nachdenkt, ist das schiere Ausmaß der Herausforderung im Video eine geeignete Anwendung dafür. Keine Armee von Menschen allein wäre jemals in der Lage, die Dutzende oder Hunderte von Zettabytes an Daten zu analysieren, die auf Plattformen wie YouTube, Facebook, Reddit oder TikTok erstellt und geteilt werden – ganz zu schweigen von Dating-Sites, Gaming-Plattformen, Videokonferenz-Tools und anderen Orte, an denen Videos erscheinen, die insgesamt mehr als 80 % des gesamten Online-Verkehrs ausmachen.

Dieser Aspekt interessierte auch die Anleger. „In einer Online-Welt besteht ein enormer Bedarf an einem technologiegestützten Ansatz zur Identifizierung schädlicher Inhalte“, sagte Christopher Steed, Chief Investment Officer der Paladin Capital Group, in einer Erklärung.

Trotzdem ist es ein überfüllter Raum. OpenAI, Microsoft (unter Verwendung seiner eigenen KI, nicht der von OpenAI), Hive, Active Fence / Spectrum Labs, Oterlu (jetzt Teil von Reddit) und Sentropy (jetzt Teil von Discord) und Amazon Anerkennung sind nur einige der vielen, die es gibt.

Aus Sicht von Unitary AI sind bestehende Tools im Videobereich nicht so effektiv, wie sie sein sollten. Der Grund dafür ist, dass Tools bisher typischerweise so entwickelt wurden, dass sie sich auf das Parsen von Daten des einen oder anderen Typs – beispielsweise Text, Audio oder Bild – konzentrieren, jedoch nicht in Kombination und gleichzeitig. Das führt zu vielen False Flags (oder umgekehrt zu keinen Flags).

„Das Innovative an Unitary ist, dass wir über echte multimodale Modelle verfügen“, sagte CEO Sasha Haco, der das Unternehmen zusammen mit CTO James Thewlis gründete. „Anstatt nur eine Reihe von Bildern zu analysieren, um die Nuancen zu verstehen und festzustellen, ob ein Video vorhanden ist [for example] Ob künstlerisch oder gewalttätig, Sie müssen in der Lage sein, die Art und Weise zu simulieren, wie ein menschlicher Moderator das Video anschaut. Das erreichen wir durch die Analyse von Text, Ton und Bild.“

Kunden geben ihre eigenen Parameter ein, was sie moderieren möchten (oder nicht), und Haco sagte, dass sie Unitary normalerweise zusammen mit einem menschlichen Team verwenden werden, das nun wiederum weniger Arbeit leisten und weniger Stress ausgesetzt sein wird.

„Multimodale“ Moderation scheint so offensichtlich; Warum wurde das nicht schon früher gemacht?

Haco sagte, ein Grund sei, dass „man mit dem älteren, rein visuellen Modell ziemlich weit kommen kann“. Es bedeutet jedoch, dass es eine Wachstumslücke im Markt gibt.

Die Realität ist, dass soziale Plattformen, Spieleunternehmen und andere digitale Kanäle, auf denen Medien von Benutzern geteilt werden, weiterhin vor Herausforderungen bei der Moderation von Inhalten stehen. In letzter Zeit haben Social-Media-Unternehmen dies getan signalisierte eine Abkehr von strengeren Moderationsrichtlinien; Faktenprüforganisationen sind an Dynamik verlieren; und es bleiben noch Fragen zum Thema Ethik Mäßigung, wenn es um schädliche Inhalte geht. Die Lust am Kämpfen hat nachgelassen.

Aber Haco hat eine interessante Erfolgsbilanz, wenn es um die Bearbeitung schwieriger, undurchschaubarer Themen geht. Vor Unitary AI arbeitete Haco – der in Quantenphysik promoviert hat – mit Stephen Hawking an der Erforschung von Schwarzen Löchern. Sie war dabei, als dieses Team mit dem Event Horizon Telescope das erste Bild eines Schwarzen Lochs aufnahm, aber sie verspürte den Drang, ihren Fokus auf die Arbeit an erdgebundenen Problemen zu verlagern, die genauso schwer zu verstehen sein können wie ein Raumzeit-Schwerkraftmonster.

Ihre „Erleuchtung“, sagte sie, sei, dass es so viele Produkte in der Content-Moderation gebe, so viel Lärm, aber noch nichts entspreche auch nur so sehr dem, was die Kunden tatsächlich wollten.

Thewlis‘ Fachwissen kommt inzwischen direkt bei Unitary zum Einsatz: Er hat auch einen Doktortitel in Computer Vision von Oxford, wo sein Spezialgebiet „Methoden für visuelles Verständnis mit weniger manueller Annotation“ waren.

(„Unitär“ ist meiner Meinung nach eine doppelte Referenz. Das Startup vereinheitlicht eine Reihe verschiedener Parameter, um Videos besser zu verstehen. Es könnte sich aber auch auf Hacos frühere Karriere beziehen: Einheitliche Operatoren werden zur Beschreibung eines Quantenzustands verwendet, der an sich ist kompliziert und unvorhersehbar – genau wie Online-Inhalte und Menschen.)

Multimodale Forschung im Bereich KI wird seit Jahren betrieben. Aber wir scheinen in eine Ära einzutreten, in der wir beginnen werden, viel mehr Anwendungen des Konzepts zu sehen. Ein typisches Beispiel: Erst letzte Woche bezog sich Meta in seiner Connect-Keynote, in der er eine Vorschau auf seine neuen KI-Assistenten-Tools vorstellte, mehrfach auf multimodale KI. Unitary überspannt somit die interessante Schnittstelle zwischen Spitzenforschung und realer Anwendung.

„Wir haben Sasha und James vor zwei Jahren zum ersten Mal getroffen und waren unglaublich beeindruckt“, sagte Gemma Bloemen, Direktorin bei Creandum und Vorstandsmitglied, in einer Erklärung. „Unitary hat sich als klarer Vorreiter im wichtigen KI-Bereich der Inhaltssicherheit herausgestellt, und wir freuen uns sehr, dieses außergewöhnliche Team bei der weiteren Beschleunigung und Innovation der Inhaltsklassifizierungstechnologie zu unterstützen.“

„Uniary verfügte von Anfang an über die leistungsstärkste KI zur Klassifizierung schädlicher Inhalte. Bereits in diesem Jahr ist das Unternehmen auf einen ARR im siebenstelligen Bereich gestiegen, was in diesem frühen Stadium der Reise fast noch nie dagewesen ist“, sagte Ian Hogarth, Partner bei Plural und auch Vorstandsmitglied.

tch-1-tech