D-ID, das in Tel Aviv ansässige Startup, das vor allem als Technologie hinter diesen viralen Videos mit animierten Familienfotos bekannt ist, bringt seine KI-Videotechnologie in eine neue mobile App, die heute auf den Markt kommt. Ursprünglich als Webplattform verfügbar, D-IDs Creative Reality Studio ermöglicht es Benutzern, ein Standbild und ein Skript hochzuladen und diese dann in ein KI-generiertes Video umzuwandeln. Mit der Technologie können digitale Darstellungen von sich selbst, historischen Persönlichkeiten, fiktiven Charakteren, Moderatoren oder Markenbotschaftern erstellt werden.
Frühe Anwendungsfälle, auf die das Unternehmen abzielte, umfassten Unternehmensschulungen und -schulungen, interne und externe Kommunikation von Unternehmen sowie Produktmarketing und -verkäufe, wie Tech zuvor berichtete.
Jetzt auf Mobilgeräten verfügbar, können Benutzer die D-ID-App von herunterladen Appstore oder Google Play und erstellen Sie dann ein Konto oder melden Sie sich an, falls Sie bereits registriert sind. Auf dem Auswahlbildschirm können Sie entweder eine vorgefertigte „digitale Person“ auswählen, die D-ID bereitstellt, oder ein Bild aus der Fotobibliothek Ihres Telefons hochladen. Anschließend geben Sie den Text ein, den die digitale Person sagen soll. Wählen Sie aus 119 Sprachen und wählen Sie zwischen männlichen und weiblichen Sprachoptionen. Sie können auch den Ton der Rede wählen – z. B. fröhlich, aufgeregt, freundlich, hoffnungsvoll, Nachrichtensendung, traurig, verängstigt schreiend, unfreundlich, flüsternd und andere.
Um zu funktionieren, nutzt D-ID eine Mischung aus proprietären und Open-Source-KI-Technologien, um seine Plattformen zu betreiben, sagt Gil Perry, CEO von D-ID.
„Im Kern liegt ein grundlegendes Modell, das in der Lage ist, Videobilder basierend auf Audioeingaben zu generieren. Alle seine Produkte basieren auf seiner robusten API mit der Fähigkeit, Videos mit branchenführenden 100 FPS zu rendern, viermal schneller als Echtzeit-Rendering“, sagt er.
„Das Kernpublikum sind KI-Enthusiasten, aber es ist für jeden relevant, der Videos mit digitalen Menschen veröffentlichen möchte, entweder Versionen von sich selbst oder von jedem, den sie sich vorstellen können – historische Charaktere, fiktive Charaktere, Vorfahren usw.“, sagt Perry. „Die App ermöglicht die Videoerstellung unterwegs, senkt die Produktionskosten im großen Maßstab und bietet die Flexibilität, Videos überall zu produzieren.“
Die Videos können bis zu 10 Minuten lang sein und unterliegen der gleichen Regelung Mäßigung Richtlinien wie die Webversion – das bedeutet, dass das Unternehmen daran arbeitet, sicherzustellen, dass die Technologie nicht für Deepfakes verwendet wird, die Fehlinformationen und Desinformationskampagnen verbreiten. Das Unternehmen hat verpflichtete sich außerdem, das Urheberrecht zu respektieren, die KI-Vorschriften einzuhalten und seine Technologie nicht wissentlich zu lizenzieren auf sogenannte „umstrittene Bereiche“, darunter politische Parteien, Pornografieverlage, Terrororganisationen und Waffen- oder Waffenhersteller.
Vor dem mobilen Start verzeichnete die Desktop-Version von Creative Reality Studio 60.000 neue Anmeldungen pro Tag, wobei bereits über 150 Millionen Videos über die Plattform erstellt wurden, erzählt uns Perry. Darüber hinaus hat die API für den Dienst mehr als 200.000 Benutzer.
Mit der Einführung auf Mobilgeräten ist D-ID in der Lage, einen breiteren Markt zu erreichen, einschließlich Benutzer, die „Mobile First“ oder „Only Mobile“ bevorzugen. Dazu gehören sowohl bestehende Nutzer, die an einer schlankeren Version des Studios für mobile Geräte interessiert sind, als auch neue Nutzer aus der breiten Öffentlichkeit, darunter auch Verbraucher.
Der neue Mobilfunkdienst wird abonnementbasiert sein, die Tarife beginnen bei 5,99 $ pro Monat. Benutzer, die bereits die Desktop-Version abonniert haben, können ihre bestehenden Pläne behalten. Eine 14-tägige kostenlose Testversion ist ebenfalls verfügbar.
Obwohl D-ID seinen Hauptsitz in Tel Aviv hat, beschäftigt es Mitarbeiter in anderen Märkten rund um die Arbeit, was es dem Unternehmen ermöglicht, den Betrieb während des Israel-Hamas-Krieges fortzusetzen.
„Unsere Teams in Israel und auf der ganzen Welt arbeiten daran, ein Höchstmaß an Support und Service zu gewährleisten“, sagt Perry. „Es sollte beachtet werden, dass unser Team in der Ukraine aus großer Solidarität mit der Situation in Israel mit besonderer Sorgfalt vorgeht“, fügt er hinzu.
D-ID hat letztes Jahr nach dem Start seines Deep Nostalgia-Projekts und seines Spin-offs LiveStory eine Serie-B-Finanzierung im Wert von 25 Millionen US-Dollar eingesammelt. Bei diesen beiden Projekten handelte es sich um die Animation historischer Fotos von Familienmitgliedern, wobei letzteres Audio hinzufügte. Die Videos gingen viral, da Menschen die Technologie nutzten, um sprechende Fotos von längst verlorenen Angehörigen oder Vorfahren zu erstellen. Seitdem arbeitet D-ID im Rahmen seiner umfassenderen KI-Entwicklungsbemühungen auch daran, eine fotorealistische Schnittstelle für ChatGPT sowie seine Creative Reality Studio-Software zu erstellen.