Die von a16z, Kleiner Perkins und Sequoia Capital unterstützte Videobearbeitungs-App Captions hat eine neue Funktion eingeführt, die ein vorhandenes, unbearbeitetes Video nimmt und basierend auf dem Inhalt benutzerdefinierte Grafiken, Zooms, Musik, Soundeffekte, Übergänge und bewegte Hintergründe hinzufügt.
Für die KI-Bearbeitung gelten einige Einschränkungen: Es sollte sich um ein vertikales Video einer sprechenden Person handeln, wobei sich nur eine Person im Bild befindet.
Der entscheidende Teil ist, dass Sie, auch wenn Sie keine solchen Videos haben oder dies nicht Ihr Stil der Videoaufnahme ist, die KI-Avatare von Captions verwenden können, um ein Video mit einer kurzen Eingabeaufforderung zu erstellen und dieses Video später der KI-Bearbeitungsfunktion zuzuführen, um in wenigen Minuten ein vollständig bearbeitetes Video mit verschiedenen Übergängen und Effekten zu erhalten.
Gaurav Misra, Mitbegründer und CEO von Captions, sagte gegenüber Tech, dass er, als er Snap 2021 verließ, darüber nachdachte, den Prozess der Videoerstellung mit dem Kernzweck der Kommunikation zu vereinfachen.
„Unser Hauptziel war es, den Menschen zu ermöglichen, eine Botschaft zu übermitteln. Wenn man darüber nachdenkt, was man braucht, um in einem Video das zu sagen, was man sagen möchte, ist das kompliziert. Es beginnt mit der Idee, was ich eigentlich sagen möchte, dem Vorbereiten des Skripts, dem Aufnehmen des Videos und dem Bearbeiten, um den Clip ansprechend zu gestalten“, sagte er in Bezug auf die Idee hinter dem Aufbau einer Pipeline von Funktionen mithilfe von KI zur Erstellung von Videos.
Nutzung von KI zur Erstellung von Videos
Misra sagte, dass das Unternehmen mit Captions den Menschen drei Arten von Videoaufzeichnungstools zur Verfügung stellen möchte. Erstens zielt es darauf ab, das beste Kamera-Toolkit zur Unterstützung der Aufnahme bereitzustellen. Zweitens bietet es auch Bearbeitungstools wie KI-gestützte Korrekturen für manuell aufgezeichnete Videos. Und schließlich verfügt Captions über eine generative Ebene, bei der ein Benutzer überhaupt kein Video aufnehmen muss.
Das Unternehmen bietet derzeit 12 KI-Charaktere an. Doch künftig will das Unternehmen jede Woche drei bis vier Charaktere zu seinem Portfolio hinzufügen. Das Ziel des Startups ist es, dass Benutzer letztendlich ihre eigenen KI-Ersteller erstellen können.
Misra sieht, dass diese Tools hauptsächlich von verbraucherorientierten Unternehmen für Vertriebs-, Marketing- und Kommunikationskanäle verwendet werden. Unternehmen wie D-ID und Synthesia ermöglichen es Organisationen, digitale Avatare für Videos zu erstellen. Anfang dieses Monats ermöglichte TikTok seinen Entwicklern auch die Erstellung von KI-Avataren und bot seinen eigenen KI-Charakter für Anzeigen an. Misra glaubt, dass Captions eine bessere Qualität bietet und dass Sie auf dem Telefon auf alle Tools zur Videoerstellung zugreifen können.
Die Spannung zwischen KI und Entwicklern
Der Funktionsumfang der Captions-App macht es wirklich einfach, Videos zu erstellen. Wir haben das folgende Video nur mit der Aufforderung „Gefahren der KI für Entwickler“ erstellt und ein paar Schaltflächen zum Erstellen und Bearbeiten angetippt. Es ist irgendwie irritierend, einen KI-Avatar über die Gefahren der KI sprechen zu hören.
Mit diesen Tools können die Leute die sozialen Medien und das Internet ganz einfach mit Inhalten überfluten, egal ob diese gut oder schlecht sind. Das kann für Entwickler, die viele Stunden in die Erstellung von Inhalten investieren, ein Problem bei der Auffindbarkeit darstellen.
Misra räumt zwar ein, dass dies eine berechtigte Sorge ist, meint jedoch, dass die Leute, die KI-Tools verwenden, dennoch darauf achten müssen, dass das Video gute Inhalte hat und für die Leute von Interesse ist.
„Die Massenproduktion von Inhalten wäre möglich, aber um hervorzustechen, muss man eine einzigartige Botschaft oder Geschichte haben, und damit werden die Leute jetzt mehr Zeit verbringen. Mir hat gefallen, dass digitale Musik es einfacher macht, Musik zu machen, ohne ein Instrument zu spielen, aber anstatt die Qualität der Musik zu senken, können dadurch einfach mehr Menschen zu Musikern werden und die Kreativitätslatte wird höher gelegt“, sagte er.
Das Unternehmen plant, neue Funktionen für seine auf KI-Avataren basierenden Videokreationen herauszubringen, etwa eine Sketch-Funktion, bei der zwei (oder zwei gleiche) Avatare miteinander sprechen können.