Sprach-KI-Startup ElfLabs hat am Mittwoch eine Funktion eingeführt, mit der Sie verschiedene Arten von Inhalten hochladen können, um einen Multi-Speaker-Podcast für Sie zu erstellen, ähnlich wie Googles NotebookLM.
Die Funktion namens GenFM ist in der iOS-App ElevenLabs Reader des Unternehmens zu finden. Derzeit unterstützt GenFM 32 Sprachen, darunter Englisch, Hindi, Portugiesisch, Chinesisch, Spanisch, Französisch, Deutsch, Japanisch und andere.
Um GenFM zu nutzen, laden Sie zunächst ein YouTube-Video, einen Text oder ein Dokument hoch. Die App wählt dann automatisch zwei Stimmen aus, um einen Podcast zu erstellen. Das Unternehmen stellt fest, dass über ein Dutzend Stimmen verfügbar sind.
Einer der interessanten Bildschirme, die Sie möglicherweise sehen, wenn die App einen KI-generierten Podcast vorbereitet, ist „Einige Umms einstreuen“ und „Einige nachdenkliche Pausen hinzufügen“. In einer Zeit, in der Tools Menschen dabei helfen, „Ähm“ und „Ah“ zu entfernen, fügt ElevenLabs seinem KI-generierten Podcast menschliche Elemente hinzu.
„Wir haben darüber debattiert, wie viele ‚ähm‘, ‚ahs‘, ‚mhmms‘/Lachen/Atemgeräusche ähnlicher menschlicher Dialogfüller oder Überlagerungen eingefügt werden sollten – wir streben danach, die richtige Balance zwischen natürlicher, menschlicher Konversation und der Bereitstellung von Nutzen aus dem Inhalt zu finden „, sagte Jack McDermott, der sich bei ElevenLabs um das mobile Wachstum kümmert, per E-Mail gegenüber Tech.
„Wenn wir uns die außergewöhnlichen Langform-Podcasts da draußen ansehen, stellen wir fest [fewer] Unterbrechungen und ein natürlicherer, aufschlussreicherer Gesprächsfluss“, sagte er. „Diese Art von Erfahrung ist letztendlich das, was wir anstreben und gleichzeitig Audio-Erzählungen für alle Stimmen und Sprachen zugänglicher zu machen.“
Für die Zukunft plant ElevenLabs, mehr Anpassungen zu unterstützen und die Möglichkeit zu bieten, mehrere Quellen hinzuzufügen, um einen generativen KI-Podcast zu erstellen.
Im September startete Google die Möglichkeit, KI-generierte Gespräche zu erstellen mit NotebookLM aus den von Ihnen bereitgestellten Quellen. Einen Monat später fügte das Unternehmen den Benutzern die Möglichkeit hinzu, diese KI-generierten Podcast-Ausgaben anzupassen.
Anfang dieses Monats gab ElevenLabs seine Investition bekannt 11 Millionen US-Dollar in das polnische Startup-Ökosystem und die Eröffnung eines Büros in Warschau, das als Forschungs- und Entwicklungszentrum des Unternehmens dienen wird, um lokale KI-Talente anzuziehen. Das sagte das Startup auch Expansion nach Indienwo es einen Geschäftsleiter eingestellt hat und nun ein Team aufbaut. Das Unternehmen führte außerdem Konversations-KI-Agenten für seine Kunden ein.