Google hat am Donnerstag die Audiozusammenfassungsfunktion seines KI-Notiz- und Rechercheassistenten NotebookLM aktualisiert, der kürzlich große Aufmerksamkeit auf sich gezogen hat Podcast-artig Audio-Gespräche basierend auf den Inhalten, die Benutzer teilen, mit der Möglichkeit, diese Gespräche zu leiten und sich auf bestimmte Themen zu konzentrieren, anstatt nur ganzheitliche Audio-Zusammenfassungen zu erstellen.
Heutzutage ermöglichen Audioübersichten in NotebookLM Benutzern, die Informationen in langen Dokumenten oder Videos durch KI-generierte Audiogespräche zu verarbeiten und zu verstehen. Kurz nach der Einführung im letzten Monat verhalf die Funktion NotebookLM zu Aufmerksamkeit, da viele damit begannen, Audiozusammenfassungen ihrer Inhalte in sozialen Medien zu teilen, darunter auch solche, die mit ihnen erstellt wurden Tagebücher oder Zeitschriften.
Google hat zwar nicht bekannt gegeben, welche Anziehungskraft NotebookLM dadurch erhalten hat, Daten von der Website-Traffic-Analyseplattform ÄhnlichesWeb schlägt vor, dass NotebookLM im September einen Anstieg des Datenverkehrs um über 371 % auf 3,07 Millionen monatliche Besuche verzeichnete, gegenüber 652.181 vor einem Monat.
Bisher generierten Audioübersichten automatisch KI-Gespräche aus den Quellen der Benutzer. Da sich Gespräche jedoch manchmal um unwichtige Inhalte drehen, stellt Google ein Update vor, mit dem Sie die Übersichten an Ihre Bedürfnisse anpassen können. Dadurch können Benutzer den Ton stärker auf ein bestimmtes Thema in ihren Inhalten konzentrieren.
Vor der vorhandenen Schaltfläche „Generieren“ ist ein spezielles Steuerelement „Anpassen“ verfügbar, mit dem Sie den KI-Moderatoren im Audio Anweisungen geben können, sich auf einen bestimmten Punkt zu konzentrieren.
Raiza Martin, Produktleiterin von NotebookLM und leitende Produktmanagerin für KI bei Google Labs, sagte gegenüber Tech, dass das Update Benutzern die Möglichkeit gibt, die KI in die gewünschte Richtung zu bewegen.
„Das gesamte Team hat sich intensiv damit beschäftigt, alle Rückmeldungen, die wir erhalten haben, anzuhören und zu analysieren. Und die wichtigste Funktion, die sich die Leute gewünscht haben, war einfach, der KI einen kleinen Schubs zu geben“, sagte sie.
Das Anpassen von Audiozusammenfassungen kann auch dazu beitragen, Halluzinationen bis zu einem gewissen Grad zu reduzieren, d. h. die Fälle, in denen die KI selbst Inhalte kocht. Dennoch, so Martin, verfolge das NotebookLM-Team das Feedback der Benutzer und versuche, Halluzinationen so schnell wie möglich zu erkennen.
Sie betonte außerdem, dass die Anpassung von Audiozusammenfassungen nicht bedeute, dass Benutzeranweisungen zum Trainieren des KI-Modells verwendet würden.
„Im Allgemeinen trainieren wir nicht anhand von Benutzerdaten. Ganz gleich, wie Sie es verwenden oder welche Fragen Sie eingeben, welche Antworten Sie auch immer eingeben, wir trainieren die Modelle nicht damit“, sagte sie und fügte hinzu: „Wir holen viel Feedback von unseren Benutzern ein.“
Neben der Anpassungsoption erhalten Benutzer Hintergrundhören in Audioübersichten. Dadurch können Sie in NotebookLM weiterarbeiten, Ihre Quellen abfragen, Zitate erhalten und relevante Zitate erkunden, während der Ton im Hintergrund abgespielt wird.
NotebookLM wurde letztes Jahr ursprünglich als Projekt auf der I/O-Entwicklerkonferenz von Google vorgestellt und im Dezember in den USA erstmals öffentlich zugänglich gemacht. Im Juni expandierte das Unternehmen auf Märkte wie Indien, Großbritannien und mehr als 200 Länder. Obwohl das Produkt zunächst in Anwendungsfällen im Bildungs- und Forschungsbereich eine gewisse Akzeptanz fand, begannen Unternehmen und Organisationen erst damit, es auszuprobieren, nachdem Google seine Unterstützung für weitere Quellen ausgeweitet und neue Funktionen hinzugefügt hatte.
Mittlerweile nutzen laut Google mehr als 80.000 Organisationen NotebookLM und sehen darin eine Chance, die Monetarisierung auszuloten. In der Hoffnung, von dieser Dynamik zu profitieren, startete das Unternehmen am Donnerstag das Pilotprogramm NotebookLM Business.
Unternehmen können sich für das Pilotprojekt bewerben. Wenn sie angenommen werden, erhalten sie laut Google frühzeitig Zugriff auf Produktfunktionen, Schulungen und E-Mail-Support.
Martin sagte gegenüber Tech, dass ihr Team im Rahmen des Business-Pilotprojekts Organisationen, die an der Nutzung von NotebookLM interessiert sind, darin schult, wie andere Unternehmen es nutzen.
„Wir [also] Wir möchten, dass Unternehmen uns mitteilen, welche Funktionen wir bereitstellen möchten“, sagte sie.
Die allgemeine Verfügbarkeit und Preise von NotebookLM Business werden später in diesem Jahr bekannt gegeben. Den genauen Zeitplan und Einzelheiten zu den Preisstufen hat Google jedoch noch nicht bekannt gegeben.
Laut SimilarWeb verzeichnet NotebookLM derzeit 4,17 Millionen monatliche Besuche, davon 2,5 Millionen über Desktops und 1,6 Millionen über Mobilgeräte.
Der Assistent verfügt derzeit über keine eigene mobile App und ist über seine Website auf allen Bildschirmen verfügbar. Allerdings sagte Martin gegenüber Tech, dass das Team aktiv an einer nativen mobilen Erfahrung erforscht, um die Präsenz von NotebookLM bei Smartphone-Nutzern zu erweitern. Außerdem werden weitere Stimmen, Sprachen und Steuerelemente für Audioübersichten untersucht.
Darüber hinaus untersuchte und prototypisierte das Team eine unterschiedliche Anzahl von Lautsprechern – um über die vorhandenen zwei Lautsprecher für KI-Audiodiskussionen hinauszugehen – obwohl es wahrscheinlich nicht bald verfügbar sein wird, da Martin sagte, dass es nicht die von Benutzern am häufigsten nachgefragte Funktion sei.
Letzten Monat hat NotebookLM neben bestehenden Quellen wie Google Drive, URLs, PDFs und Text auch YouTube-Videos und Audiodateien als Quellen für die Erstellung von Zusammenfassungen hinzugefügt.
Laut Martin sieht NotebookLM PDFs und YouTube-Videos als die beiden wichtigsten Quellen. Das Team beobachtete außerdem einen „sehr hohen Prozentsatz“ von Benutzern, die sich eine Audioübersicht anhörten und den Chat nutzten. Die nächstgrößere Gruppe bilden Nutzer, die nur den Chat nutzen, ohne eine Audioübersicht zu generieren.