Der größte Teil des Fokus in der generativen KI lag auf textbasierten Schnittstellen, die zum Generieren von Text, Bildern und mehr verwendet wurden. Die nächste Welle scheint Stimme zu sein und rollt schnell ein. In der jüngsten Entwicklung gab Google heute an, dass es ab nächster Woche Chirp 3-seine Modelle für Sprach- und Text- und HD-Text-zu-Sprache-zu seiner Vertex-AI-Entwicklungsplattform hinzufügen würde.
Letzte Woche, Google kündigte leise an Dieser Chirp 3 würde 8 neue Stimmen für 31 Sprachen einführen. Zu den Anwendungsfällen für die Plattform gehören das Erstellen von Sprachassistenten, das Erstellen von Hörbüchern, die Entwicklung von Unterstützungsagenten und Sprachbekenntnissen für Videos. Die Nachrichten wurden bei einer Veranstaltung in den DeepMind Offices von Google in London bekannt gegeben.
Die Bemühungen kommen zur gleichen Zeit, dass auch andere mit ihrer Sprachki -Arbeit vorwärts springen. Letzte Woche kündigte Sesame – das Startup hinter den Virus, sehr realistisch klingenden AI -Apps „Maya“ und „Miles“ – die Einführung ihres Modells für Entwickler an, um ihre eigenen individuellen Apps und Dienste über die Technologie zu erstellen.
Insbesondere wird es in Chirp 3 Nutzungsbeschränkungen geben, um zu versuchen, Missbrauch in den Griff zu bekommen. „Wir arbeiten nur einige dieser Dinge mit unserem Sicherheitsteam durch“, sagte Thomas Kurian, CEO von Google Cloud, heute bei einer Nachrichtenereignis.
ElfLabs gehört zu den wichtigsten Startups, die Hunderte von Millionen Finanzmitteln erhöht haben, um ihre Arbeit in AI -Sprachdiensten zu erweitern.
Die Nachrichten werden Chirp 3 in das gleiche Stall wie neuere Versionen seines Flaggschiffs LLM, Gemini, die getestet werden, sowie seines Bild-Generation-Modells Imagin und des teuren Veo 2-Videogenerierungswerkzeugs einbringen.
Es bleibt zu bestätigen, ob das, was Google mit Chirp 3 veröffentlichen, genauso „realistisch“ sein wird wie einige der anderen KI -Bemühungen, „menschliche“ Stimmen zu erstellen (Sesams Arbeit fällt insbesondere auf). Aber wie Demis Hassabis, der CEO von DeepMind, betonte, bleibt dies ein Marathon, kein Sprint.
„In naher Sicht… diese Idee das [AI is] Eine silberne Kugel für alles in den nächsten Jahren, ich sehe das noch nicht. Denken Sie, wir sind noch einige Jahre von so etwas wie Agi entfernt “, sagte er. „Es wird die Dinge ändern… im nächsten Jahrzehnt, also das Medium bis längerfristig. Es ist einer dieser interessanten Momente in der Zeit. “
Google hat die Vertex AI im Jahr 2021 als Plattform für Entwickler gestartet, um maschinelle Lerndienste in der Cloud zu erstellen. Das war natürlich lange vor der Explosion des Interesses an KI und insbesondere der generativen KI mit dem Start der GPT -Dienste von OpenAI.
Seitdem hat sich das Unternehmen zum Teil in die Scheitelpunktki beanstandet, während es einholt wird andere Unternehmen Wie Microsoft und Amazon bauen sie auch generative KI -Tools für Entwickler auf. Neben der Erstellung generativer KI über Gemini können Entwickler die Scheitelpunkt -AI verwenden, um Daten zu klassifizieren, Modelle zu trainieren und Modelle für die Produktion einzurichten. Es wird interessant sein, ob es sich bewegt, um seinen ummauerten Garten auf Modelle zu erweitern, die über die von Google selbst erstellten hinausgehen.
Google erstellt seit Jahren „Chirp“ -Sprachdienste und kehrte wieder auf den Namen als Codename für seine frühen Bemühungen, gegen den Amazon -Alexa -Service zu konkurrieren.