Google experimentiert mit einem neuen Bildgenerator, der drei Bilder zu einer Kreation zusammenfügt

Google Labs, Googles experimenteller Zweig, ist es Testen eines neuen Bildgenerators namens Whisk. Mit diesem Tool können Benutzer Bilder anstelle von Text eingeben und so ein Foto neu mischen, indem sie das Motiv, die Szene und den Stil ändern.

Whisk verwendet Googles Bildgenerierungsmodell Imagen 3, um drei Bilder zu kombinieren: eines für das Motiv, eines für die Szene und eines für den Stil. Sie können beispielsweise ein Foto von sich selbst als Motiv, eine futuristische Landschaft als Szene und einen Anime-Stil für den endgültigen Look auswählen.

Das Modell generiert automatisch eine detaillierte Bildunterschrift Ihrer Bilder, die Imagen 3 dann bei der Erstellung eines Remixes des Fotos unterstützt. Sie können auch Textaufforderungen eingeben, um das gewünschte Ergebnis weiter zu definieren, einschließlich detaillierter Beschreibungen wie „Thema fährt ein fliegendes Fahrrad“.

Da sich Whisk nur auf einige Schlüsselmerkmale jedes Bildes konzentriert, erklärt das Unternehmen, dass die Ergebnisse möglicherweise nicht immer Ihren Erwartungen entsprechen. Das generierte Motiv könnte sich beispielsweise in Größe, Gewicht, Frisur oder Hautton unterscheiden. Laut Google können Sie die zugrunde liegenden Eingabeaufforderungen jederzeit anzeigen und bearbeiten.

Das Experiment ist derzeit nur für Benutzer mit Sitz in den USA unter verfügbar labs.google/whisk.

tch-1-tech