Während eines Livestreams am Dienstag kündigte Sam Altman, CEO von OpenAI, das erste große Upgrade der Bild-Generation-Funktionen von Chatgpt seit über einem Jahr an.
Chatgpt kann jetzt das GPT-4O-Modell des Unternehmens nutzen, um Bilder und Fotos nativ zu erstellen und zu ändern. GPT-4O hat die Chatbot-Plattform mit KI-angetriebener Chatbot lange untermauert, aber bisher konnte das Modell nur Text generieren und bearbeiten-keine Bilder.
Altman sagte, dass die Native Image Generation von GPT-4O heute in Chatgpt und Sora, OpenAs AI-Video-Generation-Produkt, für Abonnenten des 200 US-Dollar pro Monat Pro-Plan live ist. Laut OpenAI wird die Funktion in Kürze zu Plus- und kostenlosen Benutzern von ChatGPT sowie den Entwicklern des API -Dienstes des Unternehmens ausgelöst.
GPT-4O mit Bildausgabe „denkt“ etwas länger als das Bild-Generation-Modell, das es effektiv ersetzt, dall-e 3, um das zu machen, was OpenAI als genauere und detailliertere Bilder beschreibt. GPT-4O kann vorhandene Bilder bearbeiten, einschließlich Bildern mit Personen, die sie transformieren oder Details wie Vordergrund und Hintergrundobjekte „Inpainting“ verwandeln.
Um die neue Bildfunktion zu betreiben, teilte OpenAI dem mit Wall Street Journal Es hat GPT-4O für „öffentlich verfügbare Daten“ sowie proprietäre Daten aus seinen Partnerschaften mit Unternehmen wie Shutterstock ausgebildet.
Viele generative KI -Anbieter sehen Trainingsdaten als Wettbewerbsvorteil an, sodass sie sie und alle Informationen, die sich darauf in der Nähe der Brust beziehen, behalten. Trainingsdatendetails sind aber auch eine potenzielle Quelle für IP-bezogene Klagen, ein weiterer Anreiz für Unternehmen, viel offenbart zu werden.
„Wir respektieren die Rechte der Künstler in Bezug auf die Art und Weise, wie wir die Ausgabe ausführen, und wir haben Richtlinien vorhanden, die uns daran hindern, Bilder zu erzeugen, die die Arbeiten der lebenden Künstler direkt nachahmen“, sagte Brad Lightcap, Chief Operating Officer von OpenAI, in einer Erklärung des Journals.
OpenAI bietet ein Opt-out-Formular an, mit dem die Ersteller anfordern, ihre Arbeiten aus den Schulungsdatensätzen zu entfernen. Das Unternehmen sagt auch, dass es Anfragen respektiert, um seine Web-Scraping-Bots nicht zu verhindern, indem es Schulungsdaten, einschließlich der Bilder, von Websites sammelt.
Die aktualisierte Bild-Generation-Funktion von ChatGPT folgt auf den Fersen von Googles experimentellem nativem Bildausgang für Gemini 2.0 Flash, eines der Flaggschiff-Modelle des Unternehmens. Das leistungsstarke Feature wurde in den sozialen Medien viral – aber nicht unbedingt aus den besten Gründen. Die Bildkomponente von Gemini 2.0 Flash stellte sich heraus, dass es nur wenige Leitplanken hatte, sodass Menschen Wasserzeichen entfernen und Bilder erstellen konnten, die urheberrechtlich geschützte Zeichen darstellen.
Dieser Artikel wurde um 12 Uhr PT aktualisiert, um die Erklärung von OpenAI in das Wall Street Journal rund um die Trainingsdaten von GPT-4O aufzunehmen.