xAI, das zu Elon Musk gehört, hat sein Grok-KI-Modell um Bildverständnisfunktionen erweitert. Damit können zahlende Benutzer der sozialen Plattform X ein Bild hochladen und dem KI-Chatbot Fragen dazu stellen.
Einer von die xAI-Mitarbeiter und das offizielle Grok-Handle, das zu diesem Update auf X veröffentlicht wurde.
In ein separater BeitragMusk sagte, dass Grok durch die neue Bildverständnisfunktion sogar die Bedeutung eines Witzes erklären kann. Er fügte hinzu, dass sich die Funktionalität noch im Anfangsstadium befinde und sich im Laufe der Zeit verbessern werde.
Im August veröffentlichte Musks KI-Unternehmen Grok-2 als Modell und in Form eines Chatbots für Premium-Nutzer auf X. Der Chatbot im sozialen Netzwerk erhielt mithilfe des FLUX.1-Modells von Black Forest Labs auch Funktionen zur Bildgenerierung.
Damals gab xAI bekannt, dass es als Teil der Erfahrung von Grok mit X und der Entwickler-API multimodales Verständnis veröffentlichen würde.
Grok könnte die Dokumente bald auch verstehen. In eine Antwort Auf das Feedback eines Benutzers, dass Grok nicht in der Lage sei, mit Fotos oder PDFs umzugehen, sagte Musk: „Nicht mehr lange. Wir sind in Monaten fertig, wofür alle anderen Jahre brauchten.“
Das soziale Netzwerk hat versucht, den KI-Chatbot und die kostenpflichtigen Benutzerstufen um weitere Funktionen zu erweitern, um das Angebot attraktiver zu machen. Anfang dieses Monats hat X ein neues Tool namens Radar für Premium+-Abonnenten eingeführt, um Trends in Echtzeit zu beobachten und Einblicke in Gespräche zu geben.