Microsoft hat im KI-Wettrüsten eine neue Salve abgefeuert. OpenAI, der Schöpfer des beliebten Chatbots ChatGPT, hat angekündigt, mit der Einführung eines neuen künstlichen Intelligenzmodells namens GPT-4 zu beginnen. Das Startup, finanziert durch Microsoft Corp, sagte in einem Blogbeitrag, dass das neue Modell sowohl Text- als auch Bildeingaben verstehen, jedoch nur per Text antworten kann. In einem Forschungsblogbeitrag OpenAI sagte, die Unterscheidung zwischen GPT-4 und seinem Vorgänger GPT-3.5 sei in lockeren Gesprächen „subtil“ (GPT-3.5 ist das Modell, das ChatGPT antreibt). OpenAI sagte in dem Beitrag, dass GPT-4 in der Lage sein wird, Fotos zu lesen und zu erklären, was sich darin befindet.
GPT-4, um auch Bilder als Eingabeaufforderungen zu akzeptieren
„Es generiert Textausgaben bei Eingaben, die aus eingestreutem Text und Bildern bestehen“, fügte der Blog hinzu. nur Eingänge.“ Das bedeutet im Grunde, dass der KI-Chatbot nun analysieren kann, was sich auf einem Bild befindet.
„Auf dem Forschungsweg von GPTGPT-2 und GPT-3, unser Deep-Learning-Ansatz nutzt mehr Daten und mehr Berechnungen, um immer ausgefeiltere und leistungsfähigere Sprachmodelle zu erstellen“, fügte das Unternehmen hinzu. Es behauptete, dass GPT-4 schwierige Probleme mit größerer Genauigkeit lösen kann, dank sein breiteres Allgemeinwissen und Problemlösungsfähigkeiten.
GPT-4 soll auch kreativer und kollaborativer sein als je zuvor. „Es kann kreative und technische Schreibaufgaben wie das Komponieren von Songs, das Schreiben von Drehbüchern oder das Erlernen des Schreibstils eines Benutzers generieren, bearbeiten und mit Benutzern iterieren“, heißt es in dem Blogbeitrag.
GPT-4, um auch Bilder als Eingabeaufforderungen zu akzeptieren
„Es generiert Textausgaben bei Eingaben, die aus eingestreutem Text und Bildern bestehen“, fügte der Blog hinzu. nur Eingänge.“ Das bedeutet im Grunde, dass der KI-Chatbot nun analysieren kann, was sich auf einem Bild befindet.
„Auf dem Forschungsweg von GPTGPT-2 und GPT-3, unser Deep-Learning-Ansatz nutzt mehr Daten und mehr Berechnungen, um immer ausgefeiltere und leistungsfähigere Sprachmodelle zu erstellen“, fügte das Unternehmen hinzu. Es behauptete, dass GPT-4 schwierige Probleme mit größerer Genauigkeit lösen kann, dank sein breiteres Allgemeinwissen und Problemlösungsfähigkeiten.
GPT-4 soll auch kreativer und kollaborativer sein als je zuvor. „Es kann kreative und technische Schreibaufgaben wie das Komponieren von Songs, das Schreiben von Drehbüchern oder das Erlernen des Schreibstils eines Benutzers generieren, bearbeiten und mit Benutzern iterieren“, heißt es in dem Blogbeitrag.