Schlagwort: multimodale KI
Meta aktualisiert seine Datenbrillen mit Echtzeit-KI-Video
Die Ray-Ban Meta-Datenbrille von Meta ist auf dem Vormarsch mehrere neue KI-gestützte Upgradeseinschließlich der Fähigkeit, ein fortlaufendes Gespräch zu führen und zwischen Sprachen zu übersetzen. Ray-Ban Meta-Besitzer im Meta-Early-Access-Programm für…
OpenAI führt den Advanced Voice Mode mit mehr Stimmen und einem neuen Look ein
OpenAI angekündigt Am Dienstag wird der Advanced Voice Mode (AVM) für einen erweiterten Kreis zahlender ChatGPT-Kunden eingeführt. Die Audiofunktion, die das Sprechen mit ChatGPT natürlicher macht, wird zunächst für Kunden…
Sind „visuelle“ KI-Modelle tatsächlich blind?
Die neuesten Sprachmodelle wie GPT-4o und Gemini 1.5 Pro werden als „multimodal“ angepriesen und können Bilder und Audio ebenso gut verstehen wie Text – aber eine neue Studie macht deutlich,…