Jensen Huang will generative KI in jedes Rechenzentrum zu bringen, das Nvidia sagte Mitbegründer und CEO heute während der Computex in Taipeh. Während der Rede, Huangs erster öffentlicher Rede seit fast vier Jahren, machte er, wie er sagte, eine Reihe von Ankündigungen, darunter Chip-Release-Termine, seinen Supercomputer DGX GH200 und Partnerschaften mit großen Unternehmen. Hier finden Sie alle Neuigkeiten der zweistündigen Keynote.
- Nvidias GForce RTX 4080 Ti GPU für Gamer ist mittlerweile in voller Produktion und wird in „großen Mengen“ mit Partnern in Taiwan produziert.
2. Huang kündigte die Nvidia Avatar Cloud Engine (ACE) für Spiele an, einen anpassbaren KI-Modell-Foundry-Service mit vorab trainierten Modellen für Spieleentwickler. Es wird NPCs durch KI-gestützte Sprachinteraktionen mehr Charakter verleihen.
3. Das Nvidia Cuda-Rechenmodell bedient mittlerweile vier Millionen Entwickler und mehr als 3.000 Anwendungen. Cuda verzeichnete 40 Millionen Downloads, davon allein im letzten Jahr 25 Millionen.
4. Die Serienproduktion des GPU-Servers HGX H100 hat begonnen und wird von „Unternehmen in ganz Taiwan“ hergestellt, sagte Huang. Er fügte hinzu, es sei der weltweit erste Computer, der über eine Transformator-Engine verfügt.
5. Huang bezeichnete Nvidias Übernahme des Supercomputer-Chipherstellers Mellanox im Jahr 2019 für 6,9 Milliarden US-Dollar als „eine der größten strategischen Entscheidungen“, die das Unternehmen je getroffen hat.
6. Die Produktion der nächsten Generation der Hopper-GPUs beginnt im August 2024, genau zwei Jahre nach Produktionsbeginn der ersten Generation.
7. Nvidias GH200 Grace Hopper ist jetzt in voller Produktion. Der Superchip unterstützt 4 PetaFIOPS TE, 72 Arm-CPUs, die über eine Chip-zu-Chip-Verbindung verbunden sind, 96 GB HBM3 und 576 GPU-Speicher. Huang beschrieb den weltweit ersten Prozessor für beschleunigtes Rechnen, der auch über einen riesigen Speicher verfügt: „Das ist ein Computer, kein Chip.“ Es ist für hochbelastbare Rechenzentrumsanwendungen konzipiert.
8. Wenn der Speicher des Grace Hopper nicht ausreicht, hat Nvidia die Lösung – den DGX GH200. Dazu werden zunächst acht Grace Hopper mit drei NVLINK-Switches verbunden und dann die Pods mit jeweils 900 GB miteinander verbunden. Schließlich werden 32 mit einer weiteren Schalterschicht zusammengefügt, um insgesamt 256 Grace Hopper-Chips zu verbinden. Die resultierende ExaFLOPS Transformer Engine verfügt über 144 TB GPU-Speicher und fungiert als riesige GPU. Huang sagte, der Grace Hopper sei so schnell, dass er den 5G-Stack in Software ausführen könne. Google Cloud, Meta und Microsoft werden die ersten Unternehmen sein, die Zugang zum DGX GH200 haben und dessen Fähigkeiten erforschen werden.
9. Nvidia und SoftBank sind eine Partnerschaft eingegangen, um den Grace Hopper-Superchip in den neuen verteilten Rechenzentren von SoftBank in Japan einzuführen. Sie werden in der Lage sein, generative KI- und drahtlose Anwendungen auf einer mandantenfähigen gemeinsamen Serverplattform zu hosten und so Kosten und Energie zu senken.
10. Die SoftBank-Nvidia-Partnerschaft basiert auf der Nvidia MGX-Referenzarchitektur, die derzeit in Partnerschaft mit Unternehmen in Taiwan verwendet wird. Es bietet Systemherstellern eine modulare Referenzarchitektur, die ihnen beim Aufbau von mehr als 100 Servervarianten für KI, beschleunigtes Computing und Omniversum-Anwendungen hilft. Zu den Unternehmen der Partnerschaft gehören ASRock Rack, Asus, Gigabyte, Pegatron, QCT und Supermicro.
11. Huang kündigte die beschleunigte Netzwerkplattform Spectrum-X an, um die Geschwindigkeit Ethernet-basierter Clouds zu erhöhen. Es umfasst den Spectrum 4-Switch, der über 128 Ports mit 400 GB pro Sekunde und 51,2 T pro Sekunde verfügt. Laut Huang soll der Switch eine neue Art von Ethernet ermöglichen und durchgängig für adaptives Routing, Leistungsisolierung und In-Fabric-Computing ausgelegt sein. Es enthält außerdem den Bluefield 3 Smart Nic, der zur Überlastungskontrolle mit dem Spectrum 4-Switch verbunden wird.
12. WPP, die größte Werbeagentur der Welt, hat sich mit Nvidia zusammengetan, um eine Content-Engine auf Basis von Nvidia Omniverse zu entwickeln. Es wird in der Lage sein, Fotos und Videoinhalte für die Werbung zu produzieren.
13. Die Roboterplattform Nvidia Isaac ARM ist jetzt für alle verfügbar, die Roboter bauen möchten, und zwar komplett, vom Chip bis zum Sensor. Isaac ARM startet mit einem Chip namens Nova Orin und ist der erste Robotik-Vollreferenz-Stack, sagte Huang.
Vor allem dank seiner Bedeutung im KI-Computing ist die Aktie von Nvidia im vergangenen Jahr stark gestiegen und hat derzeit eine Marktbewertung von rund 960 Milliarden US-Dollar, was das Unternehmen zu einem der wertvollsten Unternehmen der Welt macht (nur Apple, Microsoft, Saudi-Arabien). Aramco, Alphabet und Amazon liegen höher im Ranking.