Bei der hauseigenen GTC, GPU Technology Conference, hat Nvidia die GeForce-RTX-40-Serie und DLSS 3 angekündigt. Die 40er-Serie löst die seit 2020 auf dem Markt befindliche Ampere-Architektur ab, auf der die RTX-30-Grafikkarten basieren. AMD hat sich kurz vor der Präsentation übrigens mit einem Blog-Beitrag über stromsparende Designs für mehr Grafikleistung zu Wort gemeldet und die Vorstellung der eigenen RDNA-3-Grafikkarten für den 3. November terminiert.

Die neuen Nvidia-Grafikprozessoren basieren auf der Ada-Lovelace-Architektur. "Das Zeitalter von RTX-Raytracing und Neural Rendering ist in vollem Gange und unsere neue Ada-Lovelace-Architektur bringt es auf die nächste Stufe", sagt Jensen Huang, Gründer und CEO von Nvidia. "Ada bietet einen Quantensprung für Gamer und ebnet für Entwickler den Weg vollständig simulierter Welten. Mit einer bis zu vierfachen Leistung im Vergleich zur vorherigen Generation setzt Ada einen neuen Standard für die Branche".

Grundsätzlich soll die Shader-Leistung um mehr als das Doppelte und die Raytracing-Leistung um 2,8 Mal im Vergleich zur vorherigen Generation steigen. Neu ist ebenfalls das "Shader Execution Reordering" (SER), das die Effizienz der Ausführung verbessert, indem Shading-Workloads im laufenden Betrieb neu geplant werden. Dadurch werden die Ressourcen der GPU besser genutzt. "SER ist eine ebenso bedeutende Innovation wie die Out-of-Order-Ausführung für CPUs und verbessert die Raytracing-Leistung um das Dreifache und die Frameraten in Spielen um bis zu 25 Prozent", so das Unternehmen. Die TSMC-4N-Prozesstechnologie soll zu einer bis zu zweifachen Verbesserung der Energieeffizienz führen. Hinweis: Alle Leistungsdaten und -angaben stammen vom Hersteller und wurden bisher nicht unabhängig erhoben.

Das neue High-End-Flaggschiff ist die RTX 4090. Sie verfügt über 76 Milliarden Transistoren, 16.384 CUDA Cores und 24 GB GDDR6X-Speicher von Micron. Die Markteinführung ist für den 12. Oktober 2022 geplant. Der US-Preis wird knapp 1.600 Dollar betragen. In Europa soll die Karte ab 1.949 Euro vertrieben werden. "In komplett per Raytracing berechneten Spielen ist die RTX 4090 mit DLSS 3 bis zu viermal schneller als die RTX 3090 Ti der letzten Generation mit DLSS 2. Außerdem ist sie in aktuellen Spielen bis zu zweimal schneller bei gleichbleibendem 450W-Stromverbrauch", heißt es von Nvidia. Konstant über 100 Bilder pro Sekunde bei Spielen in 4K-Auflösung werden versprochen.

Zudem wurde die RTX 4080 gezeigt, die in zwei Konfigurationen erhältlich sein wird. So verfügt die RTX 4080 16 GB über 9.728 CUDA-Cores und 16 GB GDDR6X-Speicher und soll mit DLSS 3 in aktuellen Spielen doppelt so schnell wie die GeForce RTX 3080 Ti und leistungsfähiger als die GeForce RTX 3090 Ti bei geringerem Stromverbrauch sein. Die RTX 4080 12GB hat 7.680 CUDA-Cores und 12 GB GDDR6X-Speicher. Die kleinere Version soll mit DLSS 3 schneller als die RTX 3090 Ti, das Flaggschiff der vorherigen GPU-Generation, sein. Die 12-GB-Version soll 1.099 Euro kosten (285 Watt) und die 16-GB-Version wird mit 1.469 Euro zu Buche schlagen (320 Watt).

In dem Kontext wurde auch DLSS 3 vorgestellt, eine neue Version des KI-gestützten Upscaling-Verfahrens von Nvidia. DLSS 3 skaliert im Prinzip - und stark vereinfacht dargestellt - niedrig aufgelöstes Bewegtbildmaterial hoch und nutzt Informationen aus Bewegungsvektoren sowie maschinelles Lernen (Deep Learning; neural-grafische Technologie), um hochauflösendes Material zu berechnen. "DLSS ist eine unserer besten Erfindungen, die Echtzeit-Raytracing möglich gemacht hat, wobei DLSS 3 ein weiterer Quantensprung für Gamer und Kreative ist", sagt Huang. "Unsere Pionierarbeit bei RTX Neural Rendering hat ein ganzes Universum an Möglichkeiten eröffnet, in dem Künstliche Intelligenz eine zentrale Rolle bei der Erschaffung von virtuellen Welten spielt."

DLSS 3 soll ab dem 12. Oktober verfügbar sein, in mehr als 35 Spielen und Anwendungen, darunter eine neue Qualitätsstufe bei "Cyberpunk 2077", "A Plague Tale: Requiem", "Destroy All Humans! 2 - Reprobed", "Hitman 3", "Der Herr der Ringe: Gollum" und "The Witcher 3: Wild Hunt". Die Engines Frostbite, Unity und Unreal 4/5 unterstützten DLSS ebenfalls.

Jetzt wird es technisch: Der neue Optical Flow Accelerator, der in die Ada-Lovelace-Architektur integriert ist, analysiert zwei aufeinanderfolgende Bilder im Spiel und berechnet Bewegungsvektordaten für Objekte und Elemente, die im Bild erscheinen, aber nicht durch herkömmliche Bewegungsvektoren der Engines modelliert sind. Dadurch sollen visuelle Anomalien beim KI-Rendering von Elementen wie Partikeln, Reflexionen, Schatten und Beleuchtung reduziert werden. In Kombination mit Super Resolution Frames soll DLSS 3 sieben Achtel der angezeigten Pixel mit KI rekonstruieren können. Da die Frame-Generierung bei DLSS als Post-Processing auf der GPU ausgeführt wird, kann die Bildwiederholrate bis um das Zweifache (laut Nvidia) gesteigert werden, wenn das Spiel durch die CPU limitiert wird, zum Beispiel bei aufwändigen Physik-Berechnungen oder großen Spielwelten. Der "Microsoft Flight Simulator" wird als typisches CPU-Bottleneck gezeigt.

Da DLSS 3 auf die neuen Tensor-Kerne der GeForce-RTX-40-Serie ausgelegt ist, kann DLSS 3 auf Grafikkarten der vorherigen Generation nicht genutzt werden. Weil DLSS 3 auf den DLSS-2-Integrationen basiert, können Spieleentwickler:innen die Lösung in bestehende Titel integrieren, die bereits DLSS 2 oder Nvidia Streamline unterstützen. Die DLSS 3-Integrationen beinhalten ebenfalls Nvidia Reflex, das GPU und CPU synchronisiert, um eine geringe Systemlatenz zu gewährleisten.

Omniverse, als Bestandteil der Studio-Software-Suite, wird demnächst um Nvidia RTX Remix erweitert, eine Modding-Plattform zur RTX-Remaster-Erstellung von Spieleklassikern. In dem Kontext ist "Portal mit RTX" enthüllt worden, das bei den Lightspeed Studios von Nvidia entsteht. Der Klassiker von Valve Software erstrahlt mit Raytracing und DLSS in neuem Licht. "Portal mit RTX" wird als kostenloser, offizieller Download-Inhalt im November 2022 veröffentlicht, rechtzeitig zum 15-jährigen Jubiläum von "Portal".

Nvidia: "Die GPUs der RTX-40-Serie und DLSS 3 bieten neue Möglichkeiten für Nvidia-Studio-Entwickler. 3D-Künstler können vollständig mit Raytracing erzeugte Umgebungen mit präziser Physik und realistischen Materialien rendern und die Änderungen in Echtzeit und ohne Proxys anzeigen. Videobearbeitung und Live-Streaming profitieren ebenfalls von der verbesserten GPU-Leistung und den neuen dualen AV1-Encodern der achten Generation. Für das NVIDIA Broadcast Software Development Kit gibt es drei Updates, die jetzt für Partner verfügbar sind. Darunter sind Face Expression Estimation, Eye Contact und Qualitätsverbesserungen für den virtuellen Hintergrund."

Marcel Kleffmann