Skip to main content

Primeras impresiones de DLSS 4

Probamos el nuevo sistema de reescalado de Nvidia con una GeForce RTX 5080.

Nvidia presentó ayer, por fin, la nueva generación de tarjetas gráficas RTX 50. Hace unas semanas, sin embargo, tuve la oportunidad de probar durante unas horas la nueva tecnología de reescalado y generación de frames DLSS 4 en un equipo que tenía en su interior la nueva GeForce RTX 5080, junto con una versión actualizada de Cyberpunk 2077. Y los resultados son impresionantes; Nvidia ha mejorado su tecnología de reescalado y reconstrucción de rayos con un nuevo modelo, el cual ofrece mejoras sustanciales, mientras que la generación de frames se amplía con un frame interpolado o dos, a veces incluso con tres. El resultado es que Cyberpunk 2077 se ve mucho mejor y puede funcionar con todas las características de trazado de rayos a más de 120FPS.

Hay muchas cosas de las que hablar, pero primero quiero dejar muy claro que esto es un avance con unas primeras impresiones. La RTX 5080 a la que tuve acceso era una muestra de ingeniería. Los drivers no eran finales. Puedo daros una idea general de cómo funciona DLSS 4 y de las mejoras en el frame-rate, pero las cifras exactas tendrán que esperar a la review con el hardware y los drivers finales. Además tuve un tiempo limitado con ese hardware para realizar pruebas y capturas, pero en cualquier caso fue suficiente para responder a las primeras preguntas acerca de esta nueva tecnología.

Podéis ver los frutos de mi visita en el siguiente vídeo, pero hablando de la captura, y al igual que ya ocurría con DLSS 3, resulta complicado mostrar cómo se ve realmente DLSS 4 debido al factor de ampliación de frame-rate del nuevo sistema de generación de frames. La generación múltiple de frames de DLSS 4 es perfecta, por ejemplo, para aprovechar la nueva oleada de monitores 4K QD-OLED de 240Hz, pero a día de hoy no existe ninguna tecnología de captura en el mercado capaz de capturar Ultra HD a 240 frames por segundo.

DLSS 4 funcionando en una Nvidia GeForce RTX 5080. Para mejores resultados mira el vídeo en una pantalla 4K a resolución completa.Ver en YouTube

En la captura he intentado mostrar la calidad de la generación de frames poniendo un límite de 120FPS para luego ralentizarlo un 50% y que se ajuste a los límites del contenedor máximo de YouTube, a 4K y 60FPS. Sin embargo, el juego funcionaba a mucho más que el límite de 120FPS que impuse. Este vídeo, por lo tanto, te da una idea de lo que presenta el nuevo sistema de generación de frames, pero la experiencia real es bastante distinta: la persistencia de los frames será significativamente más baja y, por lo tanto, los artefactos en la generación de frames serán mucho menos evidentes. DLSS 4, de hecho, está diseñado para la nueva generación de paneles con elevadas tasas de refresco. Yo lo experimenté con un Alienware AW3225QF QD-OLED 4K de 240Hz, y era impresionante.

Por suerte, las mejoras en DLSS Super Resolution y en la reconstrucción de rayos se pueden mostrar con una captura a 4K y 60FPS, y son importantes en este sentido. El DLSS actual utiliza una red neuronal convolucional, la cual según Nvidia "genera nuevos píxeles analizando contextos localizados, detectando cambios en estas regiones en frames sucesivos". Este modelo ha mejorado con el paso del tiempo, pero tiene un límite y las últimas versiones han mostrado únicamente mejoras iterativas.

El nuevo modelo de DLSS utiliza un transformador de visión, parecido a la tecnología base de cosas como ChatGPT, Gemini o Flux. Nvidia dice que esto "permite operaciones de auto-atención para evaluar la importancia relativa de cada pixel en todo el frame y en múltiples frames". Hay dos veces más parámetros que en el anterior modelo CNN y es por ello que se promete más estabilidad, menos ghosting, más detalle y mejoras en el anti-aliasing. El modelo transformador es muy escalable, con lo cual Nvidia predice más mejoras en la calidad a medida que se entrene mejor. También es retrocompatible, lo cual significa que se puede aplicar a títulos DLSS que funcionan con la versión 2.0 o superior. También funcionará con las anteriores tarjetas RTX hasta la gama RTX 20 basada en la arquitectura Turing de 2018, pero el aumento en la complejidad del modelo puede tener algún tipo de impacto en el rendimiento (el cual quizás se compense con el incremento en la calidad, esto habrá que probarlo con mayor profundidad).

Haz clic para ver imágenes de más resolución. En la parte superior puedes ver como la tecnología de transformación de visión elimina virtualmente el ghosting en DLSS. Abajo a la izquierda puedes ver las mejoras en detalle de la nueva tecnología, y abajo a la derecha las mejoras en el detalle de la reconstrucción de rayos.

Aunque el material capturado era limitado, la impresión general que hemos tenido tanto nuestro especialista en calidad de imagen, Alex Battaglia, como yo es que aunque el metraje tenía la misma resolución interna de 1080p que el modo de rendimiento CNN, el equivalente con transformador de visión parece incluso mejor. Y hay signos evidentes de que algunos de los problemas que veíamos con DLSS han mejorado mucho en esta nueva versión. Esto se muestra mejor en el vídeo pero, por ejemplo, se ha reducido significativamente el ghosting y el efecto de manchado. El shimmering en movimiento prácticamente ha desaparecido, mientras que la reconstrucción de rayos (básicamente el reescalado del ray-tracing) también presenta mejoras similares.

Comparar el modelo de transformador de visión con la versión CNN existente de DLSS es, básicamente, comparar dos escaladores por IA muy distintos, algo imposible con las pocas horas que he podido pasar con la RTX 5080 y que tendremos que dejar para cuando tengamos el nuevo hardware en las oficinas. Sin embargo, las implicaciones que tienen las mejoras en super resolución y reconstrucción de rayos son significativas. DLSS ha tenido únicamente mejoras iterativas desde el lanzamiento de la versión 2.0 en 2020, pero sigue siendo el escalador con mayor calidad del mercado. La reconstrucción de rayos de DLSS, por su parte, no tiene competidor a día de hoy. Con grandes mejoras y sin inconvenientes en ambos frentes, esto pone a Nvidia en una posición todavía más destacada respecto a sus rivales.

La generación de frames DLSS también recibe nuevas características, aunque estas son exclusivas para la nueva gama de tarjetas RTX 50. La tecnología de generación a través de un único frame de la serie 40 se amplía a generación de dos y tres frames en la serie 50. Esto es complicado, especialmente en lo que respecta a mantener el ritmo de esos dos frames intermedios de forma suave y consistente. Es por ello que, según Nvidia, la nueva arquitectura Blackwell tiene un componente de hardware que se encarga de garantizar un ritmo uniforme.

Usé la escene del mercado negro en el estadio Petrochem para las pruebas, una zona que anteriormente utilizamos para identificar cuellos de botella en la versión para consolas de Cyberpunk 2077. Moviendo esto sin bloqueos, a una resolución de salida de 4K y con la opción de path tracing RT Overdrive activada, la solución actual de generación de un frame combinada con el modelo de transformador de visión para super resolución y reconstrucción de rayos mejoró el frame-rate un 535% en comparación con el juego funcionando a resolución 4K nativa. Y las mejoras seguían al generar más frames; añadiendo dos frames la mejora se sitúa en un 725%, mientras que con tres frames - como era de esperar - la mejora es todavía más grande: un 913% frente al renderizado a resolución nativa.

Comparando la RTX 5080 con la generación completa de frames y el modelo transformador activado a la antigua 4080 Super con generación de un único frame y la actual tecnología CNN de reconstrucción de resolución y rayos aprecié una mejora del 91% en el frame-rate.

Volviendo al frame-pacing, veréis algunas visualizaciones de frame-time comparando la generación de un frame con la salida completa con generación de tres frames, ambas funcionando en una RTX 5080. Resulta reconfortante ver que la segunda no sólo ofrece frame-rates superiores, sino que también son más suaves. Tomé estas métricas utilizando una nueva versión del FrameView de Nvidia, pero las verifiqué utilizando FCAT, con nuestro software midiendo la persistencia de los frames basándose en la salida de la GPU. Ambos resultados fueron idénticos.

Arriba a la izquierda, los diferenciales de frame-rate entre el path tracing nativo a 4K y varios niveles de super resolución y generación de frames. Arriba a la derecha, el antiguo DLSS en una 4080 Super frente a la nueva generación múltiple de frames de DLSS 4 en la 5080. Abajo, un vistazo al frame-pacing con varias comparaciones de generación múltiple de frames y latencia.

Mi preocupación con la nueva técnica de generación de frames era la latencia. Cuando se publicó DLSS 3 la generación de frames se conseguía haciendo buffer de un frame adicional para luego calcular el frame intermedio. Estos factores añaden latencia, la cual hasta cierto punto se compensaba con la inclusión obligatoria de Nvidia Reflex para recuperar algunos microsegundos. En el vídeo podéis ver que he incluido resultados de latencia en PC, medidos una vez más con FrameView. La media en un segmento de alrededor de dos minutos y medio en el mercado negro es la siguiente: una latencia media de 50.97ms con un solo frame generado, aumentando hasta 55.5ms con dos frames generados y 57.3ms con la opción completa de tres frames.

Basándonos en esta muestra estamos viendo una adición media de 6.4ms a la latencia con la generación completa de frames, a cambio de una mejora del 71% en el frame-rate. Viendo estos resultados me da la sensación de que la mayor parte de la latencia extra proviene del buffer del frame adicional, pero añadir más frames intermedios produce un incremento relativamente mínimo en la latencia. Esto significa que Cyberpunk se sigue jugando bien, y a no ser que seas muy quisquilloso con el input lag probablemente no notarás diferencia con la solución de generación de frames del DLSS actual.

El tiempo que he pasado con la RTX 5080, por lo tanto, ha sido muy prometedor. Es realmente destacable ver como un título con path tracing como Cyberpunk 2077 se mueve por encima de los 120 frames por segundo con la nueva opción de generación de frames, así que es muy probable que juegos menos exigentes funcionen todavía más rápido. Y luego está el hecho de que la generación de frames ha demostrado ser bastante útil para superar las limitaciones de CPU en muchos juegos, con lo cual será interesante ver cómo resulta la generación múltiple de frames en este aspecto. Mientras, las mejoras de calidad en super resolución y reconstrucción de rayos corrigen algunos de los problemas que tenía con DLSS, pero a su estado como la mejor solución actual de escalado en términos de calidad.

En cualquier caso, probaremos todos los componentes de DLSS 4 con muchísima más profundidad tan pronto como podamos, y - por supuesto - analizaremos las nuevas tarjetas RTX 50 en cuanto estén disponibles.


Traducción por Josep Maria Sempere.

También te puede interesar