Durante muchos años, configurar una estación con 2, 3 o incluso 4 GPUs era una opción viable e ideal para muchas aplicaciones de cálculo GPU como el renderizado, corrección de color y Machine/Deep Learning entre otros. Antes de la serie RTX, los diseños de ventilación de los modelos de «referencia» de NVIDIA tenían un ventilador situado cerca de la parte frontal de la GPU que introducía aire frío, lo movía a través del disipador térmico y expulsaba este aire ya caliente por la parte posterior. A este tipo de ventilación se le denomina Blower.

El uso de varias tarjetas de este tipo sólo requería un buen flujo de aire interno, espacio suficiente entre cada GPU y una fuente de alimentación lo suficientemente potente como para mantenerlas todas en funcionamiento.

Con el lanzamiento de las GPUs GeForce RTX, sin embargo, todo cambió. Esta serie se estrenó con las soluciones de doble ventilador y, aunque los distintos fabricantes y ensambladores ya usaban estos sistemas de refrigeración en generaciones anteriores, éstas se convirtieron en la norma con RTX.

Con una sola GPU, y un flujo de aire decente, esto no suele ser un gran problema. Aunque puede ser un reto en las estaciones con un factor de forma reducido (ITX) como puede ser nuestra R-Series , que tienden a tener un flujo de aire restringido. Sin embargo, una vez que pasamos a dos GPUs, habremos duplicado la cantidad de calor que se está introduciendo de nuevo al sistema, lo que requiere aún más trabajo por parte de los ventiladores del chasis, además que los ventiladores de una GPU puedan aspirar el aire ya caliente que acaba de salir de la otra GPU. Esto acabaría afectando drásticamente a las temperaturas de las GPUs y provocando un aumento de la velocidad de los ventiladores (ruido añadido) y un posible sobrecalentamiento. Cuando las GPUs se calientan demasiado, reducen la frecuencia para evitar daños y, por tanto, reducen el rendimiento (Thermal Throttling).

 

Con cuatro GPUs RTX 2080 Founders Edition (doble ventilador), comprobamos que se sobrecalientan y aceleran en cuestión de minutos después de estar bajo carga, y esto antes incluso de completar una sola pasada de, por ejemplo, OctaneBench y Redshift que son dos de los mejores motores de Render basados en GPU:

 

Y este problema se agrava con las siguientes series que hacemos en Octane y también en Redshift:

 

En sistemas Multi-GPU tanto en Geforce RTX como Quadro RTX, empleando tarjetas con sistemas de refrigeración Blower, podemos comprobar como las GPUs pueden mantener el rendimiento completo con cada serie que pasan en Octane y Redshift.

¿Existen maneras de solucionar estos problemas de rendimiento y refrigeración?

Sí. En el caso de las Geforce RTX, OEMs como Asus, Gigabyte y PNY han incluido en su catálogo GPUs con sistemas de ventilación Blower diseñadas para configuraciones Multi-GPU (aquí podemos enlazar con nuestras Geforce de la web). Pero estaríamos limitados por los 6, 8 u 11 GB de memoria de vídeo que se encuentran en estas GPUs. Para los usuarios que deseen utilizar varias tarjetas con más de 11 GB de VRAM, las GPUs Quadro RTX son la única opción (enlazar con la sección de Quadro de la web), además de las ventajas que estas conllevan, tanto a nivel de drivers dedicados como en términos de garantía, ya que son las únicas aceptadas por Nvidia, fuera de la gama Tesla, para integrar en servidores.

 

En Azken Muga todas nuestras estaciones y servidores están perfectamente configurados basándonos en estos estudios y con las pruebas de stress y rendimiento más exigentes posibles. Puedes echar un vistazo a nuestras Workstations Multi-GPU (Enlazar con Workstations / GPGPU Deep Learning de la web) y a nuestros servidores para HPC y GPU Computing donde integramos sistemas de alta densidad con hasta 10 GPUs. (enlazamos con Servidores / HPC GPU Computing de la web). Si tienes alguna duda, siempre puedes contactar con nosotros