Nvidia presenta la próxima generación Kepler GPU Compute Engine

2024

NVIDIA GPU Cloud with AWS, Step by Step

Tabla de contenido:

Nuevas características

Nvidia lanzó hoy su última línea de motores de cómputo Tesla GPU en la Conferencia de Tecnología de Gráficos de la compañía en San José. Un modelo de envío inmediato se basa en el chip GK104 existente utilizado en la recientemente lanzada GTX 680. Apodado el Tesla K10, la placa ofrece hasta 4.6 teraflops de rendimiento de punto flotante de precisión simple, aproximadamente tres veces la FP de precisión única de la anterior, Tesla basado en Fermi. La tarjeta también puede manejar un ancho de banda de memoria agregado de 320 GB por segundo. Esta placa está orientada a aplicaciones de exploración de petróleo, procesamiento de señales y procesamiento sísmico.

El anuncio más intrigante es el Tesla K20. Construido sobre un chip monstruo con 7.1 billones de transistores, el K20 no está programado para ser lanzado hasta el cuarto trimestre. El CEO de Nvidia, Jen-Hsun Huang, señaló que el K20 era el chip de semiconductor más grande y complejo jamás construido. Es probable que utilice el mismo proceso de fabricación de 28nm utilizado para la GTX 680. La K20 está diseñada para entornos de HPC intensivos computacionalmente, en particular análisis de elementos finitos (FEA), aplicaciones financieras y de física. Ofrece el triple de rendimiento de coma flotante de doble precisión que los productos Tesla de la generación anterior. Además del enorme recuento de transistores, el K20 contará con una interfaz de memoria de 384 bits.

Nuevas características

Además de un rendimiento de cómputo mejorado, el K20 admitirá varias características clave para mantener el chip ocupado al ser alimentado. quehaceres. Hyper-Q aumenta la cantidad de colas de trabajo de una sola cola en el chip Fermi de generación anterior a 32 colas de trabajos. Esto mejora la utilización de la GPU, manteniendo el zumbido de la mayoría de los núcleos de cómputo cuando se ejecutan aplicaciones informáticas paralelas.

El paralelismo dinámico se comporta como un tipo de predictor de bifurcación paralelo. Al alimentar tareas, el K20 puede realizar un seguimiento de las tareas dependientes y generar nuevos núcleos de cómputo para completar esas tareas, en lugar de tener que solicitar más trabajo de la CPU.

Huang demostró una simulación de colisión de partículas, comenzando por la última generación Chip Fermi Esa GPU podría manejar 20,000 cuerpos colisionando en tiempo real a altas velocidades de cuadro. Luego pasó a demostrar el modelado en tiempo real de las galaxias de Andrómeda y la Vía Láctea colisionando, algo por lo que no tenemos que preocuparnos, ya que no ocurrirá en 3.800 millones de años. Esa simulación se ejecutó en un Tesla basado en Kepler, mostrando más de 208,000 cuerpos colisionando.

Se espera que la GPU en el K20, cuyo nombre en código es GK110, sea utilizada en la supercomputadora Titan que se está construyendo en el Laboratorio Nacional Oak Ridge y el Sistema Blue Waters en el Centro Nacional de Aplicaciones de Supercomputación de la Universidad de Illinois en Urbana-Champaign.

Nvidia presenta la próxima generación Kepler GPU Compute Engine

Nvidia promociona una mejora masiva en rendimiento en sus últimos productos informáticos Tesla GPU, incluido un próximo 7,1 billones de monstruos transistores Motor de computación GPU