NVIDIA Ampere A100 250 W TDP GPU em PCIe 4.0 feito para IA, ciência de dados e supercomputação lançada com desempenho prometido de 90 por cento do modelo de 400 W

Hardware / NVIDIA Ampere A100 250 W TDP GPU em PCIe 4.0 feito para IA, ciência de dados e supercomputação lançada com desempenho prometido de 90 por cento do modelo de 400 W 2 minutos lidos

Nvidia



A NVIDIA lançou oficialmente o A100, uma GPU compatível com PCIe 4.0 baseada na arquitetura Ampere de última geração. Embora apresentando um perfil TDP inferior de 250W, a NVIDIA promete que a GPU PCIe 4.0 Ampere A100 será capaz de oferecer até 90 por cento do desempenho da GPU HGX A100 de 400W. A terceira variante de sua crescente família de GPUs Ampere A100, o A100 PCIe é destinado a servidores que executam clusters de Inteligência Artificial (AI), Ciência de Dados e Supercomputação.

A NVIDIA revelou uma variante PCI-Express 4.0 da GPU A100. A GPU é baseada na microarquitetura 7nm Ampere. Além disso, a empresa também anunciou vários sistemas com A100 dos principais fabricantes de servidores, incluindo Asus, Dell, Cisco, Lenovo e mais. O acelerador de GPU 250W A100 PCIe 4.0 é bastante semelhante à variante TDP completa de 400W, e a NVIDIA também está prometendo desempenho quase idêntico apesar da queda significativa no perfil TDP.



GPU NVIDIA A100 Ampere em fator de forma PCIe 4.0 com a mesma configuração de GPU A100 HGX de 400 W, mas em 250 W:

A NVIDIA anunciou seu acelerador de GPU PCIe 4.0 A100 PCIe. A GPU Ampere está disponível para um conjunto diversificado de casos de uso industrial com sistemas que variam de uma única GPU A100 PCIe a servidores que utilizam duas placas ao mesmo tempo por meio de 12 canais NVLINK que oferecem um total de 600 GB / s de largura de banda de interconexão. O acelerador de GPU 250W TDP A100 PCIe não muda muito em termos de configuração de núcleo quando comparado com o GPU 400W A100 HGX.



A GPU GA100 tem as especificações da variante 400W A100 HGX com 6912 núcleos CUDA dispostos em 108 unidades SM, 432 núcleos tensor e 40 GB de memória HBM2 que oferece a mesma largura de banda de memória de 1,55 TB / s (arredondado para 1,6 TB / s). No entanto, a implantação do pacote GPU no Padrão PCIe 4.0 tinha sua própria desvantagem de reduzir significativamente o TDP. Isso significa uma penalidade de desempenho de 10 a 50 por cento com base na carga de trabalho. Além disso, a variante 250W TDP da GPU A100 é mais adequada para rajadas curtas ao invés de cargas sustentadas.

GPU NVIDIA A100 Ampere em desempenho de fator de forma PCIe 4.0:

Devido à redução significativa no perfil de TDP, pode-se presumir que a placa apresentaria clocks mais baixos para compensar a entrada de menos TDP. No entanto, as métricas de desempenho que a NVIDIA lançou são realmente surpreendentes, pois se aproximam da variante TDP de 400W. O desempenho do FP64 ainda é classificado em 9,7 / 19,5 TFLOPs, o desempenho do FP32 é classificado em 19,5 / 156/312 TFLOPs (esparsidade), o desempenho do FP16 é classificado em 312/624 TFLOPs (esparsidade) e INT8 é classificado em 624/1248 TOPs ( Sparsity).



A matemática simples indica, e a NVIDIA garante, a GPU PCIe 4.0 250W A100 baseada em Ampere pode fornecer 90 por cento do desempenho da placa A100 HGX (400W) nos principais aplicativos de servidor. Isso se justifica porque leva menos tempo para a nova variante completar as tarefas acima mencionadas. No entanto, os números devem ser válidos apenas por intervalos curtos. Em situações complexas que exigiam recursos de GPU sustentados, a GPU PCIe 4.0 de 250W pode fornecer de até 90% a 50% do desempenho da GPU A100 HGX de 400W.

A microarquitetura Ampere certamente beneficiará o novo A100. A NVIDIA promete um aumento de desempenho de pelo menos 20X em relação ao predecessor baseado em Volta. A GPU PCIe 4.0 A100 apresenta tecnologia de GPU multi-instância. Isso significa que um único A100 pode ser particionado em até sete GPUs separadas para lidar com diferentes tarefas de computação. Enquanto isso aumenta a segmentação, há NVLink de 3ª geração, que permite que várias GPUs sejam unidas em uma GPU gigante.

Tag nvidia