Nesta segunda-feira (18), a NVIDIA lançou na GTC 2024 (Graphics Technology Conference)
as novas GPU B200 para IA, inaugurando a arquitetura Blackwell
. As novas GPUs trazem inovações de hardware
e de tecnologias embarcadas que entregam, por GPU, 4 vezes mais desempenho em treinamento, 30 vezes mais em inferências e 25 vezes mais eficiência energética em relação aos chips Hopper H100
.
Os novos chips Blackwell são fabricados em processo de 4 nm da TSMC 4NP
, adaptado para integrar dois dies Blackweel para atuarem como uma única GPU por meio de interconectores chip-para-chip ( NVLINK C2C
) de 10 TB/s. A grande vantagem do novo design é eliminar eventuais problemas de comportamento de programas em arquitetura desagregada de chiplets.
Inferência na escala de trilhões de parâmetros
Outra inovação dos chips Blackwell é a introdução da nova geração de Núcleos Tensor e compiladores Tensor combinando modelos TensorRT-LLM e framework NeMo Megatron. Entre outras vantagens, o resultado é uma aceleração de inferência e treinamento em tempo real na escala de 10 trilhões de parâmetros.
–
Siga o Canaltech no Twitter
e seja o primeiro a saber tudo o que acontece no mundo da tecnologia.
–
Além disso, a NVIDIA lançou a quinta geração de interconectores NVIDIA NVLink com largura de banda bidirecional de 1,8 TB/s, garantindo comunicação de altíssima velocidade entre até 576 GPUs. Com a implementação de um motor de descompressão dedicado, os chips B200 ainda oferecem ganhos significativos de desempenho em atividades de análise de dados.
Servidores NVL72 com superchip
Por fim, o maior destaque da nova arquitetura de GPUs da NVIDIA fica para o superchip Grace-Blackwell GB200, evolução dos já impressionantes Grace-Hopper
, implementados nos servidores NVL72. A nova geração de racks NVIDIA para IA e HPC combina 36 CPUs Amazing Grace e 72 GPUs Blackwell B200 em comunicação pela quinta geração do NVIDIA NVLink.
O resultado é um servidor com poder computacional de 720 Petaflops (PFLOPs) em treinamento de modelos LLM, 1.440 PFLOPs em inferência e capacidade para modelos de até 27 trilhões de parâmetros. A NVIDIA já conta com um portfólio vasto de empresas que vão adotar as soluções Blackwell ainda em 2024.
Entre as principais parcerias estão Google
Cloud, Microsoft
Azure, Oracle
Cloud Infrastructure e Amazon Web Services (AWS)
como primeiras a atualizarem suas infraestruturas. Além disso, Cisco
, Dell
, Lenovo
e Supermicro também vão produzir suas próprias soluções de servidores utilizando chips Blackwell e outras tecnologias NVIDIA também para 2024.
Leia a matéria no Canaltech
.
Trending no Canaltech: