sexta-feira, 18 de abril de 2025

Rádio SOUCG

  • ThePlus Audio

Computex 2024 | GPUs Gaudi são mais rápidas e mais baratas que NVIDIA H100

Daniel Trefilio

Computex 2024 | GPUs Gaudi são mais rápidas e mais baratas que NVIDIA H100

A Intel
revelou mais detalhes sobre seus servidores para IA com GPUs Gaudi nesta terça-feira (4) de Computex 2024
. Segundo a empresa, soluções equipadas com aceleradores Gaudi 2 são até 15% mais rápidas que produtos com GPUs NVIDIA H100 por apenas 33% do valor, enquanto modelos com Gaudi 3 custam 66% menos que servidores H100, mas com o dobro do desempenho em IA
.

Em termos absolutos, isso representa custos de US$ 65 mil e US$ 125 mil por sistema equipado com 8 GPUs Gaudi 2 e Gaudi 3, respectivamente, contra os quase US$ 200 mil por sistema com GPUs H100
.

Considerando o valor muito mais elevado para os servidores NVIDIA, mesmo sem a vantagem significativa de desempenho das Gaudi, seu custo inicial de instalação, por si só, já abre as portas para empresas menores adotarem soluções de IA muito mais facilmente.


Canaltech no Youtube: notícias, análise de produtos, dicas, cobertura de eventos e muito mais! Assine nosso canal no YouTube
, todo dia tem vídeo novo para você!

Ameaçando a hegemonia CUDA

A Intel celebrou o momento afirmando que, a partir de agora, “aproveitar o poder da IA gerativa se tornou mais rápido e menos caro”. Além disso, o próprio processo de desenvolver aplicações para Inteligência Artificial também tem um enorme potencial para ser muito simplificado.

Isso porque, na computação de maneira geral, a arquitetura x86 é a mais difundida
, e programar nesse ecossistema não exige ferramentas proprietárias complexas, como ocorre em CUDA
. Por mais que os servidores em CUDA dominem o mercado de Computação de Alto Desempenho e IA,
é relativamente mais complexo depender de kits de desenvolvimento fornecidos por uma única empresa
.

Ao lançar hardwares extremamente competentes para IA operando em x86, o esforço para “integrar o poder da IA, garantindo interoperabilidade” é muito menor. Além disso, trabalhar com um ecossistema aberto é extremamente benéfico para todos os níveis de operação, dos desenvolvedores aos clientes.

Segundo a Intel, a estimativa é que um cluster de 8.192 aceleradores Gaudi 3 ofereça até 40% mais rapidez no tempo de treinamento em comparação ao cluster equivalente com GPUs NVIDIA H100, e até 15% mais rapidez no rendimento de treinamento para um cluster de 64 aceleradores em modelo LLM
Llama2-70B.

Até o momento, a Intel já possui parceria com dez grandes fabricantes para garantir um bom portfólio de servidores com Gaudi 3, entre Asus
, Foxconn
, Gigabyte, Inventec, Quanta, Wistron
, Dell
, Hewlett Packard Enterprise, Lenovo
e Supermicro.

O Canaltech
viajou à Taipé, Taiwan, para cobrir a Computex 2024 a convite da Taitra.

Leia a matéria no Canaltech
.

Trending no Canaltech:



Fonte

Enquete

O que falta para o centro de Campo Grande ter mais movimento?

Últimas