Computex 2024 | GPUs Gaudi são mais rápidas e mais baratas que NVIDIA H100
A Intel
revelou mais detalhes sobre seus servidores para IA com GPUs Gaudi nesta terça-feira (4) de Computex 2024
. Segundo a empresa, soluções equipadas com aceleradores Gaudi 2 são até 15% mais rápidas que produtos com GPUs NVIDIA H100 por apenas 33% do valor, enquanto modelos com Gaudi 3 custam 66% menos que servidores H100, mas com o dobro do desempenho em IA
.
Em termos absolutos, isso representa custos de US$ 65 mil e US$ 125 mil por sistema equipado com 8 GPUs Gaudi 2 e Gaudi 3, respectivamente, contra os quase US$ 200 mil por sistema com GPUs H100
.
Considerando o valor muito mais elevado para os servidores NVIDIA, mesmo sem a vantagem significativa de desempenho das Gaudi, seu custo inicial de instalação, por si só, já abre as portas para empresas menores adotarem soluções de IA muito mais facilmente.
–
Canaltech no Youtube: notícias, análise de produtos, dicas, cobertura de eventos e muito mais! Assine nosso canal no YouTube
, todo dia tem vídeo novo para você!
–
Ameaçando a hegemonia CUDA
A Intel celebrou o momento afirmando que, a partir de agora, “aproveitar o poder da IA gerativa se tornou mais rápido e menos caro”. Além disso, o próprio processo de desenvolver aplicações para Inteligência Artificial também tem um enorme potencial para ser muito simplificado.
Isso porque, na computação de maneira geral, a arquitetura x86 é a mais difundida
, e programar nesse ecossistema não exige ferramentas proprietárias complexas, como ocorre em CUDA
. Por mais que os servidores em CUDA dominem o mercado de Computação de Alto Desempenho e IA,
é relativamente mais complexo depender de kits de desenvolvimento fornecidos por uma única empresa
.
Ao lançar hardwares extremamente competentes para IA operando em x86, o esforço para “integrar o poder da IA, garantindo interoperabilidade” é muito menor. Além disso, trabalhar com um ecossistema aberto é extremamente benéfico para todos os níveis de operação, dos desenvolvedores aos clientes.
Ready to jump to hyperspace with our accelerators? 🚀
Immerse yourself in the galaxy of #GenAI
this May the 4th with the inference and efficiency of #IntelGaudi
3 AI accelerators. #MayThe4thBeWithYou
pic.twitter.com/xoUFnCAhGU— Intel (@intel) May 4, 2024
Segundo a Intel, a estimativa é que um cluster de 8.192 aceleradores Gaudi 3 ofereça até 40% mais rapidez no tempo de treinamento em comparação ao cluster equivalente com GPUs NVIDIA H100, e até 15% mais rapidez no rendimento de treinamento para um cluster de 64 aceleradores em modelo LLM
Llama2-70B.
Até o momento, a Intel já possui parceria com dez grandes fabricantes para garantir um bom portfólio de servidores com Gaudi 3, entre Asus
, Foxconn
, Gigabyte, Inventec, Quanta, Wistron
, Dell
, Hewlett Packard Enterprise, Lenovo
e Supermicro.
O Canaltech
viajou à Taipé, Taiwan, para cobrir a Computex 2024 a convite da Taitra.
Leia a matéria no Canaltech
.
Trending no Canaltech: