Contra todas as regras: a Intel divulgou publicamente o custo dos aceleradores Gaudi AI

Embora os fabricantes divulguem facilmente os preços recomendados para os processadores clássicos, a situação é diferente no caso dos aceleradores de IA. Segundo o portal CRN, a Intel anunciou publicamente o custo da mais recente plataforma Gaudi3.

Na verdade, a empresa quebrou as normas de sigilo da indústria ao anunciar na Computex que uma placa UBB com oito módulos Gaudi3 OAM custaria US$ 125.000 para fabricantes de servidores que pretendem oferecer suporte à plataforma no lançamento no terceiro trimestre de 2024. A Intel revelou os preços depois que os concorrentes NVIDIA e AMD prometeram lançar chips cada vez mais poderosos a cada ano – isso representará uma séria ameaça tanto para a Intel quanto para os players menores.

Fonte da imagem: Intel

De acordo com estimativas da Intel, US$ 125 mil é apenas ⅔ do custo da plataforma NVIDIA com oito aceleradores H100 que sustentam o sistema NVIDIA DGX e servidores de terceiros. Embora a própria NVIDIA não divulgue os preços de seus aceleradores ou plataformas, segundo cálculos da Intel, a plataforma HGX H100 custa aproximadamente US$ 187 mil. O preço pode variar dependendo do volume de compras e configuração do servidor. Ao mesmo tempo, os aceleradores Blackwell B200 custarão entre US$ 30 e US$ 40 mil por unidade.

Fonte da imagem: Intel (via ServeTheHome)

A Intel afirma que em termos de relação preço/desempenho, os chips Gaudi3 são 2,3 vezes mais eficientes na inferência e 90% mais eficientes na aprendizagem em comparação com o H100. Uma placa UBB com oito aceleradores Gaudi2 custa apenas US$ 65 mil, o que representa aproximadamente um terço do custo da plataforma NVIDIA HGX H100. Ao mesmo tempo, nos benchmarks públicos do MLPerf, apenas Gaudi2 foi capaz de competir com o H100 tanto em treinamento quanto em inferência. Os preços dos chips individuais do Gaudi 3 ainda não foram anunciados.

Fonte da imagem: Intel

Há outro ponto importante: os aceleradores Gaudi usam controladores Ethernet integrados tanto para comunicação entre si quanto para comunicação com o mundo exterior, enquanto as soluções NVIDIA exigem um adaptador InfiniBand/Ethernet separado para cada acelerador, o que aumenta o custo final da plataforma . A Intel está confiante de que os clientes estão cada vez mais prestando atenção à relação token/$, que é muito influenciada pelo custo da infraestrutura.

A empresa explicou que a divulgação dos preços de Gaudi2 e Gaudi3 ajudará os clientes a planear de forma mais eficaz os investimentos em projetos de IA. Por exemplo, as startups muitas vezes não têm conhecimento preciso do ecossistema, dos preços e do processo de aquisição, por isso agora será mais fácil para elas calcular o que esperar do equipamento proposto. A abertura da Intel encontrou apoio dos principais fabricantes de equipamentos de TI.

avalanche

Postagens recentes

O CEO da Nvidia deixou claro que a empresa não planeja mais investir na OpenAI e na Anthropic.

Até recentemente, acreditava-se que a Nvidia investiria os prometidos US$ 100 bilhões na OpenAI, mas…

22 minutos atrás

A Broadcom espera gerar mais de 100 bilhões de dólares em receita com chips de IA no próximo ano.

A Broadcom pode estar sendo ofuscada pelo boom da IA, mas isso não a impediu…

49 minutos atrás

A missão lunar Artemis da NASA tem lançamento previsto para 1º de abril.

Um problema na transferência de hélio no estágio intermediário do foguete SLS, na segunda quinzena…

4 horas atrás

A Huawei iniciou as vendas globais de suas soluções de data center com inteligência artificial.

Em meio ao crescente boom da IA, os compradores estão dispostos a pagar por uma…

8 horas atrás

A Nvidia lançou um driver de correção para resolver problemas de voltagem com a GeForce RTX 5000.

A Nvidia lançou a versão 595.76 do driver de correção, que resolve problemas de voltagem…

8 horas atrás