Google desafia a NVIDIA ao oferecer seus próprios aceleradores TPU AI para pequenos provedores de nuvem

De acordo com as informações mais recentes, o Google abordou pequenos provedores de nuvem que costumam alugar chips NVIDIA com uma oferta incomum: alugar seus próprios aceleradores de IA TPU, anteriormente disponíveis apenas na nuvem do Google, relata a Trendforce com referência ao The Information. Isso pode levar a uma concorrência direta com a NVIDIA.

Há relatos de que o Google já firmou um acordo com pelo menos um provedor de serviços de nuvem: a Fluidstack, com sede em Londres. A empresa deve instalar TPUs no data center desta última em Nova York. A Fluidstack recebeu incentivos para expandir seus negócios em detrimento das TPUs. Caso a empresa não consiga cobrir os custos de aluguel de um data center em Nova York, o Google promete fornecer suporte no valor de até US$ 3,2 bilhões.

De acordo com a reportagem, o Google está visando empresas jovens, principalmente provedores de serviços de nuvem, usuários ativos de aceleradores da NVIDIA. A empresa já teria buscado acordos semelhantes com outros fornecedores que atualmente favorecem a NVIDIA — incluindo empresas promissoras como a Crusoe, que está construindo um data center para a OpenAI. Ela também pode fazer parceria com a CoreWeave, que aluga hardware NVIDIA para a Microsoft (principalmente para a OpenAI) e também tem um contrato direto com a OpenAI.

Fonte da imagem: Google

O Google vem trabalhando na criação de aceleradores de IA há algum tempo. De acordo com fontes do The Information, a empresa estava considerando expandir seus negócios relacionados a TPUs para aumentar a receita e reduzir sua dependência de chips NVIDIA. A Morningstar estima que o valor combinado dos negócios de TPUs e da divisão DeepMind seja de aproximadamente US$ 900 bilhões. Observa-se que as TPUs Trillium de sexta geração, lançadas em dezembro de 2024, estão em alta demanda, e a demanda pelos aceleradores de sétima geração, o Ironwood TPU, deve crescer. Este é o primeiro modelo projetado para inferência em larga escala.

Anteriormente, o Google usava TPUs principalmente para seus próprios projetos. No entanto, há algum tempo, a disponibilidade de TPUs para clientes externos no Google Cloud aumentou muito. Esses chips são usados, por exemplo, pela Apple. No entanto, agora, a empresa também deseja obter aceleradores NVIDIA.

admin

Postagens recentes

A NASA definiu a próxima data para uma missão tripulada à Lua: 6 de março.

A NASA agendou a primeira missão tripulada à Lua para 6 de março. Ontem, 20…

1 hora atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

3 horas atrás

Não apenas Cyberpunk 2077: jogos AAA para PC agora rodam em dispositivos Android potentes, mas com limitações.

A emulação de jogos de PC no Android está ganhando força e agora está acessível…

3 horas atrás

A G42, sediada nos Emirados Árabes Unidos, e a Cerebras construirão um supercomputador nacional de IA na Índia com aceleradores WSE-3.

A G42 Holdings, uma holding sediada nos Emirados Árabes Unidos, e a Cerebras, em parceria…

5 horas atrás

A G42, sediada nos Emirados Árabes Unidos, e a Cerebras construirão um supercomputador nacional de IA na Índia com aceleradores WSE-3.

A G42 Holdings, uma holding sediada nos Emirados Árabes Unidos, e a Cerebras, em parceria…

5 horas atrás

A Apple está criando um agente de IA local para o iPhone que poderá gerenciar aplicativos para o usuário.

A Apple está desenvolvendo um agente de IA que entende as interfaces dos aplicativos e…

6 horas atrás