No mês passado, o Google anunciou sua tão esperada CPU de servidor baseada na arquitetura Arm. No entanto, como relata o The Register, já se tornou o terceiro no mercado de processadores para data centers (isso inclui não apenas CPUs, mas também GPUs, TPUs e outros aceleradores). De acordo com um relatório da TechInsights, a empresa agora perde apenas para NVIDIA e Intel e há muito ultrapassou a AMD.
Como outras grandes operadoras de nuvem, a gigante de TI produz seus próprios chips TPU, cuja sexta geração foi lançada na semana passada. Embora não sejam vendidos externamente, a empresa encomenda enormes quantidades de TPU para equipar os seus próprios data centers – só no ano passado falávamos de 2 milhões de peças. O principal parceiro do Google na criação de silício personalizado é a Broadcom.
O fornecimento de TPU aumenta a cada geração, acompanhando o crescimento da própria empresa. Desde a estreia do TPU v4 em 2021, o negócio de semicondutores do Google cresceu significativamente devido ao desenvolvimento de Large Language Models (LLMs). As TPUs são usadas pela empresa para tarefas internas e os aceleradores NVIDIA são usados para a nuvem. A TechInsights acredita que o Google possui a maior base instalada de aceleradores de IA e a maior infraestrutura de IA do setor atualmente.
No ano passado, o mercado de servidores viu uma “correção massiva de estoque”, à medida que os hiperescaladores prolongaram a vida útil do hardware, atrasaram a substituição de servidores de uso geral e aumentaram os gastos de capital em servidores de IA e aceleradores NVIDIA. Os analistas da Omdia falam sobre essas tendências do mercado tanto no passado como no início deste ano. A TechInsights acredita que até ao final do primeiro trimestre de 2024, a Google conseguirá alcançar ou mesmo ultrapassar a Intel em termos de quota neste mercado.
É claro que o Google não é a única empresa de nuvem que desenvolve seus próprios chips. A Microsoft está trabalhando na CPU do servidor Azure Cobalt e nos aceleradores Maia 100 AI. A AWS usa seus próprios processadores Graviton Arm e aceleradores de IA das séries Trainium e Inferentia há anos. No ano passado, a Bernstein Research informou que a arquitetura Arm já é usada por cerca de 10% dos servidores em todo o mundo, e mais de 50% deles são implementados pela AWS. O Softbank no início de 2023 disse que a Arm havia conquistado 5% do mercado de nuvem.
No entanto, com o advento dos processadores TPU V5e e TPU V5p, as soluções do Google serão cada vez mais utilizadas devido ao “crescimento explosivo” de grandes modelos de linguagem como o Gemini. Em 2024, o Google terá um processador Arm chamado Axion. E sua implementação, segundo o TechInsights, será muito mais rápida que o Graviton, já que o Google já possui infraestrutura de software para tal chip. Tudo isso é necessário para que a empresa acompanhe a AWS, a Microsoft e, em menor medida, o Alibaba. Ao mesmo tempo, o relatório menciona que o mercado de semicondutores para data centers está mudando rapidamente – anteriormente era dominado pela Intel com sua arquitetura x86. Agora a sua estrutura é determinada pelas necessidades dos sistemas de IA.