As empresas russas continuam a comprar aceleradores Nvidia AI apesar das sanções, mas os custos estão aumentando

Apesar das sanções, as empresas russas no campo das tecnologias de IA conseguiram até agora adquirir o equipamento necessário, principalmente aceleradores de computação Nvidia, que podem ser combinados em clusters de alto desempenho, escreve Kommersant. Esses aceleradores são especialmente necessários agora – eles servem de base para sistemas de inteligência artificial.

Fonte da imagem: geralt/Pixabay

As empresas tecnológicas russas tornaram-se mais ativas na comercialização de soluções de IA. Por exemplo, Yandex e Sber integraram grandes modelos de linguagem (LLM), YandexGPT e GigaChat, respectivamente, em seus assistentes e oferecem a outras empresas a utilização deles para processamento ou geração de conteúdo. VK e MTS também apresentaram seus próprios produtos baseados em IA generativa, utilizando seus próprios LLMs.

A criação do LLM requer um poder computacional significativo, baseado principalmente em aceleradores gráficos. A Nvidia é líder nesta área. De acordo com pesquisa do Grupo Dell’Oro, seus aceleradores gráficos para servidores representaram 97% da receita global do segmento em 2023.

Quanto mais parâmetros um LLM tiver, maior será o número de operações computacionais necessárias para treiná-lo. E enviar uma solicitação para redes neurais que passaram por treinamento também requer recursos computacionais. De acordo com Dmitry Masyuk, diretor do grupo empresarial de tecnologias de busca e publicidade da Yandex, o custo das respostas baseadas no YandexGPT por usuário é sete vezes maior do que quando se utilizam tecnologias clássicas, como a busca na Internet.

Na VK, o crescimento do número de servidores interconectados de alto desempenho (clusters HPC) baseados em aceleradores gráficos é aproximadamente uma vez e meia maior que o crescimento dos sistemas convencionais, Anton Frolov, vice-presidente de IA, conteúdo e recomendação da empresa serviços, disse ao Kommersant. O aumento da procura de recursos foi confirmado pela Beeline Cloud, referindo que as sanções complicam a compra e fornecimento de servidores “com configurações e preços adequados”.

Com o crescente volume de dados transferidos durante a computação de alto desempenho, há necessidade de expandir as redes, observou Igor Zarubinsky, vice-presidente de desenvolvimento de infraestrutura da MTS, chefe da plataforma de nuvem MWS. Há também uma necessidade crescente de armazenamento de dados rápido e de alta capacidade. “O desenvolvimento da IA ​​leva a um aumento na demanda por drives e discos. No futuro, será necessária a construção de data centers de alta densidade e com uso intensivo de energia”, prevê.

O diretor de TI do provedor de nuvem Oxygen, Alexander Budkin, argumenta que a crescente demanda dos clientes por alta potência exige “repensar o data center como o produto comercial final para o mercado de TI”. Para ele, se a tendência continuar por quatro a cinco anos, será possível falar em projetos de construção de data centers específicos para IA: “Eles podem estar localizados em regiões de clima frio, alimentados por eletricidade de usinas que utilizam gás associado .” Tais projetos já foram discutidos antes, mas foram considerados impraticáveis ​​devido ao relativo subdesenvolvimento dos canais de comunicação, mas a IA é “mais tolerante com atrasos”.

avalanche

Postagens recentes

A NASA contratou empresas privadas para fornecer comunicações num raio de 2 milhões de km da Terra.

A NASA selecionou recentemente quatro empresas para fornecer serviços de comunicações em órbita baixa da…

39 minutos atrás

A montadora chinesa GAC ​​apresenta o robô humanóide GoMate com 38 graus de liberdade

A gigante automobilística chinesa GAC ​​apresentou em um evento em Xangai um robô humanóide com…

3 horas atrás

O principal concorrente da Tesla lançou o desenvolvimento de robôs humanóides

A chinesa BYD, uma das maiores fabricantes mundiais de veículos elétricos, montou um laboratório especial…

3 horas atrás

Omdia: O rápido crescimento na demanda de TPU do Google desafia o domínio da NVIDIA no mercado de aceleradores de IA

A pesquisa mais recente da Omdia mostra que o rápido crescimento na demanda por aceleradores…

3 horas atrás

“Para o inferno com o Embracer Group”: um desconhecido vazou o código-fonte de Saints Row IV

Após o vazamento do código-fonte do Grand Theft Auto V no último Natal de 2024,…

3 horas atrás