Apesar das sanções, as empresas russas no campo das tecnologias de IA conseguiram até agora adquirir o equipamento necessário, principalmente aceleradores de computação Nvidia, que podem ser combinados em clusters de alto desempenho, escreve Kommersant. Esses aceleradores são especialmente necessários agora – eles servem de base para sistemas de inteligência artificial.
As empresas tecnológicas russas tornaram-se mais ativas na comercialização de soluções de IA. Por exemplo, Yandex e Sber integraram grandes modelos de linguagem (LLM), YandexGPT e GigaChat, respectivamente, em seus assistentes e oferecem a outras empresas a utilização deles para processamento ou geração de conteúdo. VK e MTS também apresentaram seus próprios produtos baseados em IA generativa, utilizando seus próprios LLMs.
A criação do LLM requer um poder computacional significativo, baseado principalmente em aceleradores gráficos. A Nvidia é líder nesta área. De acordo com pesquisa do Grupo Dell’Oro, seus aceleradores gráficos para servidores representaram 97% da receita global do segmento em 2023.
Quanto mais parâmetros um LLM tiver, maior será o número de operações computacionais necessárias para treiná-lo. E enviar uma solicitação para redes neurais que passaram por treinamento também requer recursos computacionais. De acordo com Dmitry Masyuk, diretor do grupo empresarial de tecnologias de busca e publicidade da Yandex, o custo das respostas baseadas no YandexGPT por usuário é sete vezes maior do que quando se utilizam tecnologias clássicas, como a busca na Internet.
Na VK, o crescimento do número de servidores interconectados de alto desempenho (clusters HPC) baseados em aceleradores gráficos é aproximadamente uma vez e meia maior que o crescimento dos sistemas convencionais, Anton Frolov, vice-presidente de IA, conteúdo e recomendação da empresa serviços, disse ao Kommersant. O aumento da procura de recursos foi confirmado pela Beeline Cloud, referindo que as sanções complicam a compra e fornecimento de servidores “com configurações e preços adequados”.
Com o crescente volume de dados transferidos durante a computação de alto desempenho, há necessidade de expandir as redes, observou Igor Zarubinsky, vice-presidente de desenvolvimento de infraestrutura da MTS, chefe da plataforma de nuvem MWS. Há também uma necessidade crescente de armazenamento de dados rápido e de alta capacidade. “O desenvolvimento da IA leva a um aumento na demanda por drives e discos. No futuro, será necessária a construção de data centers de alta densidade e com uso intensivo de energia”, prevê.
O diretor de TI do provedor de nuvem Oxygen, Alexander Budkin, argumenta que a crescente demanda dos clientes por alta potência exige “repensar o data center como o produto comercial final para o mercado de TI”. Para ele, se a tendência continuar por quatro a cinco anos, será possível falar em projetos de construção de data centers específicos para IA: “Eles podem estar localizados em regiões de clima frio, alimentados por eletricidade de usinas que utilizam gás associado .” Tais projetos já foram discutidos antes, mas foram considerados impraticáveis devido ao relativo subdesenvolvimento dos canais de comunicação, mas a IA é “mais tolerante com atrasos”.