As empresas russas continuam a comprar aceleradores Nvidia AI apesar das sanções, mas os custos estão aumentando

Apesar das sanções, as empresas russas no campo das tecnologias de IA conseguiram até agora adquirir o equipamento necessário, principalmente aceleradores de computação Nvidia, que podem ser combinados em clusters de alto desempenho, escreve Kommersant. Esses aceleradores são especialmente necessários agora – eles servem de base para sistemas de inteligência artificial.

Fonte da imagem: geralt/Pixabay

As empresas tecnológicas russas tornaram-se mais ativas na comercialização de soluções de IA. Por exemplo, Yandex e Sber integraram grandes modelos de linguagem (LLM), YandexGPT e GigaChat, respectivamente, em seus assistentes e oferecem a outras empresas a utilização deles para processamento ou geração de conteúdo. VK e MTS também apresentaram seus próprios produtos baseados em IA generativa, utilizando seus próprios LLMs.

A criação do LLM requer um poder computacional significativo, baseado principalmente em aceleradores gráficos. A Nvidia é líder nesta área. De acordo com pesquisa do Grupo Dell’Oro, seus aceleradores gráficos para servidores representaram 97% da receita global do segmento em 2023.

Quanto mais parâmetros um LLM tiver, maior será o número de operações computacionais necessárias para treiná-lo. E enviar uma solicitação para redes neurais que passaram por treinamento também requer recursos computacionais. De acordo com Dmitry Masyuk, diretor do grupo empresarial de tecnologias de busca e publicidade da Yandex, o custo das respostas baseadas no YandexGPT por usuário é sete vezes maior do que quando se utilizam tecnologias clássicas, como a busca na Internet.

Na VK, o crescimento do número de servidores interconectados de alto desempenho (clusters HPC) baseados em aceleradores gráficos é aproximadamente uma vez e meia maior que o crescimento dos sistemas convencionais, Anton Frolov, vice-presidente de IA, conteúdo e recomendação da empresa serviços, disse ao Kommersant. O aumento da procura de recursos foi confirmado pela Beeline Cloud, referindo que as sanções complicam a compra e fornecimento de servidores “com configurações e preços adequados”.

Com o crescente volume de dados transferidos durante a computação de alto desempenho, há necessidade de expandir as redes, observou Igor Zarubinsky, vice-presidente de desenvolvimento de infraestrutura da MTS, chefe da plataforma de nuvem MWS. Há também uma necessidade crescente de armazenamento de dados rápido e de alta capacidade. “O desenvolvimento da IA ​​leva a um aumento na demanda por drives e discos. No futuro, será necessária a construção de data centers de alta densidade e com uso intensivo de energia”, prevê.

O diretor de TI do provedor de nuvem Oxygen, Alexander Budkin, argumenta que a crescente demanda dos clientes por alta potência exige “repensar o data center como o produto comercial final para o mercado de TI”. Para ele, se a tendência continuar por quatro a cinco anos, será possível falar em projetos de construção de data centers específicos para IA: “Eles podem estar localizados em regiões de clima frio, alimentados por eletricidade de usinas que utilizam gás associado .” Tais projetos já foram discutidos antes, mas foram considerados impraticáveis ​​devido ao relativo subdesenvolvimento dos canais de comunicação, mas a IA é “mais tolerante com atrasos”.

avalanche

Postagens recentes

Blue Origin levou a centésima mulher da história ao espaço

A empresa aeroespacial Blue Origin conduziu com sucesso seu décimo voo suborbital, durante o qual…

4 horas atrás

O blogueiro mostrou como vencer Baldur’s Gate 3 sem fazer absolutamente nada na batalha

Baldur's Gate 3 está repleto de situações em que o sucesso de toda a missão…

5 horas atrás

Morte dos Reprovados: o que há de errado com a imagem? Análise

Malcolm Merda, e. Ó. O Senhor do Norte, estava muito cansado de enforcar e esquartejar…

5 horas atrás