As empresas russas continuam a comprar aceleradores Nvidia AI apesar das sanções, mas os custos estão aumentando

Apesar das sanções, as empresas russas no campo das tecnologias de IA conseguiram até agora adquirir o equipamento necessário, principalmente aceleradores de computação Nvidia, que podem ser combinados em clusters de alto desempenho, escreve Kommersant. Esses aceleradores são especialmente necessários agora – eles servem de base para sistemas de inteligência artificial.

Fonte da imagem: geralt/Pixabay

As empresas tecnológicas russas tornaram-se mais ativas na comercialização de soluções de IA. Por exemplo, Yandex e Sber integraram grandes modelos de linguagem (LLM), YandexGPT e GigaChat, respectivamente, em seus assistentes e oferecem a outras empresas a utilização deles para processamento ou geração de conteúdo. VK e MTS também apresentaram seus próprios produtos baseados em IA generativa, utilizando seus próprios LLMs.

A criação do LLM requer um poder computacional significativo, baseado principalmente em aceleradores gráficos. A Nvidia é líder nesta área. De acordo com pesquisa do Grupo Dell’Oro, seus aceleradores gráficos para servidores representaram 97% da receita global do segmento em 2023.

Quanto mais parâmetros um LLM tiver, maior será o número de operações computacionais necessárias para treiná-lo. E enviar uma solicitação para redes neurais que passaram por treinamento também requer recursos computacionais. De acordo com Dmitry Masyuk, diretor do grupo empresarial de tecnologias de busca e publicidade da Yandex, o custo das respostas baseadas no YandexGPT por usuário é sete vezes maior do que quando se utilizam tecnologias clássicas, como a busca na Internet.

Na VK, o crescimento do número de servidores interconectados de alto desempenho (clusters HPC) baseados em aceleradores gráficos é aproximadamente uma vez e meia maior que o crescimento dos sistemas convencionais, Anton Frolov, vice-presidente de IA, conteúdo e recomendação da empresa serviços, disse ao Kommersant. O aumento da procura de recursos foi confirmado pela Beeline Cloud, referindo que as sanções complicam a compra e fornecimento de servidores “com configurações e preços adequados”.

Com o crescente volume de dados transferidos durante a computação de alto desempenho, há necessidade de expandir as redes, observou Igor Zarubinsky, vice-presidente de desenvolvimento de infraestrutura da MTS, chefe da plataforma de nuvem MWS. Há também uma necessidade crescente de armazenamento de dados rápido e de alta capacidade. “O desenvolvimento da IA ​​leva a um aumento na demanda por drives e discos. No futuro, será necessária a construção de data centers de alta densidade e com uso intensivo de energia”, prevê.

O diretor de TI do provedor de nuvem Oxygen, Alexander Budkin, argumenta que a crescente demanda dos clientes por alta potência exige “repensar o data center como o produto comercial final para o mercado de TI”. Para ele, se a tendência continuar por quatro a cinco anos, será possível falar em projetos de construção de data centers específicos para IA: “Eles podem estar localizados em regiões de clima frio, alimentados por eletricidade de usinas que utilizam gás associado .” Tais projetos já foram discutidos antes, mas foram considerados impraticáveis ​​devido ao relativo subdesenvolvimento dos canais de comunicação, mas a IA é “mais tolerante com atrasos”.

avalanche

Postagens recentes

PlayStation 6 pode ter que esperar até 2028-2029 – Sony considera adiamento devido à crise de memória

Segundo uma reportagem recente da Bloomberg, a Sony está considerando adiar o lançamento do seu…

17 minutos atrás

As GPUs Xe Next de próxima geração da Intel serão otimizadas para IA, não para jogos.

Como parte de sua estratégia de desenvolvimento atualizada, a Intel confirmou seus planos de lançar…

1 hora atrás

Os desenvolvedores veteranos de Diablo lançaram uma demo em grande escala do RPG de ação de próxima geração, Darkhaven, no Steam.

Uma demo de Darkhaven, um RPG de ação e fantasia sombria de nova geração da…

2 horas atrás

Milhares de usuários reclamaram de problemas com a rede social X.

Inúmeros usuários relataram que a rede social X estava indisponível. Os relatos de problemas começaram…

2 horas atrás

Calendário de lançamentos – 16 a 22 de fevereiro: Styx: Blades of Greed, Norse: Oath of Blood e Forgotlings.

A semana de 16 a 22 de fevereiro foi especialmente diversificada, com aventuras sombrias em…

3 horas atrás