Na conferência GoCloud 2026, a provedora russa de serviços em nuvem Cloud.ru anunciou a criação de uma linha de negócios separada para soluções de IA. Essa nova plataforma, Neocloud, é baseada em aceleradores de GPU.
No desenvolvimento da Neocloud, a Cloud.ru aproveitou sua experiência na construção de infraestrutura de IA e no trabalho com diversos tipos de GPUs. Sob o modelo GPU-as-a-Service (GPUaaS), a provedora oferece acesso a milhares de aceleradores de IA modernos em uma nuvem pública. Implantações híbridas usando infraestrutura privada também estão disponíveis.
A Neocloud foi projetada para a implementação prática de IA em processos de negócios. Os clientes contam com um ambiente único e gerenciado que integra infraestrutura, dados e ferramentas. Ela suporta todo o ciclo de trabalho com grandes modelos de linguagem (LLM) — do desenvolvimento e treinamento à inferência e operação. Os recursos podem ser dimensionados de acordo com as tarefas a serem executadas: GPUs individuais ou clusters de computação distribuída completos podem ser utilizados. A infraestrutura pode ser adaptada a diferentes estágios do ciclo de vida do modelo de IA.

Fonte da imagem: Cloud.ru
“Com acesso limitado a GPUs e altos custos de hardware, as empresas enfrentam uma limitação crucial: a incapacidade de gerenciar recursos computacionais de forma flexível. A vantagem do formato Neocloud é o uso eficiente de aceleradores gráficos para diversas cargas de trabalho, desde o retreinamento de modelos até a inferência”, afirma Alena Drobyshevskaya, Diretora de Sucesso do Cliente da Cloud.ru.
A Neocloud oferece diversos serviços de GPU como serviço (GPU-aaS), incluindo servidores dedicados e recursos virtualizados gerenciados por Kubernetes, clusters de alto desempenho e muito mais. O treinamento distribuído é suportado pela plataforma proprietária Evolution Distributed Train, juntamente com ferramentas padrão de gerenciamento de computação. Monitoramento proativo, substituição automática de nós com falha, reinicialização de tarefas de treinamento e gerenciamento de filas são recursos implementados. De acordo com a Cloud.ru, a distribuição eficiente de recursos entre tarefas de tamanhos variados garante 98% de disponibilidade da infraestrutura, enquanto a otimização de custos atinge 80%.
“Hoje, as empresas precisam de mais do que apenas acesso a GPUs, mas de um ambiente onde possam trabalhar com IA na prática — da experimentação à escalabilidade de soluções. Essencialmente, a nuvem está se tornando a base para a implementação de uma estratégia de IA, permitindo que elas fechem todo o ciclo de modelagem e evitem investir em capacidade excessiva”, enfatiza Mikhail Lobotsky, CEO interino da Cloud.ru.
Se você encontrar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Ficaremos felizes em receber sua contribuição.
Fonte: