Token Factory: A Nebius, anteriormente Yandex NV, lançou a plataforma Token Factory para inferência baseada em modelos de IA abertos.

A Nebius (antiga controladora da Yandex) lançou a plataforma Nebius Token Factory para inferência: ela permite a implantação e otimização de modelos de IA abertos e personalizados em escala, com alto nível de confiabilidade e controle.

A Nebius observa que o uso de modelos de IA proprietários pode criar desafios de escalabilidade. Embora os modelos abertos e personalizados abordem essas limitações, gerenciá-los e garantir a segurança continua sendo uma tarefa tecnicamente complexa e que exige muitos recursos para a maioria das equipes. A plataforma Nebius Token Factory resolve esses desafios: ela combina a flexibilidade dos modelos abertos com a capacidade de gerenciamento, o desempenho e a relação custo-benefício que as organizações exigem para projetos de IA em larga escala.

A Nebius Token Factory é baseada na infraestrutura abrangente de IA da Nebius. A nova plataforma integra inferência de alto desempenho, pós-treinamento e gerenciamento de acesso. Há suporte para mais de 40 modelos de código aberto, incluindo as versões mais recentes do Deep Seek, Llama, OpenAI e Qwen.

Fonte da imagem: Nebius

Os principais benefícios do Nebius Token Factory incluem a conformidade com os requisitos de segurança corporativos (HIPAA, ISO 27001 e ISO 27799), latência previsível (menos de 1 segundo), escalonamento automático de throughput e disponibilidade de 99,9%. A inferência é realizada em data centers na Europa e nos EUA, sem que nenhum dado seja armazenado nos servidores da Nebius. A plataforma utiliza o ecossistema de nuvem Nebius AI Cloud 3.0 Aether, que oferece segurança de nível empresarial, monitoramento proativo e desempenho estável.

O Nebius Token Factory é indicado para uma ampla gama de tarefas de IA: desde chatbots inteligentes, assistentes de codificação e RAG (Real-Action Group) até buscas de alto desempenho, análise de documentos e suporte automatizado ao cliente. Ferramentas integradas de ajuste fino e destilação permitem que as empresas adaptem grandes modelos de código aberto aos seus próprios dados. Isso reduz os custos de inferência em até 70%. Os modelos otimizados podem então ser implantados rapidamente sem a necessidade de configuração manual da infraestrutura.

Se você notar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever uma versão melhor? Ficaremos felizes em receber suas sugestões.

Fonte:

admin

Postagens recentes

Acredite ou não: o desenvolvedor de Graveyard Keeper 2 responde às acusações de uso de IA generativa.

O recente anúncio de Graveyard Keeper 2, um simulador de zelador de cemitério medieval do…

30 minutos atrás

A espaçonave Cygnus XL, em sua versão ampliada, entregará hoje 5 toneladas de carga à ISS.

A NASA anunciou no sábado o lançamento de um foguete Falcon 9 transportando a espaçonave…

30 minutos atrás

O bloqueio nacional da internet no Irã ultrapassou 1.000 horas.

No final de fevereiro, as autoridades iranianas decidiram interromper o acesso à internet em todo…

30 minutos atrás

A Philips lançou o monitor Evnia 27M2G5800 com suporte para 5K a 165 Hz ou QHD a 330 Hz.

A Philips apresentou o Evnia 27M2G5800, um monitor gamer de 27 polegadas equipado com um…

45 minutos atrás

Escape from Tarkov no espaço: Fragmentary Order, o jogo de tiro de ficção científica hardcore da próxima geração, é anunciado.

O novo estúdio de jogos Rant, com o apoio da editora Cor3, revelou Fragmentary Order,…

2 horas atrás

A Red Hat demitiu centenas de programadores na China para transferir o desenvolvimento para a Índia.

A Red Hat parece ter eliminado completamente sua equipe de desenvolvimento na China, deixando de…

2 horas atrás