Categorias: Carros, motos, veículos

Token Factory: A Nebius, anteriormente Yandex NV, lançou a plataforma Token Factory para inferência baseada em modelos de IA abertos.

A Nebius (antiga controladora da Yandex) lançou a plataforma Nebius Token Factory para inferência: ela permite a implantação e otimização de modelos de IA abertos e personalizados em escala, com alto nível de confiabilidade e controle.

A Nebius observa que o uso de modelos de IA proprietários pode criar desafios de escalabilidade. Embora os modelos abertos e personalizados abordem essas limitações, gerenciá-los e garantir a segurança continua sendo uma tarefa tecnicamente complexa e que exige muitos recursos para a maioria das equipes. A plataforma Nebius Token Factory resolve esses desafios: ela combina a flexibilidade dos modelos abertos com a capacidade de gerenciamento, o desempenho e a relação custo-benefício que as organizações exigem para projetos de IA em larga escala.

A Nebius Token Factory é baseada na infraestrutura abrangente de IA da Nebius. A nova plataforma integra inferência de alto desempenho, pós-treinamento e gerenciamento de acesso. Há suporte para mais de 40 modelos de código aberto, incluindo as versões mais recentes do Deep Seek, Llama, OpenAI e Qwen.

Fonte da imagem: Nebius

Os principais benefícios do Nebius Token Factory incluem a conformidade com os requisitos de segurança corporativos (HIPAA, ISO 27001 e ISO 27799), latência previsível (menos de 1 segundo), escalonamento automático de throughput e disponibilidade de 99,9%. A inferência é realizada em data centers na Europa e nos EUA, sem que nenhum dado seja armazenado nos servidores da Nebius. A plataforma utiliza o ecossistema de nuvem Nebius AI Cloud 3.0 Aether, que oferece segurança de nível empresarial, monitoramento proativo e desempenho estável.

O Nebius Token Factory é indicado para uma ampla gama de tarefas de IA: desde chatbots inteligentes, assistentes de codificação e RAG (Real-Action Group) até buscas de alto desempenho, análise de documentos e suporte automatizado ao cliente. Ferramentas integradas de ajuste fino e destilação permitem que as empresas adaptem grandes modelos de código aberto aos seus próprios dados. Isso reduz os custos de inferência em até 70%. Os modelos otimizados podem então ser implantados rapidamente sem a necessidade de configuração manual da infraestrutura.

Se você notar algum erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever uma versão melhor? Ficaremos felizes em receber suas sugestões.

Fonte:

admin

Próximo A Micron vai adiar por vários anos a construção de suas megafábricas de memória em Nova York. »

Anterior « O jogo de sobrevivência dos anões "O Senhor dos Anéis: Retorno a Moria" ganhará uma sequência – um funcionário demitido revelou acidentalmente os planos dos desenvolvedores para a continuação ao avalanche noticias.

Deixar comentário

Publicado por

admin

3 meses atrás

Postagens recentes

Módulos de RAM, cartões de memória, pen drives, leitores de cartões

A SK Hynix supera a Samsung em lucro anual pela primeira vez em meio ao boom da IA.

Historicamente, a Samsung Electronics tem sido consistentemente a maior fornecedora mundial de componentes semicondutores em…

17 minutos atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

O maior investimento da Nvidia será na OpenAI, mas não estamos falando de 100 bilhões de dólares.

Na última semana, as discussões sobre a relação entre a Nvidia e a OpenAI voltaram…

5 horas atrás

Processadores

Intel e AMD, preparem-se: a Nvidia confirmou o desenvolvimento do processador N1 para PCs em colaboração com a MediaTek.

Jensen Huang confirmou publicamente a colaboração da Nvidia com a MediaTek no desenvolvimento dos processadores…

10 horas atrás

Leitores portáteis de áudio / vídeo, gravadores de voz, livros eletrônicos

A Samsung apresentou o primeiro display E-Ink colorido do mundo com uma estrutura feita de fitoplâncton.

Quase todo o plástico que vemos ao nosso redor é feito de materiais orgânicos. Mas…

10 horas atrás

Desenvolvimento e fabricação de eletrônicos

As placas GeForce RTX 5090, com preços recomendados, esgotaram em minutos: a Nvidia lançou o primeiro lote de placas Founders Edition deste ano.

O primeiro lote de placas gráficas Founders Edition enviado para a loja oficial da Nvidia…

11 horas atrás

Zona de Quarentena: A Última Verificação – sem emoções durante a inspeção. Revisão

O apocalipse zumbi chegou. A civilização humana entrou em colapso e apenas pequenos grupos de…