A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.
A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.
Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru
O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.
A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.
Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.
Fonte:
Nos Estados Unidos, os varejistas começaram a abandonar os preços fixos para memória RAM devido…
O crescimento recorde da receita da Nvidia por vários anos consecutivos é impulsionado pela forte…
Há quase dez anos, o sistema Watson da IBM começou a ser usado para o…
A Huawei apresentou a nova série de smartphones Huawei Mate 80 na China, com alguns…
Em 25 de novembro de 2025, às 12h11, horário local (7h11, horário de Moscou), a…
Embora as montadoras chinesas sejam obcecadas em competir entre si no "teste do alce" —…