A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.
A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.

Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru
O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.
A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.
Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.
Fonte:
