A Yandex B2B Tech abriu o acesso ao Alice AI LLM, a família de redes neurais mais poderosa da Yandex.

A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.

A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.

Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru

O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.

A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.

Fonte:

admin

Compartilhar
Publicado por
admin

Postagens recentes

“Você tem o melhor dos dois mundos”: a Apple explica por que os processadores M5 agora têm três tipos de núcleos.

No início deste mês, a Apple anunciou os processadores M5 Pro e M5 Max e…

2 horas atrás

Os provedores de internet residencial em Moscou estão se preparando para implementar “listas brancas”, mas isso não é certo.

Provedores de internet residencial em Moscou instruíram seus especialistas técnicos a implantarem urgentemente sistemas que…

4 horas atrás