A Yandex B2B Tech abriu o acesso ao Alice AI LLM, a família de redes neurais mais poderosa da Yandex.

A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.

A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.

Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru

O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.

A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.

Fonte:

admin

Compartilhar
Publicado por
admin

Postagens recentes

IA na Vigia: As Perspectivas dos Data Centers Orbitais / Inteligência Artificial

No entanto, nem todos os especialistas estão dispostos a ver o espaço próximo como um…

54 minutos atrás

O novo assistente de IA da Adobe pode usar os aplicativos da Creative Cloud para executar tarefas.

Em outubro passado, a Adobe, como parte do Projeto Moonlight, apresentou um assistente de IA…

2 horas atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

2 horas atrás

Invocação de criaturas, talismãs e novas armas épicas: uma grande atualização chegou para Titan Quest 2.

A editora THQ Nordic e os desenvolvedores do estúdio alemão Grimlore Games anunciaram o lançamento…

2 horas atrás

O Google lançou o aplicativo Gemini para macOS.

O Google lançou um aplicativo Gemini completo para computadores com o sistema operacional macOS da…

2 horas atrás

Cientistas chineses fizeram uma descoberta inovadora na gravação holográfica ultradensa.

Apesar das perspectivas promissoras, a gravação holográfica ainda não alcançou sucesso comercial. Gravar e decodificar…

3 horas atrás