A Yandex B2B Tech abriu o acesso ao Alice AI LLM, a família de redes neurais mais poderosa da Yandex.

A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.

A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.

Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru

O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.

A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.

Fonte:

admin

Compartilhar
Publicado por
admin

Postagens recentes

As placas gráficas Radeon RX 6000 e RX 7000 receberão suporte para o escalonamento AMD FSR 4.1.

A AMD atendeu aos pedidos insistentes dos jogadores para fornecer suporte à tecnologia de escalonamento…

17 minutos atrás

Amazon cancela MMO de Senhor dos Anéis, mas já tem um novo jogo “emocionante”.

A pedido do Eurogamer, Jeff Grattis, chefe da divisão de jogos da Amazon, comentou sobre…

35 minutos atrás

A MSI lançará uma GeForce RTX 5080 em edição muito limitada, inspirada em “The Mandalorian e Grogu”.

A MSI apresentou a placa de vídeo GeForce RTX 5080 16GB OC em uma edição…

60 minutos atrás

A Anthropic afirmou que a IA já escreve mais de 90% do seu código.

É como se as empresas de tecnologia estivessem numa corrida para ver quem consegue fazer…

60 minutos atrás

O Google está reduzindo os limites de armazenamento: alguns novos usuários do Gmail estão recebendo apenas 5 GB em vez de 15 GB.

Ao criar uma conta do Gmail, os novos usuários tradicionalmente recebiam 15 GB de armazenamento…

60 minutos atrás

A OpenAI propôs a criação de um órgão global de supervisão da IA ​​com a participação da China e dos EUA.

A OpenAI apoiaria a criação de um órgão de governança global de IA liderado pelos…

1 hora atrás