A Yandex B2B Tech (grupo de negócios da Yandex que reúne as tecnologias e ferramentas da empresa para usuários corporativos, incluindo os produtos Yandex Cloud e Yandex 360) anunciou a disponibilidade de uma nova família de modelos generativos — Alice AI LLM — para usuários da plataforma Yandex Cloud.
A Alice AI LLM é o principal desenvolvimento de IA da Yandex. O modelo é construído sobre a arquitetura Mixture of Experts (MoE) com tecnologia de treinamento por reforço (Aprendizado por Reforço Online – RL Online). A rede neural compreende aproximadamente 20 idiomas (incluindo japonês) e pode ser usada para resolver problemas complexos: busca em bases de conhecimento e geração de resultados com base nas informações encontradas (scripts RAG), análise de documentos, geração de relatórios e análises, extração de informações e preenchimento automático de campos, formulários e bancos de dados CRM, além da criação de assistentes de IA orientados ao ser humano.
Fonte da imagem: Serviço de imprensa da Yandex / company.yandex.ru
O Alice AI LLM está disponível através da API de Complementos e da API de Respostas compatíveis com OpenAI, bem como por meio de sua própria API de geração de texto nos formatos REST e gRPC. O modelo suporta integração com as populares bibliotecas de código aberto LangChain, AutoGPT e LlamaIndex.
A Yandex B2B Tech destaca que o custo de uso do Alice AI é significativamente menor do que o de redes neurais de código aberto devido à sua tokenização otimizada para o idioma russo. Um token no Alice AI contém aproximadamente 4 a 5 caracteres cirílicos, enquanto os modelos de código aberto contêm aproximadamente 2 a 3 caracteres. Portanto, o custo final de uso do Alice AI é de 1,5 a 2 vezes menor do que o de modelos de código aberto com o mesmo preço. Além disso, as solicitações do usuário para a rede neural e as respostas do modelo têm preços diferentes: os tokens de entrada da rede neural são quatro vezes mais baratos do que os tokens de saída, permitindo um uso mais eficiente do modelo.
Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER. | Você consegue escrever um melhor? Teremos todo o prazer em receber sua mensagem.
Fonte:
A Apple planejava aprimorar o aplicativo Câmera do iPhone 18 Pro e considerou adquirir a…
A Super Micro Computer, fornecedora de servidores de IA envolvida em um escândalo de contrabando…
Quando a OpenAI anunciou pela primeira vez sua intenção de lançar publicidade no ChatGPT, as…
No início deste mês, a Apple anunciou os processadores M5 Pro e M5 Max e…
A AMD deveria apresentar seu novo processador topo de linha, o Ryzen 9 9950X3D2, esta…
Provedores de internet residencial em Moscou instruíram seus especialistas técnicos a implantarem urgentemente sistemas que…