O Yandex abriu o acesso à versão Instruct do modelo de linguagem YandexGPT 5 Lite atualizado, que pode ser usado para fins comerciais e não comerciais. O algoritmo será útil para diferentes pessoas, por exemplo, desenvolvedores e pesquisadores, pois pode ser implementado imediatamente em seu próprio projeto.
Fonte da imagem: Yandex
O modelo de IA não exige muito dos recursos de computação, por isso pode ser testado em seu próprio computador sem a necessidade de equipamentos adicionais. Note-se que, além do treinamento preliminar, o modelo de IA passou por uma etapa adicional de configuração, graças à qual é capaz de executar tarefas específicas mediante solicitações (instruções ou solicitações do usuário). Outra versão do YandexGPT 5 Lite (Pretrain) não passou por essa etapa, então os usuários terão que treiná-lo para suas tarefas eles mesmos.
Os resultados dos testes do YandexGPT 5 Lite Instruct indicam que o algoritmo está próximo em resultados da rede neural chinesa Qwen2.5-7B-Instruct e a supera na execução de tarefas de classificação e marcação de textos, no conhecimento da cultura e dos fatos russos e na capacidade de responder em um determinado formato. As medições do Yandex usando o método de comparação cega (lado a lado) mostraram que o YandexGPT 5 Lite supera o Qwen2.5-7B-Instruct em 62% dos casos e é comparável em qualidade de respostas ao GPT-4o Mini na resolução de tarefas padrão dos serviços Yandex.
Ao mesmo tempo, a licença do modelo de IA foi atualizada e agora ela pode ser usada para qualquer finalidade, inclusive comercial (desde que o volume de tokens de saída não exceda 10 milhões por mês). A empresa acredita que esse volume é suficiente para chatbots em sites de pequeno e médio porte, geração de descrições de produtos em lojas virtuais com alcance limitado, automação de respostas a clientes em centrais de atendimento, etc.
O modelo YandexGPT 5 Lite inclui 8 bilhões de parâmetros e suporta contexto para até 32 mil tokens. Segundo os desenvolvedores, a compactação e a qualidade do algoritmo, a compatibilidade com a biblioteca llama.cpp e o suporte ao formato GPT-Generated Unified Format tornam possível executar o modelo de IA até mesmo em computadores pessoais. Para desenvolvedores e pesquisadores, a versão Instruct do modelo está disponível no Hugging Face, e usuários comuns podem testar o algoritmo em um bate-papo com “Alice” (5 solicitações gratuitas por dia estão disponíveis). Para empresas, o modelo de IA está disponível por meio da API correspondente no Yandex Cloud.
Em dezembro passado, as autoridades da UE iniciaram uma investigação antitruste contra a Meta✴Platforms, sob…
O Serviço Federal Antimonopólio pretende analisar as promoções e a publicidade das operadoras de telecomunicações…
Embora demonstre sua lealdade política geral aos Estados Unidos, Taiwan ainda não impôs restrições proporcionais…
Até recentemente, um aumento de duas vezes no número de pessoas dispostas a comprar ações…
A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…
O Google apresentou seu novo modelo Gemini 3.5 Live Translate, projetado para tradução de voz…