O Yandex abriu o acesso à versão Instruct do modelo de linguagem YandexGPT 5 Lite atualizado, que pode ser usado para fins comerciais e não comerciais. O algoritmo será útil para diferentes pessoas, por exemplo, desenvolvedores e pesquisadores, pois pode ser implementado imediatamente em seu próprio projeto.
Fonte da imagem: Yandex
O modelo de IA não exige muito dos recursos de computação, por isso pode ser testado em seu próprio computador sem a necessidade de equipamentos adicionais. Note-se que, além do treinamento preliminar, o modelo de IA passou por uma etapa adicional de configuração, graças à qual é capaz de executar tarefas específicas mediante solicitações (instruções ou solicitações do usuário). Outra versão do YandexGPT 5 Lite (Pretrain) não passou por essa etapa, então os usuários terão que treiná-lo para suas tarefas eles mesmos.
Os resultados dos testes do YandexGPT 5 Lite Instruct indicam que o algoritmo está próximo em resultados da rede neural chinesa Qwen2.5-7B-Instruct e a supera na execução de tarefas de classificação e marcação de textos, no conhecimento da cultura e dos fatos russos e na capacidade de responder em um determinado formato. As medições do Yandex usando o método de comparação cega (lado a lado) mostraram que o YandexGPT 5 Lite supera o Qwen2.5-7B-Instruct em 62% dos casos e é comparável em qualidade de respostas ao GPT-4o Mini na resolução de tarefas padrão dos serviços Yandex.
Ao mesmo tempo, a licença do modelo de IA foi atualizada e agora ela pode ser usada para qualquer finalidade, inclusive comercial (desde que o volume de tokens de saída não exceda 10 milhões por mês). A empresa acredita que esse volume é suficiente para chatbots em sites de pequeno e médio porte, geração de descrições de produtos em lojas virtuais com alcance limitado, automação de respostas a clientes em centrais de atendimento, etc.
O modelo YandexGPT 5 Lite inclui 8 bilhões de parâmetros e suporta contexto para até 32 mil tokens. Segundo os desenvolvedores, a compactação e a qualidade do algoritmo, a compatibilidade com a biblioteca llama.cpp e o suporte ao formato GPT-Generated Unified Format tornam possível executar o modelo de IA até mesmo em computadores pessoais. Para desenvolvedores e pesquisadores, a versão Instruct do modelo está disponível no Hugging Face, e usuários comuns podem testar o algoritmo em um bate-papo com “Alice” (5 solicitações gratuitas por dia estão disponíveis). Para empresas, o modelo de IA está disponível por meio da API correspondente no Yandex Cloud.