Yandex lança modelo de IA YandexGPT 5 Lite — ajudará a acelerar o desenvolvimento e a pesquisa de TI

O Yandex abriu o acesso à versão Instruct do modelo de linguagem YandexGPT 5 Lite atualizado, que pode ser usado para fins comerciais e não comerciais. O algoritmo será útil para diferentes pessoas, por exemplo, desenvolvedores e pesquisadores, pois pode ser implementado imediatamente em seu próprio projeto.

Fonte da imagem: Yandex

O modelo de IA não exige muito dos recursos de computação, por isso pode ser testado em seu próprio computador sem a necessidade de equipamentos adicionais. Note-se que, além do treinamento preliminar, o modelo de IA passou por uma etapa adicional de configuração, graças à qual é capaz de executar tarefas específicas mediante solicitações (instruções ou solicitações do usuário). Outra versão do YandexGPT 5 Lite (Pretrain) não passou por essa etapa, então os usuários terão que treiná-lo para suas tarefas eles mesmos.

Os resultados dos testes do YandexGPT 5 Lite Instruct indicam que o algoritmo está próximo em resultados da rede neural chinesa Qwen2.5-7B-Instruct e a supera na execução de tarefas de classificação e marcação de textos, no conhecimento da cultura e dos fatos russos e na capacidade de responder em um determinado formato. As medições do Yandex usando o método de comparação cega (lado a lado) mostraram que o YandexGPT 5 Lite supera o Qwen2.5-7B-Instruct em 62% dos casos e é comparável em qualidade de respostas ao GPT-4o Mini na resolução de tarefas padrão dos serviços Yandex.

Ao mesmo tempo, a licença do modelo de IA foi atualizada e agora ela pode ser usada para qualquer finalidade, inclusive comercial (desde que o volume de tokens de saída não exceda 10 milhões por mês). A empresa acredita que esse volume é suficiente para chatbots em sites de pequeno e médio porte, geração de descrições de produtos em lojas virtuais com alcance limitado, automação de respostas a clientes em centrais de atendimento, etc.

O modelo YandexGPT 5 Lite inclui 8 bilhões de parâmetros e suporta contexto para até 32 mil tokens. Segundo os desenvolvedores, a compactação e a qualidade do algoritmo, a compatibilidade com a biblioteca llama.cpp e o suporte ao formato GPT-Generated Unified Format tornam possível executar o modelo de IA até mesmo em computadores pessoais. Para desenvolvedores e pesquisadores, a versão Instruct do modelo está disponível no Hugging Face, e usuários comuns podem testar o algoritmo em um bate-papo com “Alice” (5 solicitações gratuitas por dia estão disponíveis). Para empresas, o modelo de IA está disponível por meio da API correspondente no Yandex Cloud.

avalanche

Postagens recentes

O retorno de humanos à Lua foi adiado para março depois que o foguete SLS da missão Artemis II apresentou um vazamento.

O ensaio geral da contagem regressiva do foguete SLS para a missão Artemis II foi…

48 minutos atrás

A Giga Computing apresentou placas-mãe para estações de trabalho baseadas no processador Intel Xeon 600.

A Giga Computing, divisão do Gigabyte Group, anunciou algumas das primeiras placas-mãe para estações de…

1 hora atrás

Um novo recorde mundial de velocidade para drones FPV foi estabelecido: 661 km/h.

Helicópteros motorizados e com hélices alcançaram os caças mais rápidos da Segunda Guerra Mundial. Um…

2 horas atrás

“Está ficando cada vez melhor”: Os desenvolvedores de Heroes of Might & Magic: Olden Era encantaram os fãs com uma demonstração da Necrópole atualizada.

Os desenvolvedores do estúdio cipriota com raízes russas, Unfrozen, apresentaram uma nova versão da facção…

4 horas atrás