Yandex lança modelo de IA YandexGPT 5 Lite — ajudará a acelerar o desenvolvimento e a pesquisa de TI

O Yandex abriu o acesso à versão Instruct do modelo de linguagem YandexGPT 5 Lite atualizado, que pode ser usado para fins comerciais e não comerciais. O algoritmo será útil para diferentes pessoas, por exemplo, desenvolvedores e pesquisadores, pois pode ser implementado imediatamente em seu próprio projeto.

Fonte da imagem: Yandex

O modelo de IA não exige muito dos recursos de computação, por isso pode ser testado em seu próprio computador sem a necessidade de equipamentos adicionais. Note-se que, além do treinamento preliminar, o modelo de IA passou por uma etapa adicional de configuração, graças à qual é capaz de executar tarefas específicas mediante solicitações (instruções ou solicitações do usuário). Outra versão do YandexGPT 5 Lite (Pretrain) não passou por essa etapa, então os usuários terão que treiná-lo para suas tarefas eles mesmos.

Os resultados dos testes do YandexGPT 5 Lite Instruct indicam que o algoritmo está próximo em resultados da rede neural chinesa Qwen2.5-7B-Instruct e a supera na execução de tarefas de classificação e marcação de textos, no conhecimento da cultura e dos fatos russos e na capacidade de responder em um determinado formato. As medições do Yandex usando o método de comparação cega (lado a lado) mostraram que o YandexGPT 5 Lite supera o Qwen2.5-7B-Instruct em 62% dos casos e é comparável em qualidade de respostas ao GPT-4o Mini na resolução de tarefas padrão dos serviços Yandex.

Ao mesmo tempo, a licença do modelo de IA foi atualizada e agora ela pode ser usada para qualquer finalidade, inclusive comercial (desde que o volume de tokens de saída não exceda 10 milhões por mês). A empresa acredita que esse volume é suficiente para chatbots em sites de pequeno e médio porte, geração de descrições de produtos em lojas virtuais com alcance limitado, automação de respostas a clientes em centrais de atendimento, etc.

O modelo YandexGPT 5 Lite inclui 8 bilhões de parâmetros e suporta contexto para até 32 mil tokens. Segundo os desenvolvedores, a compactação e a qualidade do algoritmo, a compatibilidade com a biblioteca llama.cpp e o suporte ao formato GPT-Generated Unified Format tornam possível executar o modelo de IA até mesmo em computadores pessoais. Para desenvolvedores e pesquisadores, a versão Instruct do modelo está disponível no Hugging Face, e usuários comuns podem testar o algoritmo em um bate-papo com “Alice” (5 solicitações gratuitas por dia estão disponíveis). Para empresas, o modelo de IA está disponível por meio da API correspondente no Yandex Cloud.

avalanche

Postagens recentes

Elon Musk admitiu que os volumes de produção do robô Tesla Optimus serão modestos inicialmente.

As vendas de veículos elétricos da Tesla estão em declínio inexorável, no mínimo, e é…

31 minutos atrás

Filmado em Hollywood? Por que Stanley Kubrick não conseguiu simular fisicamente o Moonwalk / Offsyanka

⇡#Parte 1. Elegância cinematográfica versus monstruosidade biomecânica Qualquer pessoa que estude imagens das missões lunares…

6 horas atrás

Um vazamento mostra os óculos Samsung Galaxy de todos os ângulos.

A Samsung deverá apresentar seus primeiros óculos inteligentes antes do final deste ano. Embora a…

7 horas atrás

A Microsoft estava desenvolvendo um sistema operacional de IA distinto do Windows, com profunda integração do Copilot e de agentes.

De acordo com o Windows Central, a Microsoft explorou a possibilidade de criar um sistema…

9 horas atrás