Yandex lança modelo de IA YandexGPT 5 Lite — ajudará a acelerar o desenvolvimento e a pesquisa de TI

O Yandex abriu o acesso à versão Instruct do modelo de linguagem YandexGPT 5 Lite atualizado, que pode ser usado para fins comerciais e não comerciais. O algoritmo será útil para diferentes pessoas, por exemplo, desenvolvedores e pesquisadores, pois pode ser implementado imediatamente em seu próprio projeto.

Fonte da imagem: Yandex

O modelo de IA não exige muito dos recursos de computação, por isso pode ser testado em seu próprio computador sem a necessidade de equipamentos adicionais. Note-se que, além do treinamento preliminar, o modelo de IA passou por uma etapa adicional de configuração, graças à qual é capaz de executar tarefas específicas mediante solicitações (instruções ou solicitações do usuário). Outra versão do YandexGPT 5 Lite (Pretrain) não passou por essa etapa, então os usuários terão que treiná-lo para suas tarefas eles mesmos.

Os resultados dos testes do YandexGPT 5 Lite Instruct indicam que o algoritmo está próximo em resultados da rede neural chinesa Qwen2.5-7B-Instruct e a supera na execução de tarefas de classificação e marcação de textos, no conhecimento da cultura e dos fatos russos e na capacidade de responder em um determinado formato. As medições do Yandex usando o método de comparação cega (lado a lado) mostraram que o YandexGPT 5 Lite supera o Qwen2.5-7B-Instruct em 62% dos casos e é comparável em qualidade de respostas ao GPT-4o Mini na resolução de tarefas padrão dos serviços Yandex.

Ao mesmo tempo, a licença do modelo de IA foi atualizada e agora ela pode ser usada para qualquer finalidade, inclusive comercial (desde que o volume de tokens de saída não exceda 10 milhões por mês). A empresa acredita que esse volume é suficiente para chatbots em sites de pequeno e médio porte, geração de descrições de produtos em lojas virtuais com alcance limitado, automação de respostas a clientes em centrais de atendimento, etc.

O modelo YandexGPT 5 Lite inclui 8 bilhões de parâmetros e suporta contexto para até 32 mil tokens. Segundo os desenvolvedores, a compactação e a qualidade do algoritmo, a compatibilidade com a biblioteca llama.cpp e o suporte ao formato GPT-Generated Unified Format tornam possível executar o modelo de IA até mesmo em computadores pessoais. Para desenvolvedores e pesquisadores, a versão Instruct do modelo está disponível no Hugging Face, e usuários comuns podem testar o algoritmo em um bate-papo com “Alice” (5 solicitações gratuitas por dia estão disponíveis). Para empresas, o modelo de IA está disponível por meio da API correspondente no Yandex Cloud.

avalanche

Postagens recentes

A Comissão Europeia exige que a Meta restaure o acesso de agentes de IA concorrentes no WhatsApp.

Em dezembro passado, as autoridades da UE iniciaram uma investigação antitruste contra a Meta✴Platforms, sob…

1 hora atrás

O Serviço Federal Antimonopólio verificará a legalidade da publicidade das operadoras sobre o 5G — “tecnologias que ainda não estão implementadas”.

O Serviço Federal Antimonopólio pretende analisar as promoções e a publicidade das operadoras de telecomunicações…

2 horas atrás

Taiwan está considerando limitar o fornecimento de chips de IA para a China como parte de sistemas já finalizados.

Embora demonstre sua lealdade política geral aos Estados Unidos, Taiwan ainda não impôs restrições proporcionais…

2 horas atrás

Os investidores estão prontos para comprar ações da SpaceX no valor de mais de US$ 250 bilhões, quatro vezes o valor da oferta.

Até recentemente, um aumento de duas vezes no número de pessoas dispostas a comprar ações…

5 horas atrás

A Microsoft corrigiu três vulnerabilidades zero-day perigosas e outras 200 falhas em seu software.

A Microsoft lançou sua atualização de junho na terça-feira de atualizações, corrigindo 200 vulnerabilidades, incluindo…

9 horas atrás