Yandex lançou a rede neural generativa de terceira geração YandexGPT Lite

Yandex apresentou oficialmente uma versão leve de sua rede neural generativa de terceira geração, YandexGPT 3 Lite. O serviço de IA está disponível para clientes da plataforma em nuvem Yandex Cloud por meio da API apropriada. Uma rede neural pode ser útil para vários casos de uso, como chatbots, verificação ortográfica ou análise de dados.

Fonte da imagem: Yandex

A empresa destacou que a nova versão da rede neural é adequada para uso em diversos segmentos de negócios. A utilização do YandexGPT 3 Lite permitirá otimizar o processo de execução de diversas tarefas, incluindo consultar clientes por telefone e em chats, preparar respostas para serviços de suporte, gerar materiais de marketing, etc. O algoritmo de serviço de IA será útil para analisar informações.

De acordo com os desenvolvedores do Yandex, o YandexGPT 3 Lite é superior ao modelo de IA da geração anterior em muitos aspectos. Ao testar o modelo de idioma no YaMMLU_ru (a versão em russo do teste de benchmark internacional MMLU), descobriu-se que o YandexGPT 3 Lite fornece 6% mais respostas corretas do que o modelo YandexGPT 2 Lite.

Os algoritmos também foram comparados pelo método Lado a Lado, onde devem responder às mesmas questões, sendo a melhor resposta selecionada por um grupo de especialistas. Como resultado, descobriu-se que o YandexGPT 3 Lite responde melhor em 68% dos casos. Mesmo durante os testes, os especialistas avaliaram quão bem o YandexGPT 3 Lite lida com as tarefas de classificação, geração de conteúdo, resposta a perguntas, etc. Também é mencionado que o novo algoritmo comete menos erros ortográficos e factuais em comparação com o YandexGPT 2 Lite.

No processo de criação de um novo modelo de IA, os desenvolvedores aprimoraram todas as etapas do treinamento. A seleção de dados para a fase preliminar da formação foi melhorada, aumentando assim a partilha de informação útil. A tecnologia de aprendizagem curricular também foi usada para aumentar gradualmente a complexidade dos dados. Na segunda etapa do treinamento, que incluiu aprendizagem por reforço, o modelo foi aprimorado para avaliar a qualidade das respostas do algoritmo. Além disso, a tecnologia Grouped Query Attention apareceu na arquitetura da rede neural para acelerar o processamento de dados sem perda de qualidade.

O custo de uso do YandexGPT 3 Lite é de 20 copeques por 1.000 tokens. Novos usuários do Yandex Cloud poderão testar o serviço de IA em modo de demonstração gratuitamente. O novo modelo substituirá a versão anterior do algoritmo dentro de um mês.

avalanche

Postagens recentes

A Alibaba Cloud precisará de 10 vezes mais poder computacional do que em 2022, enquanto a Tencent aprendeu a se virar com menos.

Segundo Eddie Wu, CEO da Alibaba Cloud, a empresa planeja aumentar em dez vezes a…

6 horas atrás

Corrida, comércio e continuação da história: os desenvolvedores de Subnautica 2 revelam planos de melhoria para o jogo nos próximos meses.

Os desenvolvedores do estúdio americano Unknown Worlds Entertainment (de propriedade da Krafton) anunciaram planos para…

6 horas atrás

A Microsoft planeja eliminar a principal causa de erros de tela azul no Windows 11.

Na WinHEC 2026 (Windows Hardware Engineering Conference), a Microsoft apresentou sua Iniciativa de Qualidade de…

6 horas atrás

Cientistas criaram uma água-viva robótica sem bateria que nada mais rápido do que qualquer outro robô e pode curar pessoas por dentro.

O dispositivo, batizado de Robô Magnético Flexível Água-viva (J-MSR, na sigla em inglês), imita o…

6 horas atrás