Yandex lançou a rede neural generativa de terceira geração YandexGPT Lite

Yandex apresentou oficialmente uma versão leve de sua rede neural generativa de terceira geração, YandexGPT 3 Lite. O serviço de IA está disponível para clientes da plataforma em nuvem Yandex Cloud por meio da API apropriada. Uma rede neural pode ser útil para vários casos de uso, como chatbots, verificação ortográfica ou análise de dados.

Fonte da imagem: Yandex

A empresa destacou que a nova versão da rede neural é adequada para uso em diversos segmentos de negócios. A utilização do YandexGPT 3 Lite permitirá otimizar o processo de execução de diversas tarefas, incluindo consultar clientes por telefone e em chats, preparar respostas para serviços de suporte, gerar materiais de marketing, etc. O algoritmo de serviço de IA será útil para analisar informações.

De acordo com os desenvolvedores do Yandex, o YandexGPT 3 Lite é superior ao modelo de IA da geração anterior em muitos aspectos. Ao testar o modelo de idioma no YaMMLU_ru (a versão em russo do teste de benchmark internacional MMLU), descobriu-se que o YandexGPT 3 Lite fornece 6% mais respostas corretas do que o modelo YandexGPT 2 Lite.

Os algoritmos também foram comparados pelo método Lado a Lado, onde devem responder às mesmas questões, sendo a melhor resposta selecionada por um grupo de especialistas. Como resultado, descobriu-se que o YandexGPT 3 Lite responde melhor em 68% dos casos. Mesmo durante os testes, os especialistas avaliaram quão bem o YandexGPT 3 Lite lida com as tarefas de classificação, geração de conteúdo, resposta a perguntas, etc. Também é mencionado que o novo algoritmo comete menos erros ortográficos e factuais em comparação com o YandexGPT 2 Lite.

No processo de criação de um novo modelo de IA, os desenvolvedores aprimoraram todas as etapas do treinamento. A seleção de dados para a fase preliminar da formação foi melhorada, aumentando assim a partilha de informação útil. A tecnologia de aprendizagem curricular também foi usada para aumentar gradualmente a complexidade dos dados. Na segunda etapa do treinamento, que incluiu aprendizagem por reforço, o modelo foi aprimorado para avaliar a qualidade das respostas do algoritmo. Além disso, a tecnologia Grouped Query Attention apareceu na arquitetura da rede neural para acelerar o processamento de dados sem perda de qualidade.

O custo de uso do YandexGPT 3 Lite é de 20 copeques por 1.000 tokens. Novos usuários do Yandex Cloud poderão testar o serviço de IA em modo de demonstração gratuitamente. O novo modelo substituirá a versão anterior do algoritmo dentro de um mês.

avalanche

Postagens recentes

Reddit irá reprimir os criadores de conteúdo de treinamento de IA

A administração da plataforma Reddit anunciou que atualizará as exceções para robôs (arquivo robots.txt), que…

5 dias atrás

O desenvolvedor do Robotaxi, Cruise, é chefiado por um ex-executivo do Xbox

Marc Whitten, um engenheiro e veterano da indústria de jogos que esteve na vanguarda do…

5 dias atrás

Em resposta a inúmeras reclamações, o primeiro patch para Elden Ring: Shadow of the Erdtree tornou os jogadores mais fortes

A editora Bandai Namco e os desenvolvedores do estúdio FromSoftware anunciaram o lançamento do primeiro…

5 dias atrás