Yandex lançou a rede neural generativa de terceira geração YandexGPT Lite

Yandex apresentou oficialmente uma versão leve de sua rede neural generativa de terceira geração, YandexGPT 3 Lite. O serviço de IA está disponível para clientes da plataforma em nuvem Yandex Cloud por meio da API apropriada. Uma rede neural pode ser útil para vários casos de uso, como chatbots, verificação ortográfica ou análise de dados.

Fonte da imagem: Yandex

A empresa destacou que a nova versão da rede neural é adequada para uso em diversos segmentos de negócios. A utilização do YandexGPT 3 Lite permitirá otimizar o processo de execução de diversas tarefas, incluindo consultar clientes por telefone e em chats, preparar respostas para serviços de suporte, gerar materiais de marketing, etc. O algoritmo de serviço de IA será útil para analisar informações.

De acordo com os desenvolvedores do Yandex, o YandexGPT 3 Lite é superior ao modelo de IA da geração anterior em muitos aspectos. Ao testar o modelo de idioma no YaMMLU_ru (a versão em russo do teste de benchmark internacional MMLU), descobriu-se que o YandexGPT 3 Lite fornece 6% mais respostas corretas do que o modelo YandexGPT 2 Lite.

Os algoritmos também foram comparados pelo método Lado a Lado, onde devem responder às mesmas questões, sendo a melhor resposta selecionada por um grupo de especialistas. Como resultado, descobriu-se que o YandexGPT 3 Lite responde melhor em 68% dos casos. Mesmo durante os testes, os especialistas avaliaram quão bem o YandexGPT 3 Lite lida com as tarefas de classificação, geração de conteúdo, resposta a perguntas, etc. Também é mencionado que o novo algoritmo comete menos erros ortográficos e factuais em comparação com o YandexGPT 2 Lite.

No processo de criação de um novo modelo de IA, os desenvolvedores aprimoraram todas as etapas do treinamento. A seleção de dados para a fase preliminar da formação foi melhorada, aumentando assim a partilha de informação útil. A tecnologia de aprendizagem curricular também foi usada para aumentar gradualmente a complexidade dos dados. Na segunda etapa do treinamento, que incluiu aprendizagem por reforço, o modelo foi aprimorado para avaliar a qualidade das respostas do algoritmo. Além disso, a tecnologia Grouped Query Attention apareceu na arquitetura da rede neural para acelerar o processamento de dados sem perda de qualidade.

O custo de uso do YandexGPT 3 Lite é de 20 copeques por 1.000 tokens. Novos usuários do Yandex Cloud poderão testar o serviço de IA em modo de demonstração gratuitamente. O novo modelo substituirá a versão anterior do algoritmo dentro de um mês.

avalanche

Postagens recentes

Lisa Su prometeu um crescimento explosivo da receita: servidores e IA trarão dezenas de bilhões para a AMD.

Uma análise mais aprofundada das declarações da CEO da AMD, Lisa Su, no evento trimestral,…

45 minutos atrás

A Take-Two está implementando ativamente IA generativa em seus fluxos de trabalho, mas não em GTA VI – é um jogo feito à mão.

Strauss Zelnick, CEO da Take-Two Interactive, falou com o GamesIndustry.biz sobre a integração da IA…

1 hora atrás

A OpenAI nomeou um Diretor de Preparação para supervisionar o desenvolvimento de IA segura.

A segurança da inteligência artificial é um tema extremamente sensível nos dias de hoje. Os…

2 horas atrás

A SpaceX suspendeu os lançamentos do Falcon 9 após uma falha no segundo estágio, colocando em risco a missão Crew-12 à ISS.

A SpaceX suspendeu temporariamente os lançamentos do Falcon 9 após um incidente envolvendo o estágio…

2 horas atrás

A caminho do título de trilionário: Elon Musk se tornou a primeira pessoa na história com uma fortuna de US$ 800 bilhões.

Elon Musk se tornou a primeira pessoa na história a ultrapassar a marca de US$…

2 horas atrás

O CEO da Take-Two esclarece o que está reservado para o GTA Online após o lançamento do GTA VI.

O CEO da Take-Two Interactive, Strauss Zelnick, comentou sobre o futuro do jogo de ação…

2 horas atrás