“O chatbot YandexGPT aprendeu a conduzir conversas relacionadas com o usuário”

A equipe de desenvolvimento Yandex anunciou a expansão da funcionalidade do modelo de linguagem AI de nova geração YandexGPT (YaLM 2.0) – agora a rede neural pode se comunicar com o usuário e escrever respostas com base no histórico de mensagens anteriores.

Fonte da imagem: Yandex (company.yandex.ru)

O YandexGPT está embutido no assistente virtual – em “Alice” e é ativado mediante a solicitação “Alice, vamos pensar nisso”. O modelo de IA lembra as falas e responde a perguntas esclarecedoras. Isso permite que você se comunique com ela, como com uma pessoa que segue o fio da conversa.

Segundo os desenvolvedores, a inclusão do suporte de contexto no YandexGPT exigia a solução de várias tarefas tecnicamente complexas. “Foi necessário ensinar a rede neural a entender quando levar em conta as réplicas anteriores e quando não. Para fazer isso, ela foi retreinada em exemplos de referência de diálogos impessoais. Em menos de três semanas, os usuários fizeram a Alice dezenas de milhares de perguntas que exigiam uma resposta contextual, e os treinadores de IA ensinaram o modelo a dar a resposta mais relevante para essas perguntas. Diálogos do conjunto de dados Open Source do Open Assistant também foram usados”, explicam os especialistas da empresa.

O YandexGPT foi apresentado ao público em geral em 17 de maio de 2023. O modelo de linguagem AI de última geração está disponível no Yandex Browser, o aplicativo móvel da Yandex, a linha de alto-falantes e TVs inteligentes da empresa e na página inicial da Yandex (ya.ru). O desenvolvedor planeja treinar a rede neural com novos conhecimentos e implementá-la em outros serviços e produtos da empresa, principalmente em busca.

avalanche

Postagens recentes

A Tesla desclassificou relatórios de acidentes envolvendo seus robôs-táxi.

A Tesla divulgou informações sobre pelo menos dois acidentes envolvendo seus robotáxis. Os acidentes ocorreram…

1 hora atrás

O ArXiv proibiu cientistas de publicarem artigos gerados por redes neurais, com uma proibição de um ano.

A plataforma de publicação de pré-prints científicos arXiv começará a bloquear autores que publicarem artigos…

2 horas atrás

A Alibaba Cloud precisará de 10 vezes mais poder computacional do que em 2022, enquanto a Tencent aprendeu a se virar com menos.

Segundo Eddie Wu, CEO da Alibaba Cloud, a empresa planeja aumentar em dez vezes a…

8 horas atrás

Corrida, comércio e continuação da história: os desenvolvedores de Subnautica 2 revelam planos de melhoria para o jogo nos próximos meses.

Os desenvolvedores do estúdio americano Unknown Worlds Entertainment (de propriedade da Krafton) anunciaram planos para…

8 horas atrás