Categorias: Sem categoria

Meta falou sobre o Projeto CAIRaoke, um projeto para melhorar os assistentes de voz baseados em tecnologias de IA

Desenvolvedores do Meta (antigo Facebook) falaram sobre o projeto Project CAIRaoke, que criou um “modelo neural de ponta a ponta” que fornece um processo muito mais natural de interação humana com um assistente de voz. O novo modelo já está sendo usado em telas inteligentes do Portal e fará parte de dispositivos VR e AR no futuro para oferecer a melhor experiência de assistente virtual.

Fonte da imagem: Meta

O relatório diz que um dos principais obstáculos para melhorar os assistentes de voz é a arquitetura na qual eles são construídos. Apesar do fato de que esses sistemas parecem um todo único, eles são baseados em quatro componentes separados: compreensão de linguagem natural (NLU), rastreamento de estado de diálogo (DST), gerenciamento de política de diálogo (DP) e geração de linguagem natural (NLG). Esses componentes estão interconectados, o que dificulta sua otimização e adaptação a novas tarefas e depende em grande parte de conjuntos de dados anotados. Essa é uma das razões pelas quais os assistentes de voz de hoje mantêm os usuários dentro de limites rígidos ao interagir.

O Projeto CAIRaoke já criou modelos neurais que permitirão que as pessoas se comuniquem de forma mais natural e livre com assistentes de voz, por exemplo, retornando ao tópico anterior da conversa ou alterando-o completamente, mencionando coisas que dependem da compreensão das nuances do contexto, etc. Os usuários também poderão interagir com assistentes de voz de novas maneiras, como gestos. O novo modelo está sendo usado atualmente em monitores inteligentes do Portal e está em testes iniciais. No entanto, os desenvolvedores já estão confiantes de que é superior às abordagens existentes usadas para criar assistentes de voz.

Os desenvolvedores expressaram sua confiança de que o progresso feito no âmbito do Projeto CAIRaoke tornará a comunicação entre algoritmos de IA e humanos mais natural e também se tornará uma ferramenta importante na criação do metaverso. O assistente de voz embutido em um fone de ouvido AR se tornará mais útil no futuro e poderá entender o significado do que o usuário diz em linguagem natural. No futuro, esses assistentes de voz poderão aparecer em diferentes aplicativos, para que pessoas de todo o mundo possam interagir com eles.

avalanche

Postagens recentes

Os hackers usaram um código publicado por um pesquisador que estava insatisfeito com a Microsoft.

Hackers exploraram o código de uma vulnerabilidade do Windows não corrigida, vazada online, para atacar…

25 minutos atrás

A AMD alcançou uma capitalização de mercado recorde de US$ 454 bilhões, superando a Intel em quase um terço.

Durante muito tempo, a AMD se contentou com cerca de um décimo da receita da…

3 horas atrás

Darwin’s Paradox! — um jogo de plataforma com alma e tentáculos. Análise

Processador Intel ou AMD quad-core rodando a 2,5 GHz, 8 GB de RAM, placa de…

9 horas atrás

“Parece muito melhor do que antes”: Três minutos de “jogabilidade pura” de Heroes of Might & Magic: Olden Era deixam os fãs animados antes do Acesso Antecipado.

Antes do lançamento iminente do Acesso Antecipado, os desenvolvedores do estúdio cipriota com raízes russas,…

10 horas atrás

O teaser do novo companheiro na expansão Untold Museon decepcionou os fãs de Warhammer 40.000: Rogue Trader.

A Owlcat Games, um estúdio cipriota com raízes russas, lançou um novo teaser para The…

12 horas atrás