Categorias: Sem categoria

Meta falou sobre o Projeto CAIRaoke, um projeto para melhorar os assistentes de voz baseados em tecnologias de IA

Desenvolvedores do Meta (antigo Facebook) falaram sobre o projeto Project CAIRaoke, que criou um “modelo neural de ponta a ponta” que fornece um processo muito mais natural de interação humana com um assistente de voz. O novo modelo já está sendo usado em telas inteligentes do Portal e fará parte de dispositivos VR e AR no futuro para oferecer a melhor experiência de assistente virtual.

Fonte da imagem: Meta

O relatório diz que um dos principais obstáculos para melhorar os assistentes de voz é a arquitetura na qual eles são construídos. Apesar do fato de que esses sistemas parecem um todo único, eles são baseados em quatro componentes separados: compreensão de linguagem natural (NLU), rastreamento de estado de diálogo (DST), gerenciamento de política de diálogo (DP) e geração de linguagem natural (NLG). Esses componentes estão interconectados, o que dificulta sua otimização e adaptação a novas tarefas e depende em grande parte de conjuntos de dados anotados. Essa é uma das razões pelas quais os assistentes de voz de hoje mantêm os usuários dentro de limites rígidos ao interagir.

O Projeto CAIRaoke já criou modelos neurais que permitirão que as pessoas se comuniquem de forma mais natural e livre com assistentes de voz, por exemplo, retornando ao tópico anterior da conversa ou alterando-o completamente, mencionando coisas que dependem da compreensão das nuances do contexto, etc. Os usuários também poderão interagir com assistentes de voz de novas maneiras, como gestos. O novo modelo está sendo usado atualmente em monitores inteligentes do Portal e está em testes iniciais. No entanto, os desenvolvedores já estão confiantes de que é superior às abordagens existentes usadas para criar assistentes de voz.

Os desenvolvedores expressaram sua confiança de que o progresso feito no âmbito do Projeto CAIRaoke tornará a comunicação entre algoritmos de IA e humanos mais natural e também se tornará uma ferramenta importante na criação do metaverso. O assistente de voz embutido em um fone de ouvido AR se tornará mais útil no futuro e poderá entender o significado do que o usuário diz em linguagem natural. No futuro, esses assistentes de voz poderão aparecer em diferentes aplicativos, para que pessoas de todo o mundo possam interagir com eles.

avalanche

Postagens recentes

A SpaceX pretende transformar a Starlink em uma operadora de telefonia móvel e desafiar as três maiores empresas dos EUA.

Tecnicamente, os clientes da T-Mobile nos EUA já podem se conectar diretamente aos satélites Starlink…

37 minutos atrás

A Swatch exigiu da Samsung uma indenização de 170 milhões de dólares por copiar o design dos mostradores de seus relógios inteligentes.

Como a prática demonstra, até mesmo o formato de um retângulo com cantos arredondados pode…

1 hora atrás

Cientistas criaram um pixel que ensinará as telas a enxergar.

Para diversas aplicações, seria tentador combinar as funções de tela e câmera em uma única…

1 hora atrás

Kingdom Come: Deliverance 2 atinge novo pico de vendas e recebe uma missão com o “bobo da corte excêntrico” de Balatro.

A editora Deep Silver e os desenvolvedores da Warhorse Studios, da República Tcheca, comemoraram as…

1 hora atrás

A Microsoft corrigiu diversos problemas de Bluetooth no Windows 11 e melhorou a experiência com os AirPods da Apple.

A Microsoft lançou a maior atualização de recursos Bluetooth até o momento para o Windows…

1 hora atrás

A Chuwi começou a aceitar pré-encomendas para o laptop UniBook com processador Intel Wildcat Lake e preço inicial de US$ 449.

A Chuwi anunciou a pré-venda do notebook UniBook, equipado com o novo processador Intel Core…

1 hora atrás