Categorias: Sem categoria

Meta falou sobre o Projeto CAIRaoke, um projeto para melhorar os assistentes de voz baseados em tecnologias de IA

Desenvolvedores do Meta (antigo Facebook) falaram sobre o projeto Project CAIRaoke, que criou um “modelo neural de ponta a ponta” que fornece um processo muito mais natural de interação humana com um assistente de voz. O novo modelo já está sendo usado em telas inteligentes do Portal e fará parte de dispositivos VR e AR no futuro para oferecer a melhor experiência de assistente virtual.

Fonte da imagem: Meta

O relatório diz que um dos principais obstáculos para melhorar os assistentes de voz é a arquitetura na qual eles são construídos. Apesar do fato de que esses sistemas parecem um todo único, eles são baseados em quatro componentes separados: compreensão de linguagem natural (NLU), rastreamento de estado de diálogo (DST), gerenciamento de política de diálogo (DP) e geração de linguagem natural (NLG). Esses componentes estão interconectados, o que dificulta sua otimização e adaptação a novas tarefas e depende em grande parte de conjuntos de dados anotados. Essa é uma das razões pelas quais os assistentes de voz de hoje mantêm os usuários dentro de limites rígidos ao interagir.

O Projeto CAIRaoke já criou modelos neurais que permitirão que as pessoas se comuniquem de forma mais natural e livre com assistentes de voz, por exemplo, retornando ao tópico anterior da conversa ou alterando-o completamente, mencionando coisas que dependem da compreensão das nuances do contexto, etc. Os usuários também poderão interagir com assistentes de voz de novas maneiras, como gestos. O novo modelo está sendo usado atualmente em monitores inteligentes do Portal e está em testes iniciais. No entanto, os desenvolvedores já estão confiantes de que é superior às abordagens existentes usadas para criar assistentes de voz.

Os desenvolvedores expressaram sua confiança de que o progresso feito no âmbito do Projeto CAIRaoke tornará a comunicação entre algoritmos de IA e humanos mais natural e também se tornará uma ferramenta importante na criação do metaverso. O assistente de voz embutido em um fone de ouvido AR se tornará mais útil no futuro e poderá entender o significado do que o usuário diz em linguagem natural. No futuro, esses assistentes de voz poderão aparecer em diferentes aplicativos, para que pessoas de todo o mundo possam interagir com eles.

avalanche

Postagens recentes

Intel lança processadores de servidor Xeon Sapphire Rapids e aceleradores de data center GPU Max

A Intel anunciou o lançamento da quarta geração de processadores de servidor Xeon Scalable, codinome…

54 minutos atrás

NASA captura 133 dias da vida do Sol em vídeo de 1 hora

O Goddard Space Flight Center da National Aeronautics and Space Administration (NASA) divulgou um vídeo…

3 horas atrás

Colorful lança placas gráficas da série GeForce RTX 40 em pacotes de férias do Ano Novo Chinês

A Colorful lançou placas gráficas GeForce RTX série 40 nas versões Advanced, Ultra e Vulcan…

5 horas atrás

Viagem do futuro: o conceito de transportar pessoas por terra e ar sem nenhuma transferência

Duas start-ups americanas, Node Air e JetX, começaram a desenvolver em conjunto o conceito de…

5 horas atrás