Categorias: Sem categoria

Meta falou sobre o Projeto CAIRaoke, um projeto para melhorar os assistentes de voz baseados em tecnologias de IA

Desenvolvedores do Meta (antigo Facebook) falaram sobre o projeto Project CAIRaoke, que criou um “modelo neural de ponta a ponta” que fornece um processo muito mais natural de interação humana com um assistente de voz. O novo modelo já está sendo usado em telas inteligentes do Portal e fará parte de dispositivos VR e AR no futuro para oferecer a melhor experiência de assistente virtual.

Fonte da imagem: Meta

O relatório diz que um dos principais obstáculos para melhorar os assistentes de voz é a arquitetura na qual eles são construídos. Apesar do fato de que esses sistemas parecem um todo único, eles são baseados em quatro componentes separados: compreensão de linguagem natural (NLU), rastreamento de estado de diálogo (DST), gerenciamento de política de diálogo (DP) e geração de linguagem natural (NLG). Esses componentes estão interconectados, o que dificulta sua otimização e adaptação a novas tarefas e depende em grande parte de conjuntos de dados anotados. Essa é uma das razões pelas quais os assistentes de voz de hoje mantêm os usuários dentro de limites rígidos ao interagir.

O Projeto CAIRaoke já criou modelos neurais que permitirão que as pessoas se comuniquem de forma mais natural e livre com assistentes de voz, por exemplo, retornando ao tópico anterior da conversa ou alterando-o completamente, mencionando coisas que dependem da compreensão das nuances do contexto, etc. Os usuários também poderão interagir com assistentes de voz de novas maneiras, como gestos. O novo modelo está sendo usado atualmente em monitores inteligentes do Portal e está em testes iniciais. No entanto, os desenvolvedores já estão confiantes de que é superior às abordagens existentes usadas para criar assistentes de voz.

Os desenvolvedores expressaram sua confiança de que o progresso feito no âmbito do Projeto CAIRaoke tornará a comunicação entre algoritmos de IA e humanos mais natural e também se tornará uma ferramenta importante na criação do metaverso. O assistente de voz embutido em um fone de ouvido AR se tornará mais útil no futuro e poderá entender o significado do que o usuário diz em linguagem natural. No futuro, esses assistentes de voz poderão aparecer em diferentes aplicativos, para que pessoas de todo o mundo possam interagir com eles.

avalanche

Postagens recentes

A Tesla propôs alimentar centros de dados com baterias domésticas e veículos elétricos — os EUA têm 16 GW dessa capacidade.

A Sunrun, a Renew Home e a Tesla firmaram uma parceria. Este acordo liberará mais…

27 minutos atrás

Os chips de IA chineses devem conquistar 79% do mercado interno este ano, com a Huawei na liderança.

O CEO e fundador da Nvidia, Jensen Huang, embora lamente que as sanções americanas tenham…

27 minutos atrás

As ações de tecnologia continuam caindo globalmente devido a preocupações com inteligência artificial.

As ações de tecnologia em todo o mundo apresentaram um desempenho negativo. Um dos fatores…

27 minutos atrás

Um hotel administrado inteiramente por robôs e inteligência artificial será inaugurado na China.

Um hotel será operado inteiramente por robôs, sem intervenção humana, na Ilha Artificial Ocidental da…

44 minutos atrás

O Windows 11 finalmente aprendeu a reverter atualizações com falha.

Usuários do Windows 11 cujos PCs se tornam parcialmente inutilizáveis ​​devido a falhas nas atualizações…

44 minutos atrás

O Gemini 3.5 Flash do Google aprendeu a controlar completamente os computadores.

O Google está expandindo ativamente os recursos de seus modelos de IA Gemini, integrando-os aos…

44 minutos atrás