Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Meta treinou a rede neural data2vec para trabalhar com fala, imagens e texto para que pudesse “entender o mundo”

Os meta pesquisadores treinaram um modelo de inteligência artificial (IA) para processar fala, imagens e texto no que eles esperam que seja a base para futuros desenvolvimentos em realidade aumentada e metaverso.

Fonte da imagem: Gerd Altmann / pixabay.com

O modelo, chamado data2vec, realiza tarefas de vários tipos: reconhece a fala quando você digita a voz; ao inserir dados no formato de uma imagem, identifica objetos nela; e tendo recebido o texto na entrada, verifica se há erros gramaticais e analisa entonações com fundo emocional. Tradicionalmente, os algoritmos de IA são treinados em um tipo de dado, mas no caso do data2vec, optou-se por trabalhar com três formatos. Mas com cada um deles, a rede neural funciona independentemente das outras.

A empresa espera que, no futuro, esses modelos multimodais tornem os computadores mais adaptáveis - capazes de combinar ambientes físicos e digitais em uma única dimensão conceitual. “As pessoas percebem o mundo através de uma combinação de visão, audição e palavras – sistemas como esse um dia entenderão o mundo da mesma maneira que nós. Algum dia ele será incorporado a óculos de realidade aumentada ou a um assistente de IA para, por exemplo, ajudar uma pessoa a preparar o jantar, anotando ingredientes ausentes, recomendando diminuir o fogo ou [realizando] tarefas mais complexas ”, Mark Zuckerberg, chefe da Meta , comentou o projeto ao The Register.(Mark Zuckerberg).

A plataforma de hardware do sistema data2vec foi construída utilizando 16 aceleradores NVIDIA V100 e A100. 960 horas de gravações de áudio de voz, vários milhões de palavras de livros e páginas da Wikipedia, bem como imagens do banco de dados ImageNet-1K foram usados como dados iniciais para o treinamento de IA. Quando testado em tarefas específicas, o data2vec provou ser mais eficiente do que alguns dos principais modelos de IA treinados em apenas um tipo de dados. No futuro, disse um dos desenvolvedores do projeto, está previsto expandir a percepção da rede neural com outros tipos de dados, como cheiros, objetos 3D e vídeos.

avalanche

Próximo O chip Pluton da Microsoft não forçará todos a atualizar para o Windows 11 - ele pode ser desativado »

Anterior « Novo prefeito de Nova York recebe seu primeiro salário em criptomoeda

Deixar comentário

Publicado por

avalanche

4 anos atrás

Postagens recentes

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

Os bots de IA se tornaram um novo tipo de usuário da internet e geradores de tráfego — bloqueá-los não os impede.

Bots com inteligência artificial já representam uma parcela significativa do tráfego da web, segundo reportagem…

1 hora atrás

Notícias da rede

A Anthropic fez com que as ações de empresas de software e serviços financeiros caíssem US$ 285 bilhões com uma nova ferramenta de IA para negócios.

O lançamento da nova ferramenta da Anthropic, baseada em inteligência artificial, para automatizar tarefas empresariais…

2 horas atrás

Aplicativos Android

O Google Gemini aprenderá a controlar um smartphone – um novo recurso já foi revelado no código.

As capacidades dos modelos modernos de inteligência artificial estão se expandindo constantemente e, num futuro…

2 horas atrás

Sistemas operacionais

O Windows 11 está apresentando falhas novamente, e alguns usuários estão enfrentando o desaparecimento da área de trabalho.

Foi descoberto um bug no Windows 11 que está causando mau funcionamento de elementos importantes…

3 horas atrás

Servidores, clusters, supercomputadores, computadores industriais e multiprocessadores

A Nvidia investirá apenas US$ 20 bilhões na OpenAI, em vez dos US$ 100 bilhões prometidos.

A cifra de US$ 100 bilhões discutida no contexto do acordo de investimento entre a…

3 horas atrás

Notícias da rede

A Europa acelerou sua rejeição aos serviços digitais e softwares americanos.

Em toda a Europa, governos e instituições estão buscando reduzir o uso de serviços digitais…

3 horas atrás

Meta treinou a rede neural data2vec para trabalhar com fala, imagens e texto para que pudesse “entender o mundo”

Conteúdo relacionado

Postagens recentes

Os bots de IA se tornaram um novo tipo de usuário da internet e geradores de tráfego — bloqueá-los não os impede.

A Anthropic fez com que as ações de empresas de software e serviços financeiros caíssem US$ 285 bilhões com uma nova ferramenta de IA para negócios.

O Google Gemini aprenderá a controlar um smartphone – um novo recurso já foi revelado no código.

O Windows 11 está apresentando falhas novamente, e alguns usuários estão enfrentando o desaparecimento da área de trabalho.

A Nvidia investirá apenas US$ 20 bilhões na OpenAI, em vez dos US$ 100 bilhões prometidos.

A Europa acelerou sua rejeição aos serviços digitais e softwares americanos.