Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

Meta mostrou IA para o metaverso e criou uma alternativa aos modelos tradicionais de grandes linguagens

Meta✴ relatou os resultados das pesquisas mais recentes no campo da inteligência artificial no âmbito dos projetos FAIR (Fundamental AI Research). Os especialistas da empresa desenvolveram um modelo de IA responsável pelos movimentos verossímeis de personagens virtuais; um modelo que opera não com tokens – unidades de linguagem – mas com conceitos; e muito mais.

Fonte da imagem: Google DeepMind/unsplash.com

O modelo Meta✴ Motivo controla os movimentos de personagens humanóides virtuais ao realizar tarefas complexas. Foi treinado com reforço em uma matriz não rotulada com dados sobre os movimentos do corpo humano – este sistema pode ser utilizado como sistema auxiliar na concepção dos movimentos e posições corporais dos personagens. “O Meta Motivo é capaz de realizar uma ampla gama de tarefas de controle de corpo inteiro, incluindo rastreamento de movimento e postura do alvo, sem qualquer treinamento ou planejamento adicional”, afirmou a empresa.

Uma conquista importante foi a criação de um grande modelo conceitual (Large Concept Model ou LCM) – uma alternativa aos grandes modelos tradicionais de linguagem. Os pesquisadores da Meta✴ notaram que os sistemas avançados de IA atuais operam no nível de tokens – unidades de linguagem que normalmente representam um fragmento de uma palavra – mas não demonstram raciocínio hierárquico explícito. No LCM, o mecanismo de raciocínio é separado da representação linguística – de forma semelhante, uma pessoa primeiro forma uma sequência de conceitos e depois a coloca em forma verbal. Assim, ao realizar uma série de apresentações sobre um tema, o palestrante já possui uma série de conceitos formada, mas a redação do discurso pode mudar de um evento para outro.

Ao gerar uma resposta a uma consulta, o LCM prevê uma sequência não de tokens, mas de conceitos representados em frases completas num espaço multimodal e multilingue. À medida que o contexto na entrada aumenta, a arquitetura LCM, segundo os desenvolvedores, parece ser mais eficiente no nível computacional. Na prática, este trabalho ajudará a melhorar o desempenho de modelos de linguagem com qualquer modalidade, ou seja, formato de dados, ou na saída de respostas em qualquer idioma.

Fonte da imagem: Meta✴

O mecanismo Meta✴ Dynamic Byte Latent Transformer também oferece uma alternativa aos tokens de linguagem, mas não expandindo-os em conceitos, mas, pelo contrário, formando um modelo hierárquico no nível do byte. Isso, segundo os desenvolvedores, aumenta a eficiência ao trabalhar com longas sequências no treinamento e execução de modelos. A ferramenta complementar Meta✴ Explore Theory-of-Mind foi projetada para incutir habilidades de inteligência social em modelos de IA à medida que são treinados, para avaliar o desempenho dos modelos nessas tarefas e para ajustar sistemas de IA já treinados. Meta✴ Explore a Teoria da Mente não se limita a uma determinada gama de interações, mas gera seus próprios cenários.

A tecnologia Meta✴ Memory Layers at Scale visa otimizar os mecanismos reais de memória de grandes modelos de linguagem. À medida que aumenta o número de parâmetros nos modelos, trabalhar com memória real requer cada vez mais recursos, e o novo mecanismo visa salvá-los. O projeto Meta✴ Image Diversity Modeling, que está sendo implementado com o envolvimento de especialistas terceirizados, visa aumentar a prioridade das imagens geradas por IA que correspondem com mais precisão aos objetos do mundo real; também ajuda a tornar os desenvolvedores mais seguros e responsáveis ao criar imagens usando IA.

O modelo Meta✴ CLIP 1.2 é uma nova versão do sistema projetado para estabelecer uma conexão entre texto e dados visuais. Também é usado para treinar outros modelos de IA. A ferramenta Meta✴ Video Seal foi projetada para criar marcas d’água em vídeos gerados por IA – essa marcação é invisível ao visualizar o vídeo a olho nu, mas pode ser detectada para determinar a origem do vídeo. A marca d’água é preservada por meio de edição, incluindo desfoque e codificação usando vários algoritmos de compactação. Por fim, Meta✴ lembrou o paradigma Flow Matching, que pode ser usado para gerar imagens, vídeo, som e até estruturas tridimensionais, incluindo moléculas de proteínas – esta solução ajuda a usar informações sobre o movimento entre diferentes partes da imagem e atua como uma alternativa ao mecanismo de difusão.

avalanche

Próximo Cooperativo, absorção de DNA e visão em terceira pessoa: Sabre Interactive anunciou o atirador Turok: Origins sobre atirar em dinossauros e alienígenas »

Anterior « A Xiaomi entrou no mercado de veículos elétricos com tanto sucesso quanto no mercado de smartphones há 13 anos

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google reduziu o consumo de memória de seus modelos de IA em seis vezes sem perder precisão – graças ao algoritmo TurboQuant.

O Google Research publicou um artigo sobre o TurboQuant, um algoritmo de quantização que reduz…

24 minutos atrás

Na vanguarda da ciência

A inteligência artificial ajudou a descobrir exoplanetas até então desconhecidos nos arquivos do telescópio TESS.

Uma equipe de cientistas da Universidade de Warwick desenvolveu e testou um modelo de IA,…

37 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O encerramento do Sora, gerador de vídeos com inteligência artificial da OpenAI, inviabilizou um acordo bilionário com a Walt Disney.

Após o encerramento do Sora, aplicativo de criação de vídeos com inteligência artificial da OpenAI,…

1 hora atrás

Desenvolvimento e fabricação de eletrônicos

Graças à inteligência artificial, a China poderá conquistar até 42% do mercado de semicondutores para o mercado de massa até 2028.

É geralmente aceito que a indústria chinesa de semicondutores, devido ao seu histórico de atraso…

1 hora atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

Imagens do Samsung Galaxy Z Fold8 Wide apareceram – ele será uma resposta ao primeiro iPhone dobrável.

A Samsung parece pronta para reservar a experiência adquirida no desenvolvimento e lançamento de smartphones…

1 hora atrás

Jogos

Os desenvolvedores de Lords of the Fallen 2 revelaram como aprimoraram o reino dos mortos após críticas dos jogadores – um novo teaser de jogabilidade.

A editora CI Games e o estúdio Hexworks lançaram um teaser de jogabilidade da versão…

3 horas atrás

Meta mostrou IA para o metaverso e criou uma alternativa aos modelos tradicionais de grandes linguagens

Conteúdo relacionado

Postagens recentes

O Google reduziu o consumo de memória de seus modelos de IA em seis vezes sem perder precisão – graças ao algoritmo TurboQuant.

A inteligência artificial ajudou a descobrir exoplanetas até então desconhecidos nos arquivos do telescópio TESS.

O encerramento do Sora, gerador de vídeos com inteligência artificial da OpenAI, inviabilizou um acordo bilionário com a Walt Disney.

Graças à inteligência artificial, a China poderá conquistar até 42% do mercado de semicondutores para o mercado de massa até 2028.

Imagens do Samsung Galaxy Z Fold8 Wide apareceram – ele será uma resposta ao primeiro iPhone dobrável.

Os desenvolvedores de Lords of the Fallen 2 revelaram como aprimoraram o reino dos mortos após críticas dos jogadores – um novo teaser de jogabilidade.