Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Apple desenvolveu uma IA que considera várias opções de resposta em paralelo e produz a melhor delas.

Pesquisadores da Apple, em conjunto com cientistas da Universidade da Califórnia, em San Diego, desenvolveram uma nova estrutura, LaDiR, que aprimora a qualidade da resposta de modelos de linguagem em larga escala (LLMs). A ideia central do sistema é permitir que redes neurais testem múltiplas opções de raciocínio em paralelo antes de produzir um resultado final.

A estrutura, chamada LaDiR (Latent Diffusion Enhances LLMs for Text Reasoning), combina abordagens de difusão e autorregressivas para a geração de texto. Durante a fase de raciocínio, o modelo usa difusão para processar simultaneamente múltiplos tokens e gera a resposta final usando um método autorregressivo, um token por vez. No entanto, como observa o 9to5Mac, o LaDiR não é uma rede neural independente, mas sim atua como uma superestrutura para modelos de linguagem existentes, modificando seus algoritmos de raciocínio.

Fonte da imagem: 9to5mac.com

O mecanismo da estrutura baseia-se na geração de unidades de raciocínio ocultas, que inicialmente representam ruído aleatório e são gradualmente refinadas em etapas logicamente coerentes. O LaDiR inicia vários desses caminhos paralelos simultaneamente, cada um desenvolvendo seu próprio processo de difusão, enquanto um mecanismo especial estimula os ramos a explorar diferentes possibilidades para que não convirjam para a mesma solução prematuramente. Quando o modelo determina que o processo de raciocínio está completo, ele passa para a geração sequencial da resposta final.

Para testar sua eficácia, os pesquisadores aplicaram o LaDiR ao modelo Meta✴LLaMA 3.1 8B para problemas matemáticos e resolução de quebra-cabeças, bem como ao Qwen3-8B-Base para geração de código. No teste matemático, a estrutura demonstrou maior precisão em comparação com as abordagens existentes, fornecendo resultados confiáveis mesmo em problemas complexos e não padronizados. Ao mesmo tempo, no benchmark HumanEval, o sistema produziu um código mais robusto, superando significativamente o ajuste fino padrão, especialmente na resolução de problemas difíceis.

Fonte da imagem: 9to5mac.com

Em tarefas de planejamento, como o jogo Contagem Regressiva, o LaDiR explorou uma gama mais ampla de respostas corretas do que qualquer modelo de referência e encontrou soluções corretas com mais confiabilidade do que qualquer sistema de IA de propósito geral. No entanto, em tarefas que exigem alta precisão na primeira tentativa, a estrutura ainda superou modelos especializados, adaptados a tarefas específicas e restritas. Apesar da complexidade técnica de alguns aspectos do estudo, os autores observam que a abordagem proposta abre novas perspectivas para aprimorar a qualidade da geração de texto e a lógica dos modelos de linguagem.

admin

Próximo À medida que a tecnologia de processo amadurece, a Samsung aumentou seu rendimento de chips de 4nm para mais de 80%. »

Anterior « A Microsoft aumentou sua receita e lucro, mas as despesas também aumentaram – a IA "devorará" US$ 190 bilhões em um ano.

Deixar comentário

Publicado por

admin

2 meses atrás

Postagens recentes

Jogos

Calendário de lançamentos: 29 de junho a 5 de julho: Undergrounded, Monopoly: Star Wars Heróis vs. Vilões

A virada de junho para julho trouxe poucos lançamentos importantes, mas muitas atualizações e relançamentos…

1 hora atrás

Placas de vídeo

A GeForce RTX 3060 começou a retornar às lojas na Europa e nos EUA.

As placas de vídeo GeForce RTX 3060 começaram a retornar aos mercados ocidentais. Os modelos…

2 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

As autoridades americanas ofereceram uma recompensa de 10 milhões de dólares por informações sobre hackers que têm como alvo usuários do WhatsApp e do Signal.

O Departamento de Estado dos EUA ofereceu uma recompensa de até US$ 10 milhões por…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

O Nothing Phone (4b) foi apresentado em fotos reais e suas principais especificações foram reveladas.

A Nothing apresentará seu novo smartphone Nothing Phone (4b) em 7 de julho. Embora a…

2 horas atrás

Jogos

A Activision foi obrigada a anunciar que Call of Duty: Modern Warfare 4 não será lançado no Game Pass.

O aguardado Call of Duty: Modern Warfare 4, da Activision, será o primeiro jogo principal…

4 horas atrás

Casos, computadores desktop

A Valve proibiu a Dbrand de lançar um kit para transformar uma Steam Machine no Cubo de Companhia de Portal.

Na semana passada, a Valve começou a aceitar pré-encomendas para seu PC gamer compacto, o…

4 horas atrás