O pequeno modelo de IA recursiva da Samsung supera os pesos pesados ​​do Google e da OpenAI em raciocínio.

A Samsung desafiou a filosofia predominante da IA ​​de “quanto maior, melhor” e demonstrou que um modelo pequeno pode produzir respostas melhores do que os modelos de linguagem grandes líderes de mercado em tarefas de raciocínio complexas.

Fonte da imagem: Steve Johnson / unsplash.com

A pesquisadora Alexia Jolicoeur-Martineau, da Samsung SAIL Montréal, propôs uma mudança de paradigma em direção a abordagens algorítmicas mais eficientes para a IA, visto que a necessidade de modelos cada vez maiores é questionável. A arquitetura e os métodos de raciocínio do Modelo Recursivo Minúsculo (TRM) podem se mostrar mais importantes do que a escala, abrindo novas possibilidades para a criação de IA poderosa, mais acessível e mais ecologicamente correta.

A principal inovação é a abordagem única do TRM para a resolução de problemas. Em vez de gerar uma resposta final em uma única etapa, como fazem os modelos de linguagem maiores, ele refina suas soluções por meio de um processo recursivo em várias etapas. Primeiro, um primeiro rascunho da resposta é gerado e, em seguida, o modelo entra em um loop, criticando e aprimorando repetidamente sua lógica, realizando até 16 etapas para chegar a uma solução final mais precisa. Isso permite a correção de erros nas cadeias de raciocínio, que frequentemente causam falhas em modelos grandes, onde um único erro pode invalidar toda a resposta. O conceito de TRM simplifica e expande o conceito anteriormente conhecido de modelos de raciocínio hierárquico (HRM), que utilizam duas pequenas redes neurais trabalhando juntas. O TRM requer apenas uma pequena rede neural, demonstrando que uma abordagem recursiva pode fornecer resultados de maior qualidade.

Fonte da imagem: BoliviaInteligente / unsplash.com

Em uma série de testes desafiadores de ARC-AGI, o TRM de 7 milhões de parâmetros da Samsung obteve resultados respeitáveis: 45% no ARC-AGI-1 e 8% no ARC-AGI-2. Ele superou líderes de mercado como DeepSeek-R1, Google Gemini 2.5 Pro e OpenAI o3-mini, que possuem milhares de vezes mais parâmetros. O TRM demonstrou notável capacidade de inferência com base em pequenos conjuntos de dados de treinamento. Treinado em 1.000 exemplos de Sudoku, ele resolveu 87,4% de 423.000 quebra-cabeças. Esses resultados, para um modelo com apenas 0,01% do tamanho de seus concorrentes gigantes, confirmam a eficácia do raciocínio recursivo.

O estudo pode impactar o desenvolvimento futuro da área de IA: grandes players continuam investindo bilhões de dólares no desenvolvimento de modelos com centenas de bilhões e trilhões de parâmetros, assumindo que a escala determina os resultados. Pesquisadores da Samsung questionam essa suposição, argumentando que algoritmos inteligentes podem ser mais eficazes do que o poder computacional de força bruta. Modelos capazes de produzir respostas de alta qualidade poderiam ser desenvolvidos por organizações menores com recursos computacionais limitados. A IA poderia ser executada com mais eficiência localmente em dispositivos móveis, sem a necessidade de computação em nuvem. O método TRM iterativo significa que o processamento de uma única tarefa leva mais tempo, mas, em alguns casos, a resposta correta é mais importante do que a velocidade.

A autora tornou o modelo de código aberto, convidando a comunidade a validar suas descobertas e participar do desenvolvimento do projeto. A IA agora tem o potencial de se tornar mais poderosa.mais eficiente e acessível.

admin

Postagens recentes

A ZA/UM revelou 12 minutos de gameplay de Zero Parades: For Dead Spies, um RPG de espionagem psicodélico no estilo de Disco Elysium.

O estúdio londrino ZA/UM, responsável pelo lançamento do cultuado jogo de detetive Disco Elysium em…

2 horas atrás

A Apple está testando a produção de chips para iPhone em instalações da Intel.

No início deste mês, veículos de comunicação noticiaram o desejo da Apple de diversificar sua…

3 horas atrás

A China e os EUA não conseguiram fechar grandes acordos no setor de tecnologia, o que provocou uma onda de vendas de ações de fabricantes de chips.

As ações de fabricantes globais de semicondutores caíram acentuadamente após o encontro entre o presidente…

3 horas atrás

Jensen Huang tornou-se um herói das redes sociais chinesas depois de comer macarrão e sorvete em uma rua de Pequim.

Jensen Huang é conhecido por muitas coisas: ele dirige a empresa mais valiosa do mundo,…

4 horas atrás

A Tesla desclassificou relatórios de acidentes envolvendo seus robôs-táxi.

A Tesla divulgou informações sobre pelo menos dois acidentes envolvendo seus robotáxis. Os acidentes ocorreram…

6 horas atrás