A Samsung desafiou a filosofia predominante da IA de “quanto maior, melhor” e demonstrou que um modelo pequeno pode produzir respostas melhores do que os modelos de linguagem grandes líderes de mercado em tarefas de raciocínio complexas.

Fonte da imagem: Steve Johnson / unsplash.com
A pesquisadora Alexia Jolicoeur-Martineau, da Samsung SAIL Montréal, propôs uma mudança de paradigma em direção a abordagens algorítmicas mais eficientes para a IA, visto que a necessidade de modelos cada vez maiores é questionável. A arquitetura e os métodos de raciocínio do Modelo Recursivo Minúsculo (TRM) podem se mostrar mais importantes do que a escala, abrindo novas possibilidades para a criação de IA poderosa, mais acessível e mais ecologicamente correta.
A principal inovação é a abordagem única do TRM para a resolução de problemas. Em vez de gerar uma resposta final em uma única etapa, como fazem os modelos de linguagem maiores, ele refina suas soluções por meio de um processo recursivo em várias etapas. Primeiro, um primeiro rascunho da resposta é gerado e, em seguida, o modelo entra em um loop, criticando e aprimorando repetidamente sua lógica, realizando até 16 etapas para chegar a uma solução final mais precisa. Isso permite a correção de erros nas cadeias de raciocínio, que frequentemente causam falhas em modelos grandes, onde um único erro pode invalidar toda a resposta. O conceito de TRM simplifica e expande o conceito anteriormente conhecido de modelos de raciocínio hierárquico (HRM), que utilizam duas pequenas redes neurais trabalhando juntas. O TRM requer apenas uma pequena rede neural, demonstrando que uma abordagem recursiva pode fornecer resultados de maior qualidade.

Fonte da imagem: BoliviaInteligente / unsplash.com
Em uma série de testes desafiadores de ARC-AGI, o TRM de 7 milhões de parâmetros da Samsung obteve resultados respeitáveis: 45% no ARC-AGI-1 e 8% no ARC-AGI-2. Ele superou líderes de mercado como DeepSeek-R1, Google Gemini 2.5 Pro e OpenAI o3-mini, que possuem milhares de vezes mais parâmetros. O TRM demonstrou notável capacidade de inferência com base em pequenos conjuntos de dados de treinamento. Treinado em 1.000 exemplos de Sudoku, ele resolveu 87,4% de 423.000 quebra-cabeças. Esses resultados, para um modelo com apenas 0,01% do tamanho de seus concorrentes gigantes, confirmam a eficácia do raciocínio recursivo.
O estudo pode impactar o desenvolvimento futuro da área de IA: grandes players continuam investindo bilhões de dólares no desenvolvimento de modelos com centenas de bilhões e trilhões de parâmetros, assumindo que a escala determina os resultados. Pesquisadores da Samsung questionam essa suposição, argumentando que algoritmos inteligentes podem ser mais eficazes do que o poder computacional de força bruta. Modelos capazes de produzir respostas de alta qualidade poderiam ser desenvolvidos por organizações menores com recursos computacionais limitados. A IA poderia ser executada com mais eficiência localmente em dispositivos móveis, sem a necessidade de computação em nuvem. O método TRM iterativo significa que o processamento de uma única tarefa leva mais tempo, mas, em alguns casos, a resposta correta é mais importante do que a velocidade.
A autora tornou o modelo de código aberto, convidando a comunidade a validar suas descobertas e participar do desenvolvimento do projeto. A IA agora tem o potencial de se tornar mais poderosa.mais eficiente e acessível.
