Os chineses criaram uma rede neural que supera o pensamento OpenAI o1 em testes importantes

O laboratório de inteligência artificial (IA) da China, DeepSeek, revelou uma versão de código aberto de seu modelo de inteligência artificial R1 com capacidades de raciocínio que afirma superar o modelo de IA o1 da OpenAI em alguns benchmarks em uma série de métricas importantes.

Fonte da imagem: Alexander Sinn/Unsplash

Conforme relatado pelo TechCrunch, o modelo R1 supera o OpenAI o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. Esses testes cobrem uma variedade de áreas, incluindo problemas matemáticos, programação e desempenho geral do modelo. AIME avalia o desempenho do modelo em relação a outros modelos de IA, MATH-500 é um conjunto de problemas matemáticos e SWE-bench Verified concentra-se na programação.

Uma característica especial do R1 é a capacidade de autoteste, o que ajuda a eliminar erros típicos de outros modelos. No entanto, esta abordagem requer mais tempo para obter uma resposta – de alguns segundos a vários minutos. No entanto, tais modelos são considerados mais confiáveis ​​em campos complexos como matemática, física e diversas ciências.

DeepSeek disse que o R1 contém 671 bilhões de parâmetros, o que o torna um dos maiores modelos do mundo. Para comodidade dos usuários, a empresa também lançou versões simplificadas do R1 com volume de parâmetros de 1,5 a 70 bilhões. Ao mesmo tempo, a versão mais compacta pode funcionar até mesmo em um laptop normal, enquanto a versão completa requer hardware mais potente. No entanto, o R1 está disponível por meio da API da empresa a um preço 90-95% inferior ao do OpenAI o1.

Nota-se que o R1 também apresenta algumas desvantagens. Uma vez que o modelo foi desenvolvido na China, está sujeito a verificação obrigatória pelos reguladores quanto à conformidade com os “valores socialistas fundamentais”. Por exemplo, R1 recusa-se a responder a perguntas sobre os acontecimentos na Praça Tiananmen ou sobre a independência de Taiwan, o que é típico de muitos modelos chineses de IA que evitam discutir temas políticos sensíveis no Reino Médio.

Vale dizer que o DeepSeek se tornou o primeiro laboratório chinês a entrar em competição real com o OpenAI o1, apresentando uma versão preliminar do R1 em novembro. No entanto, outros jogadores seguiram o exemplo, incluindo Alibaba e Kimi, de propriedade da Moonshot AI. De acordo com Dean Ball, pesquisador de inteligência artificial da Universidade George Mason, tudo isso sugere que as empresas chinesas de IA continuam a ser “seguidoras rápidas” na corrida tecnológica. “O sucesso das versões leves do DeepSeek […] mostra que modelos de raciocínio poderosos se tornarão cada vez mais acessíveis e poderão até ser executados em hardware local”, disse Ball em seu post no X.

avalanche

Postagens recentes

Elon Musk prometeu iniciar a construção de uma base em Marte dentro de cinco a sete anos.

Na semana passada, o The Wall Street Journal noticiou que a SpaceX estava mudando suas…

3 horas atrás

A Samsung começará a comercializar a memória HBM4 em fevereiro, antes da concorrência.

A Samsung Electronics será a primeira fabricante de memórias a iniciar os envios comerciais de…

4 horas atrás

A ascensão da programação baseada em vibrações prejudicou o ecossistema de código aberto e pode levar ao desastre.

Pesquisadores da Universidade da Europa Central, em Viena, concluíram que a prática de programação usando…

7 horas atrás

A data de lançamento do iOS 26.4, que inclui a Siri inteligente e um baú do tesouro, foi anunciada.

A Apple está se preparando para lançar a primeira versão beta do iOS 26.4 para…

8 horas atrás

A Team Vitality sagrou-se campeã do IEM Krakow 2026 na categoria CS2 e faturou mais de US$ 400.000 pelo segundo ano consecutivo.

Hoje, um dos torneios de Counter-Strike mais prestigiados, o IEM Krakow 2026, sucessor do lendário…

8 horas atrás

A Apple apresentará os MacBook Pros com os chips M5 Pro e M5 Max no início de março.

Houve inúmeros rumores em torno da data de lançamento da próxima geração de laptops MacBook…

12 horas atrás