Os chineses criaram uma rede neural que supera o pensamento OpenAI o1 em testes importantes

O laboratório de inteligência artificial (IA) da China, DeepSeek, revelou uma versão de código aberto de seu modelo de inteligência artificial R1 com capacidades de raciocínio que afirma superar o modelo de IA o1 da OpenAI em alguns benchmarks em uma série de métricas importantes.

Fonte da imagem: Alexander Sinn/Unsplash

Conforme relatado pelo TechCrunch, o modelo R1 supera o OpenAI o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. Esses testes cobrem uma variedade de áreas, incluindo problemas matemáticos, programação e desempenho geral do modelo. AIME avalia o desempenho do modelo em relação a outros modelos de IA, MATH-500 é um conjunto de problemas matemáticos e SWE-bench Verified concentra-se na programação.

Uma característica especial do R1 é a capacidade de autoteste, o que ajuda a eliminar erros típicos de outros modelos. No entanto, esta abordagem requer mais tempo para obter uma resposta – de alguns segundos a vários minutos. No entanto, tais modelos são considerados mais confiáveis ​​em campos complexos como matemática, física e diversas ciências.

DeepSeek disse que o R1 contém 671 bilhões de parâmetros, o que o torna um dos maiores modelos do mundo. Para comodidade dos usuários, a empresa também lançou versões simplificadas do R1 com volume de parâmetros de 1,5 a 70 bilhões. Ao mesmo tempo, a versão mais compacta pode funcionar até mesmo em um laptop normal, enquanto a versão completa requer hardware mais potente. No entanto, o R1 está disponível por meio da API da empresa a um preço 90-95% inferior ao do OpenAI o1.

Nota-se que o R1 também apresenta algumas desvantagens. Uma vez que o modelo foi desenvolvido na China, está sujeito a verificação obrigatória pelos reguladores quanto à conformidade com os “valores socialistas fundamentais”. Por exemplo, R1 recusa-se a responder a perguntas sobre os acontecimentos na Praça Tiananmen ou sobre a independência de Taiwan, o que é típico de muitos modelos chineses de IA que evitam discutir temas políticos sensíveis no Reino Médio.

Vale dizer que o DeepSeek se tornou o primeiro laboratório chinês a entrar em competição real com o OpenAI o1, apresentando uma versão preliminar do R1 em novembro. No entanto, outros jogadores seguiram o exemplo, incluindo Alibaba e Kimi, de propriedade da Moonshot AI. De acordo com Dean Ball, pesquisador de inteligência artificial da Universidade George Mason, tudo isso sugere que as empresas chinesas de IA continuam a ser “seguidoras rápidas” na corrida tecnológica. “O sucesso das versões leves do DeepSeek […] mostra que modelos de raciocínio poderosos se tornarão cada vez mais acessíveis e poderão até ser executados em hardware local”, disse Ball em seu post no X.

avalanche

Postagens recentes

A estratégia europeia para o setor de semicondutores fracassou: os investimentos estagnaram e a dependência aumentou.

A União Europeia esperava reduzir sua dependência dos EUA e da China em relação aos…

1 hora atrás

O novo chefe da NASA promete levar americanos de volta à Lua antes do fim do mandato de Trump.

Em 2019, o programa lunar da NASA foi renomeado para "Artemis" e o objetivo era…

1 hora atrás

Cientistas reduziram o menor robô com cérebro em 10.000 vezes — agora ele tem o tamanho de um grão de sal.

Cientistas da Universidade da Pensilvânia (Penn) e da Universidade de Michigan (UMich) criaram o menor…

1 hora atrás

Elon Musk finalmente desistiu da missão ambiental da Tesla.

Como a Tesla é uma empresa de capital aberto e o preço de suas ações…

6 horas atrás

O presidente da Wingtech, empresa chinesa, manifestou o desejo de retomar o controle da Nexperia, empresa que foi apreendida pelos Países Baixos.

Os problemas da indústria automotiva neste ano foram agravados pela situação em torno da empresa…

6 horas atrás

A Huawei pretende fornecer seus aceleradores de IA para a Coreia do Sul.

A prioridade atual da Huawei é a substituição de importações na indústria chinesa de IA,…

7 horas atrás