Os chineses criaram uma rede neural que supera o pensamento OpenAI o1 em testes importantes

O laboratório de inteligência artificial (IA) da China, DeepSeek, revelou uma versão de código aberto de seu modelo de inteligência artificial R1 com capacidades de raciocínio que afirma superar o modelo de IA o1 da OpenAI em alguns benchmarks em uma série de métricas importantes.

Fonte da imagem: Alexander Sinn/Unsplash

Conforme relatado pelo TechCrunch, o modelo R1 supera o OpenAI o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. Esses testes cobrem uma variedade de áreas, incluindo problemas matemáticos, programação e desempenho geral do modelo. AIME avalia o desempenho do modelo em relação a outros modelos de IA, MATH-500 é um conjunto de problemas matemáticos e SWE-bench Verified concentra-se na programação.

Uma característica especial do R1 é a capacidade de autoteste, o que ajuda a eliminar erros típicos de outros modelos. No entanto, esta abordagem requer mais tempo para obter uma resposta – de alguns segundos a vários minutos. No entanto, tais modelos são considerados mais confiáveis ​​em campos complexos como matemática, física e diversas ciências.

DeepSeek disse que o R1 contém 671 bilhões de parâmetros, o que o torna um dos maiores modelos do mundo. Para comodidade dos usuários, a empresa também lançou versões simplificadas do R1 com volume de parâmetros de 1,5 a 70 bilhões. Ao mesmo tempo, a versão mais compacta pode funcionar até mesmo em um laptop normal, enquanto a versão completa requer hardware mais potente. No entanto, o R1 está disponível por meio da API da empresa a um preço 90-95% inferior ao do OpenAI o1.

Nota-se que o R1 também apresenta algumas desvantagens. Uma vez que o modelo foi desenvolvido na China, está sujeito a verificação obrigatória pelos reguladores quanto à conformidade com os “valores socialistas fundamentais”. Por exemplo, R1 recusa-se a responder a perguntas sobre os acontecimentos na Praça Tiananmen ou sobre a independência de Taiwan, o que é típico de muitos modelos chineses de IA que evitam discutir temas políticos sensíveis no Reino Médio.

Vale dizer que o DeepSeek se tornou o primeiro laboratório chinês a entrar em competição real com o OpenAI o1, apresentando uma versão preliminar do R1 em novembro. No entanto, outros jogadores seguiram o exemplo, incluindo Alibaba e Kimi, de propriedade da Moonshot AI. De acordo com Dean Ball, pesquisador de inteligência artificial da Universidade George Mason, tudo isso sugere que as empresas chinesas de IA continuam a ser “seguidoras rápidas” na corrida tecnológica. “O sucesso das versões leves do DeepSeek […] mostra que modelos de raciocínio poderosos se tornarão cada vez mais acessíveis e poderão até ser executados em hardware local”, disse Ball em seu post no X.

avalanche

Postagens recentes

A idade de ouro chegou antes do tempo: o desenvolvimento da Civilização VII de Sid Meier está oficialmente concluído

Falta menos de um mês para o lançamento da estratégia global Sid Meier’s Civilization VII…

9 minutos atrás

Os primeiros fones de ouvido sem fio com conectividade Wi-Fi aparecerão este ano

Em 2023, a Qualcomm introduziu a tecnologia Expanded Personal Area Network (XPAN), que permite que…

2 horas atrás

A Seagate lançou um HDD de 36 TB – este é o disco rígido mais denso com gravação CMR

A empresa americana Seagate Technology continua na vanguarda dos defensores da tecnologia de gravação magnética…

2 horas atrás