O laboratório de inteligência artificial (IA) da China, DeepSeek, revelou uma versão de código aberto de seu modelo de inteligência artificial R1 com capacidades de raciocínio que afirma superar o modelo de IA o1 da OpenAI em alguns benchmarks em uma série de métricas importantes.

Fonte da imagem: Alexander Sinn/Unsplash

Conforme relatado pelo TechCrunch, o modelo R1 supera o OpenAI o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. Esses testes cobrem uma variedade de áreas, incluindo problemas matemáticos, programação e desempenho geral do modelo. AIME avalia o desempenho do modelo em relação a outros modelos de IA, MATH-500 é um conjunto de problemas matemáticos e SWE-bench Verified concentra-se na programação.

Uma característica especial do R1 é a capacidade de autoteste, o que ajuda a eliminar erros típicos de outros modelos. No entanto, esta abordagem requer mais tempo para obter uma resposta – de alguns segundos a vários minutos. No entanto, tais modelos são considerados mais confiáveis ​​em campos complexos como matemática, física e diversas ciências.

DeepSeek disse que o R1 contém 671 bilhões de parâmetros, o que o torna um dos maiores modelos do mundo. Para comodidade dos usuários, a empresa também lançou versões simplificadas do R1 com volume de parâmetros de 1,5 a 70 bilhões. Ao mesmo tempo, a versão mais compacta pode funcionar até mesmo em um laptop normal, enquanto a versão completa requer hardware mais potente. No entanto, o R1 está disponível por meio da API da empresa a um preço 90-95% inferior ao do OpenAI o1.

Nota-se que o R1 também apresenta algumas desvantagens. Uma vez que o modelo foi desenvolvido na China, está sujeito a verificação obrigatória pelos reguladores quanto à conformidade com os “valores socialistas fundamentais”. Por exemplo, R1 recusa-se a responder a perguntas sobre os acontecimentos na Praça Tiananmen ou sobre a independência de Taiwan, o que é típico de muitos modelos chineses de IA que evitam discutir temas políticos sensíveis no Reino Médio.

Vale dizer que o DeepSeek se tornou o primeiro laboratório chinês a entrar em competição real com o OpenAI o1, apresentando uma versão preliminar do R1 em novembro. No entanto, outros jogadores seguiram o exemplo, incluindo Alibaba e Kimi, de propriedade da Moonshot AI. De acordo com Dean Ball, pesquisador de inteligência artificial da Universidade George Mason, tudo isso sugere que as empresas chinesas de IA continuam a ser “seguidoras rápidas” na corrida tecnológica. “O sucesso das versões leves do DeepSeek […] mostra que modelos de raciocínio poderosos se tornarão cada vez mais acessíveis e poderão até ser executados em hardware local”, disse Ball em seu post no X.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *