A empresa chinesa Moonshot AI começou a implementar uma versão de raciocínio de seu modelo de inteligência artificial, chamada Kimi K2-Thinking. A desenvolvedora publicou resultados de testes que mostram que o modelo tem desempenho equivalente a modelos americanos avançados.

Fonte da imagem: Moonshot AI

Você pode experimentar o modelo Kimi K2-Thinking gratuitamente no chatbot do site do projeto ou conectar-se a ele via API. O custo é o mesmo da rede neural rápida, mas requer tokens adicionais para o raciocínio. A Moonshot AI publicou os pesos de código aberto para o Kimi K2-Thinking e resultados de benchmarks, mostrando que o modelo tem desempenho equivalente a líderes do setor, como OpenAI GPT-5, Anthropic Claude Sonnet 4.5 e xAI Grok 4.

No desafiador Exame Final da Humanidade (HLE, na sigla em inglês), um teste multidisciplinar com quase 3.000 questões de matemática, ciências e humanidades, o Kimi K2-Thinking conquistou o primeiro lugar entre todos os modelos, superando o GPT-5 e o Claude Sonnet 4.5. Ele lidou com sucesso com a cadeia de ferramentas do HLE, executando até 120 etapas. Um modo “Pesado” também está disponível, permitindo que o Kimi K2-Thinking tenha o mesmo desempenho do GPT-5 Pro e do Grok 4 Heavy: oito instâncias do modelo são executadas em paralelo, cada uma fornecendo respostas a uma consulta, que são então combinadas em uma resposta final. Esta versão, que exige mais recursos, não está disponível na versão gratuita do chatbot.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *