A empresa chinesa Moonshot AI começou a implementar uma versão de raciocínio de seu modelo de inteligência artificial, chamada Kimi K2-Thinking. A desenvolvedora publicou resultados de testes que mostram que o modelo tem desempenho equivalente a modelos americanos avançados.
Fonte da imagem: Moonshot AI
Você pode experimentar o modelo Kimi K2-Thinking gratuitamente no chatbot do site do projeto ou conectar-se a ele via API. O custo é o mesmo da rede neural rápida, mas requer tokens adicionais para o raciocínio. A Moonshot AI publicou os pesos de código aberto para o Kimi K2-Thinking e resultados de benchmarks, mostrando que o modelo tem desempenho equivalente a líderes do setor, como OpenAI GPT-5, Anthropic Claude Sonnet 4.5 e xAI Grok 4.
No desafiador Exame Final da Humanidade (HLE, na sigla em inglês), um teste multidisciplinar com quase 3.000 questões de matemática, ciências e humanidades, o Kimi K2-Thinking conquistou o primeiro lugar entre todos os modelos, superando o GPT-5 e o Claude Sonnet 4.5. Ele lidou com sucesso com a cadeia de ferramentas do HLE, executando até 120 etapas. Um modo “Pesado” também está disponível, permitindo que o Kimi K2-Thinking tenha o mesmo desempenho do GPT-5 Pro e do Grok 4 Heavy: oito instâncias do modelo são executadas em paralelo, cada uma fornecendo respostas a uma consulta, que são então combinadas em uma resposta final. Esta versão, que exige mais recursos, não está disponível na versão gratuita do chatbot.
As tentativas de resolver a crise causada pela cisão na empresa holandesa Nexperia estão sendo…
Um paciente da Neuralink, que começou a testar implantes cerebrais projetados para restaurar a visão…
Até agora, temos ouvido falar principalmente sobre fabricantes de memória HBM programando todo o seu…
Cientistas da Universidade Yonsei, na Coreia do Sul, publicaram um estudo inovador afirmando que o…
O marketplace Yandex Market lançou uma nova funcionalidade: um agente com inteligência artificial que ajuda…
A Apple enviou uma carta à Comissão Europeia, principal órgão regulador da indústria na UE,…