A empresa chinesa Moonshot AI começou a implementar uma versão de raciocínio de seu modelo de inteligência artificial, chamada Kimi K2-Thinking. A desenvolvedora publicou resultados de testes que mostram que o modelo tem desempenho equivalente a modelos americanos avançados.

Fonte da imagem: Moonshot AI

Você pode experimentar o modelo Kimi K2-Thinking gratuitamente no chatbot do site do projeto ou conectar-se a ele via API. O custo é o mesmo da rede neural rápida, mas requer tokens adicionais para o raciocínio. A Moonshot AI publicou os pesos de código aberto para o Kimi K2-Thinking e resultados de benchmarks, mostrando que o modelo tem desempenho equivalente a líderes do setor, como OpenAI GPT-5, Anthropic Claude Sonnet 4.5 e xAI Grok 4.

No desafiador Exame Final da Humanidade (HLE, na sigla em inglês), um teste multidisciplinar com quase 3.000 questões de matemática, ciências e humanidades, o Kimi K2-Thinking conquistou o primeiro lugar entre todos os modelos, superando o GPT-5 e o Claude Sonnet 4.5. Ele lidou com sucesso com a cadeia de ferramentas do HLE, executando até 120 etapas. Um modo “Pesado” também está disponível, permitindo que o Kimi K2-Thinking tenha o mesmo desempenho do GPT-5 Pro e do Grok 4 Heavy: oito instâncias do modelo são executadas em paralelo, cada uma fornecendo respostas a uma consulta, que são então combinadas em uma resposta final. Esta versão, que exige mais recursos, não está disponível na versão gratuita do chatbot.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Os Países Baixos explicaram como os chineses poderiam retomar o controle da Nexperia 3DNews, que havia sido capturada.

As tentativas de resolver a crise causada pela cisão na empresa holandesa Nexperia estão sendo…

13 minutos atrás

Paciente com implante cerebral Neuralink recebe ‘segundo par de olhos’ 3DNews

Um paciente da Neuralink, que começou a testar implantes cerebrais projetados para restaurar a visão…

22 minutos atrás

O Universo desacelerou sua expansão e nós não percebemos (3DNews)

Cientistas da Universidade Yonsei, na Coreia do Sul, publicaram um estudo inovador afirmando que o…

45 minutos atrás

O Yandex Market agora conta com um agente de IA capaz de encontrar produtos por foto e ajudar você a escolher presentes. 3DNews

O marketplace Yandex Market lançou uma nova funcionalidade: um agente com inteligência artificial que ajuda…

55 minutos atrás

A Apple descobriu inconsistências nas leis DSA e DMA ao tentar impedir mudanças na App Store.

A Apple enviou uma carta à Comissão Europeia, principal órgão regulador da indústria na UE,…

55 minutos atrás