Fonte da imagem: Scale.com
O benchmark, criado por especialistas de todo o mundo, contém perguntas e tarefas extremamente complexas sobre conhecimento e raciocínio – mesmo algumas pessoas não conseguem entender perguntas individuais, sem mencionar a resposta para elas. Logo após sua saída, a lista de líderes no exame foi liderada pelo modelo de raciocínio da AI Deepseek R1, que deu 9,4 % das respostas corretas. Os modelos OpenAI O3-Mini com resultado de 10,5 % e O3-Mini-High podem ultrapassá-lo, o que marcou 13 %-o último é realmente mais poderoso, mas também funciona mais lentamente. Mas o resultado foi demonstrado pela pesquisa do Openai Deep, mais impressionante-marcou 26,6 %, conduzindo assim os anteriores menos de 10 dias.
A desenvolvedora de baterias de estado sólido QuantumScape e a fabricante de baterias do Grupo…
A Asus anunciou que a placa de vídeo ProArt GeForce RTX 5080 OC Edition já…
A SiFive apresenta a segunda geração da família RISC-V Intelligent Core, que inclui os novos…
Muitos especialistas altamente qualificados na área de inteligência artificial começaram a deixar a Meta✴. A…
Os hackers éticos BobDaHacker e BobTheShoplifter anunciaram a descoberta de “vulnerabilidades catastróficas” nos sistemas de…
A Microsoft está testando novos recursos com tecnologia de IA que permitirão que usuários do…