Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

A pesquisa profunda do Open Mostrou um resultado recorde no mais difícil “último exame da humanidade”

Fonte da imagem: Scale.com

O benchmark, criado por especialistas de todo o mundo, contém perguntas e tarefas extremamente complexas sobre conhecimento e raciocínio – mesmo algumas pessoas não conseguem entender perguntas individuais, sem mencionar a resposta para elas. Logo após sua saída, a lista de líderes no exame foi liderada pelo modelo de raciocínio da AI Deepseek R1, que deu 9,4 % das respostas corretas. Os modelos OpenAI O3-Mini com resultado de 10,5 % e O3-Mini-High podem ultrapassá-lo, o que marcou 13 %-o último é realmente mais poderoso, mas também funciona mais lentamente. Mas o resultado foi demonstrado pela pesquisa do Openai Deep, mais impressionante-marcou 26,6 %, conduzindo assim os anteriores menos de 10 dias.

avalanche

Próximo A Huawei contou quando as primeiras três pernas de smartphone do mundo »

Anterior « O carro -chefe Xiaomi 15 Ultra será representado no final de fevereiro

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Espaço

O primeiro voo da Starship V3 comprovou a capacidade de sobrevivência do megafoguete atualizado, embora tenha terminado em uma explosão.

Imperfeito, mas bem-sucedido — assim podemos descrever o voo inaugural do sistema de foguete Starship…

57 minutos atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

O supermodelo de IA Claude Mythos descobriu mais de 10.000 vulnerabilidades de software em apenas um mês.

A Anthropic publicou o primeiro relatório sobre seu projeto de cibersegurança, o Projeto Glasswing, lançado…

2 horas atrás

Notícias e análises financeiras

Trump investiu acidentalmente US$ 1 milhão em uma rede de restaurantes de sushi em vez de uma fabricante de hardware de IA.

O presidente dos EUA, Donald Trump, é um investidor experiente. Nos últimos meses, suas declarações…

4 horas atrás

Vírus, cavalos de Troia, vulnerabilidades de software, problemas de segurança

Mais uma vulnerabilidade grave foi descoberta no Linux – e ela já tem dez anos.

Uma grave vulnerabilidade foi descoberta no sistema operacional Linux, permitindo que qualquer usuário obtenha acesso…

5 horas atrás

Clientes de MI

O WhatsApp exibirá uma lista separada de contatos que estão online.

A versão beta mais recente do WhatsApp para iPhone menciona uma interface de lista de…

5 horas atrás

Espaço

A primeira taikonauta de Hong Kong viajará para a estação espacial chinesa.

A primeira taikonauta de Hong Kong, uma ex-policial com doutorado em informática forense, será a…

5 horas atrás

A pesquisa profunda do Open Mostrou um resultado recorde no mais difícil “último exame da humanidade”

Conteúdo relacionado

Postagens recentes

O primeiro voo da Starship V3 comprovou a capacidade de sobrevivência do megafoguete atualizado, embora tenha terminado em uma explosão.

O supermodelo de IA Claude Mythos descobriu mais de 10.000 vulnerabilidades de software em apenas um mês.

Trump investiu acidentalmente US$ 1 milhão em uma rede de restaurantes de sushi em vez de uma fabricante de hardware de IA.

Mais uma vulnerabilidade grave foi descoberta no Linux – e ela já tem dez anos.

O WhatsApp exibirá uma lista separada de contatos que estão online.

A primeira taikonauta de Hong Kong viajará para a estação espacial chinesa.