Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

A pesquisa profunda do Open Mostrou um resultado recorde no mais difícil “último exame da humanidade”

Fonte da imagem: Scale.com

O benchmark, criado por especialistas de todo o mundo, contém perguntas e tarefas extremamente complexas sobre conhecimento e raciocínio – mesmo algumas pessoas não conseguem entender perguntas individuais, sem mencionar a resposta para elas. Logo após sua saída, a lista de líderes no exame foi liderada pelo modelo de raciocínio da AI Deepseek R1, que deu 9,4 % das respostas corretas. Os modelos OpenAI O3-Mini com resultado de 10,5 % e O3-Mini-High podem ultrapassá-lo, o que marcou 13 %-o último é realmente mais poderoso, mas também funciona mais lentamente. Mas o resultado foi demonstrado pela pesquisa do Openai Deep, mais impressionante-marcou 26,6 %, conduzindo assim os anteriores menos de 10 dias.

avalanche

Próximo A Huawei contou quando as primeiras três pernas de smartphone do mundo »

Anterior « O carro -chefe Xiaomi 15 Ultra será representado no final de fevereiro

Deixar comentário

Publicado por

avalanche

1 ano atrás

Postagens recentes

Espaço

A SpaceX está se preparando para protocolar os documentos necessários para uma oferta pública inicial (IPO) esta semana.

No final de janeiro, foi anunciado que a SpaceX, empresa aeroespacial de Elon Musk, programaria…

36 minutos atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A Apple lançará um aplicativo Siri separado para iOS 27 e macOS 27.

Segundo Mark Gurman, da Bloomberg, a Apple planeja lançar o primeiro aplicativo Siri independente como…

4 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

A OpenAI encerrou abruptamente o Sora, o gerador viral de sátiras com IA.

A OpenAI decidiu inesperadamente encerrar seu aplicativo de criação de vídeos com inteligência artificial, o…

4 horas atrás

Eventos e eventos da indústria de TI, exposições, fóruns

NVIDIA Groq 3: SRAM, desagregação, determinismo

As LPUs da Groq são fundamentalmente diferentes dos aceleradores de IA da NVIDIA, mas são…

5 horas atrás

Manipuladores, dispositivos gráficos de entrada

A Razer apresentou o mouse sem fio Viper V4 Pro — 49 gramas, 50.000 DPI, switches ópticos e 180 horas de duração da bateria por US$ 160.

A Razer apresentou o mouse gamer sem fio Viper V4 Pro. O novo mouse conta…

6 horas atrás

Na vanguarda da ciência

A primeira cerveja do mundo feita com CO₂ extraído diretamente do ar ambiente foi lançada nos EUA.

Pela primeira vez no mundo, a cerveja foi carbonatada com dióxido de carbono (CO₂) capturado…