Categorias: Inteligência Artificial, Aprendizado de Máquina, Redes NeuraisMercado de tecnologia e TI. notícia

OpenAI cometeu erros com diagramas na apresentação do GPT-5 — Altman admite erro

Durante uma grande transmissão ao vivo de apresentação do seu modelo de IA GPT-5, a OpenAI exibiu uma série de gráficos que deveriam ilustrar as impressionantes capacidades do novo modelo. No entanto, após uma análise mais detalhada, alguns dos gráficos apresentavam falhas graves.

Fonte da imagem: Mariia Shalabaieva / unsplash.com

Em um gráfico que, ironicamente, deveria mostrar as altas pontuações do GPT-5 em “avaliação da propensão à fraude em modelos”, a escala não corresponde aos números. Por exemplo, para “fraude de código”, o GPT-5 é listado como 50,0%, enquanto o3 é listado como 47,4%. No entanto, a barra para o3 é mais alta no gráfico. Além disso, o blog corporativo da OpenAI lista um número completamente diferente para o GPT-5 — 16,5%, que provavelmente é o número correto.

Fonte da imagem: x.com/shreyk0

No teste SWE-bench Verified, uma das pontuações do GPT-5 deveria ser menor que a do o3, mas corresponde a uma barra mais alta no gráfico; no mesmo gráfico, as pontuações do o3 e do GPT-4o diferem, mas são ilustradas por barras do mesmo tamanho. A OpenAI levou o erro a sério: o CEO da empresa, Sam Altman, pediu desculpas e acrescentou que as versões corretas foram publicadas no blog corporativo.

Fonte da imagem: x.com/EgeErdil2

A OpenAI não especificou se o próprio GPT-5 foi usado para criar os diagramas, mas tal incidente claramente não acrescenta credibilidade no contexto de uma apresentação em larga escala do novo modelo. Especialmente considerando que os desenvolvedores alegaram que o GPT-5 reduziu significativamente o nível de alucinações.

admin

Próximo Meta adquire startup de IA WaveForms, que trabalha na solução do "Teste de Fala de Turing" »

Anterior « Silicon Motion apresenta o controlador Neptune para SSDs de última geração — PCIe 6.0, 25 GB/s e 3,5 milhões de IOPS

Deixar comentário

Publicado por

admin

8 meses atrás

Postagens recentes

Jogos

A Nvidia demonstrou a tecnologia RTX Mega Geometry em The Witcher 4 — em uma RTX 5090, a demonstração técnica alcançou 80 fps em 4K com DLSS.

A Nvidia divulgou a gravação completa de sua apresentação na GDC 2026, mostrando a tecnologia…

36 minutos atrás

Espaço

A espaçonave Orion, que transportava a tripulação da missão Artemis II, deixou a órbita da Terra na segunda-feira para um encontro com a Lua.

Pela primeira vez em mais de 50 anos, seres humanos deixaram a órbita da Terra…

1 hora atrás

Comentários sobre eventos recentes

A OpenAI decidiu repentinamente gastar mais de cem milhões de dólares para comprar um programa de entrevistas popular.

Ao que tudo indicava, o abandono de áreas de desenvolvimento secundárias, incluindo o fim do…

3 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O Google lançou a família de modelos de código aberto Gemma 4, que oferece suporte a 140 idiomas e é licenciada sob a licença Apache 2.0.

O Google apresentou quatro modelos de código aberto do Gemini 4, baseados na tecnologia do…

6 horas atrás

A IBM está criando laços entre mainframes e arquiteturas Arm, mas parece não entender completamente o porquê.

A IBM anunciou uma colaboração estratégica com a Arm para "desenvolver um novo hardware de…

9 horas atrás

Redes e comunicações

O Caminho Óctuplo para a IAG: Do Falso Nirvana ao Verdadeiro Nirvana / Inteligência Artificial

Qualquer pessoa não budista que tenha ao menos vagamente ouvido falar desse antigo ensinamento sabe…

11 horas atrás