O modelo de IA mais poderoso da OpenAI, o3, gasta até US$ 30.000 para resolver um problema

Em dezembro, a OpenAI revelou seu modelo de raciocínio de IA o3 e mostrou os resultados do benchmark ARC-AGI, o teste mais desafiador para avaliar as capacidades de IA. Agora, os resultados dos testes tiveram que ser revisados ​​e parecem menos impressionantes: o modelo acabou sendo caro demais para manter.

Fonte da imagem: Mariia Shalabaieva / unsplash.com

Na semana passada, a Arc Prize Foundation, a organização por trás do ARC-AGI, atualizou sua estimativa de custo de computação para o OpenAI o3. Sua configuração mais poderosa, o3 high, foi estimada originalmente em cerca de US$ 3.000 para resolver um único problema ARC-AGI. Agora foi estabelecido que o custo de manutenção é muito mais alto — possivelmente até US$ 30.000 por tarefa. Isso ilustra o quão caros até mesmo os modelos modernos de IA mais sofisticados podem ser para certas tarefas, pelo menos inicialmente. A OpenAI ainda não definiu um preço para o o3, e o modelo não foi disponibilizado publicamente, mas a Arc Prize Foundation sugeriu que o OpenAI o1-pro poderia ser usado como referência.

«Acreditamos que o1-pro é uma comparação mais próxima [para determinar] o valor real de o3 devido à quantidade de computação usada durante o teste. Mas esta não é uma estimativa exata, e deixamos o o3 como uma designação de pré-lançamento em nossa tabela de classificação para refletir a incerteza até que um preço oficial seja anunciado”, disse a Arc Prize Foundation ao TechCrunch. Sabe-se que, ao resolver um problema, o o3 alto usou 172 vezes mais recursos de computação no ARC-AGI do que o o3 baixo, o modelo mais fraco da linha.

Anteriormente, sabia-se que os planos tarifários para sistemas OpenAI avançados podem ser extremamente caros – até US$ 20.000 por mês para o trabalho de agentes de IA especializados. No entanto, os modelos são propensos a erros: o mesmo o3 alto precisou de 1024 tentativas para resolver cada problema do teste ARC-AGI para mostrar o melhor resultado.

avalanche

Postagens recentes

Os Estados Unidos permitirão que aviões supersônicos sobrevoem cidades, mas sob uma condição.

A Administração Federal de Aviação dos EUA (FAA) anunciou recentemente sua intenção de permitir que…

43 minutos atrás

“O tempo é uma construção social”: o thriller de ficção científica Ontos, dos criadores de Amnesia e Soma, foi adiado para 2027.

O thriller de ficção científica Ontos, que despertou a curiosidade dos fãs no The Game…

1 hora atrás

O blogueiro que vazou informações do iOS 26 antes do anúncio oficial culpou seu cúmplice.

O YouTuber Jon Prosser apresentou uma resposta ao processo da Apple, no qual a empresa…

1 hora atrás

Os cientistas se inspiraram no peneireiro-vulgar e desenvolverão um drone capaz de resistir a rajadas de vento.

Cientistas da Universidade RMIT (Austrália) e da Universidade de Bristol (Reino Unido) propuseram um método…

2 horas atrás

O retorno ao DDR4 está a todo vapor: a Intel retomou a produção dos processadores Raptor Lake.

A demanda por processadores está atualmente em seu nível mais alto, com o segmento de…

2 horas atrás

Ativistas americanos de direitos humanos declararam que a rede social X representa uma séria ameaça à privacidade dos americanos.

Ativistas americanos de direitos humanos alertaram a Comissão Federal de Comércio (FTC) dos EUA sobre…

2 horas atrás