A OpenAI anunciou o lançamento de uma nova versão de seu modelo de inteligência artificial, o GPT-5.4. Segundo a desenvolvedora, ele combina avanços em raciocínio lógico, programação e trabalho profissional com documentos de texto, planilhas e apresentações. Este é o primeiro modelo da empresa a oferecer suporte nativo a tarefas no computador do usuário e em diversos aplicativos.

Fonte da imagem: Zac Wolff / unsplash.com
O OpenAI GPT-5.4 representa mais um passo rumo à ampla utilização de agentes de IA capazes de executar tarefas online complexas e controlar softwares em nome dos usuários. A empresa lançou as bases tecnológicas para essas capacidades no ano passado com o recurso ChatGPT Agent, que permite que a IA assuma o controle de um computador para realizar tarefas como compras de supermercado.
O OpenAI GPT-5.4 já está disponível via API e no aplicativo de programação Codex AI, e sua versão de raciocínio, GPT-5.4 Thinking, estreou no ChatGPT. O novo GPT-5.4 consegue escrever código para controlar computadores e emular comandos de mouse e teclado com base em solicitações de capturas de tela. Ele se tornou mais eficiente que seus antecessores no controle de navegadores e no acesso a APIs de terceiros. O modelo apresenta melhor desempenho em perguntas que envolvem a coleta de informações de múltiplas fontes, consegue realizar diversas buscas para identificar as fontes mais relevantes, “especialmente para perguntas do tipo ‘agulha no palheiro’, e sintetiza dados em uma resposta clara e bem fundamentada”. A OpenAI afirma que o GPT-5.4 é “o modelo mais preciso até o momento”, com uma redução de 33% em afirmações falsas em comparação com o GPT-5.2.
Ao receber consultas complexas, o GPT-5.4 Thinking sugere um fluxo de trabalho, permitindo que o usuário ajuste sua consulta diretamente à medida que recebe a resposta. “Isso facilita a manipulação do modelo para alcançar o resultado desejado sem precisar recomeçar ou executar etapas adicionais”, observou a OpenAI. O GPT-5.4 básico já está sendo implementado no ChatGPT e no Codex.e API; o mecanismo de raciocínio GPT-5.4 Thinking estará disponível para assinantes dos planos pagos Plus, Team e Pro; o poderoso GPT-5.4 Pro está disponível via API para “desempenho máximo em problemas complexos” — também está disponível para usuários com contas ChatGPT Enterprise e Edu.