A OpenAI apresentou o GPT-5.3-Codex, um modelo de programação de IA que ajudou a se criar.

A OpenAI apresentou o modelo de IA GPT-5.3-Codex, um sistema para gerar código e executar tarefas semelhantes às de um agente. O algoritmo mantém o desempenho de geração de código da versão anterior, GPT-5.2-Codex, mas é 25% mais rápido e combina suas capacidades de raciocínio com a expertise do GPT-5.2.

A OpenAI observou que o GPT-5.3-Codex é o primeiro modelo de IA da empresa e desempenhou um papel fundamental em seu desenvolvimento. Os desenvolvedores usaram versões iniciais do algoritmo para depurar o processo de treinamento, gerenciar sua própria implantação e diagnosticar resultados de testes. A equipe do Codex ficou muito surpresa com a utilidade que o modelo de IA demonstrou em acelerar seu próprio desenvolvimento.

Com o lançamento do GPT-5.3-Codex, o sistema evoluiu de um agente de IA capaz de escrever e verificar código para um que pode executar praticamente qualquer tarefa que desenvolvedores e usuários encontrem ao interagir com um computador. O modelo de IA é capaz de executar tarefas complexas que exigem pesquisa usando diversas ferramentas. O usuário pode interagir diretamente com o algoritmo durante esse processo, permitindo que ele seja guiado conforme necessário.

A OpenAI observou que o GPT-5.3-Codex estabeleceu um novo recorde do setor nos benchmarks SWE-Bench Pro e Terminal-Bench, além de demonstrar resultados excepcionais no OSWorld e no GDPval. Comparado ao GPT-5.2-Codex, o novo modelo de IA apresentou ganhos de desempenho em todos os principais benchmarks: 56,8% no SWE-Bench Pro contra 56,4% para o GPT-5.2-Codex e 77,3% no Terminal-Bench contra 64% para a versão anterior. Além disso, os desenvolvedores aprimoraram as capacidades do modelo de IA para desenvolvimento web.

Uma mudança significativa no GPT-5.3-Codex é sua capacidade de ir além da simples escrita de código. A OpenAI posiciona o novo modelo de IA como um agente de propósito geral, adequado para uma variedade de tarefas que os profissionais enfrentam diariamente. O algoritmo será útil para programadores, designers, gerentes, cientistas de dados e outros usuários, pois permite o desenvolvimento e o suporte de software ao longo de todo o seu ciclo de vida.

Notavelmente, ele oferece segurança cibernética aprimorada. O GPT-5.3-Codex é o primeiro modelo de IA com alto nível de capacidade para tarefas de cibersegurança. A OpenAI foi pioneira ao treinar diretamente um modelo de IA para encontrar vulnerabilidades em código de software. Em resposta, a empresa anunciou a expansão de seu programa de bolsas de cibersegurança para pesquisadores, com um aporte de US$ 10 milhões em créditos de API para segurança de software de código aberto.

O GPT-5.3-Codex já está disponível para assinantes pagos do ChatGPT. Desenvolvedores terão acesso à API do algoritmo em breve.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Um suspeito da tentativa de incêndio criminoso na casa do CEO da OpenAI, Sam Altman, foi preso nos EUA.

A exposição pública dos executivos de grandes empresas de tecnologia os torna tão vulneráveis ​​quanto…

23 minutos atrás

A Meta não conseguiu se defender de mais um processo judicial relacionado ao vício de adolescentes em redes sociais.

Hoje, a Suprema Corte de Massachusetts decidiu que a plataforma de mídia social Instagram foi…

59 minutos atrás

A Qualcomm não tem certeza da capacidade da Samsung de produzir chips de 2nm com a qualidade exigida.

A empresa americana Qualcomm é conhecida por sua abordagem eclética na seleção de fornecedores para…

59 minutos atrás

Cientistas propuseram uma maneira inesperada de detectar ondas gravitacionais — tão simples que é difícil de acreditar.

Cientistas da Universidade de Estocolmo, da Nordita e da Universidade de Tübingen propuseram um método…

59 minutos atrás

A Microsoft simplificou a plataforma Windows Insider, com menos canais e a possibilidade de alternar entre eles sem a necessidade de uma instalação limpa.

A Microsoft simplificou significativamente a estrutura do programa Windows Insider para testar novas versões do…

2 horas atrás