A OpenAI apresentou o GPT-5.5, seu LLM mais inteligente até o momento, capaz de realizar tarefas de forma autônoma.

A OpenAI anunciou o GPT-5.5, um modelo de IA que a empresa considera o mais inteligente e intuitivo até o momento. O novo modelo foca menos na melhoria de métricas individuais e mais na busca por uma operação autônoma: o modelo entende mais rapidamente o que é necessário e é capaz de concluir uma tarefa de forma independente, mesmo que inicialmente formulada de maneira vaga e composta por várias partes.

Fonte da imagem: OpenAI

A principal ideia por trás do GPT-5.5 é dispensar o usuário da necessidade de gerenciar com precisão cada etapa do processo. Enquanto antes o modelo precisava ser guiado passo a passo, agora ele pode receber uma tarefa complexa em sua totalidade e descobrirá como abordá-la por conta própria. O modelo pode construir um plano de ação, conectar as ferramentas necessárias, verificar resultados intermediários e corrigir o rumo caso algo dê errado. Isso é especialmente perceptível em tarefas que vão além da simples geração de texto: desde programação e análise de dados até o trabalho com documentos, planilhas e interfaces de software.

As melhorias mais significativas foram observadas na programação. O GPT-5.5 retém melhor o contexto de grandes projetos, possui uma compreensão mais profunda da arquitetura do sistema e é capaz de resolver problemas que exigem raciocínio extenso. Nos testes, ele demonstra melhorias significativas em relação ao GPT-5.4, inclusive em cenários complexos de linha de comando e na resolução de problemas de engenharia que levariam, em média, cerca de 20 horas para um humano concluir. Além disso, os desenvolvedores relatam não um aumento nas pontuações dos testes, mas uma mudança qualitativa no comportamento: o modelo entende melhor por que o sistema falha, onde exatamente as mudanças precisam ser feitas e quais as consequências disso para o restante do código.

Esse novo nível de autonomia também é evidente no trabalho diário. Quando combinado com ferramentas como o Codex, o modelo começa a se comportar como um assistente digital completo, capaz de visualizar a interface, clicar, inserir texto, navegar entre ferramentas, coletar informações de diversas fontes e convertê-las em documentos, relatórios ou tabelas prontos, de acordo com a OpenAI.Esses cenários já estão sendo usados ​​na prática: o GPT-5.5 é utilizado para analisar grandes conjuntos de dados, automatizar a geração de relatórios e acelerar processos internos em horas ou até mesmo semanas.

O GPT-5.5 apresenta um desempenho excelente em benchmarks.

As capacidades científicas e analíticas do modelo foram aprimoradas separadamente. O modelo tem um desempenho melhor em tarefas que exigem não apenas uma resposta, mas também uma abordagem consistente para hipóteses e dados. Ele consegue completar todo o ciclo — desde o estudo das informações iniciais até a interpretação dos resultados e a proposição de próximos passos. Em diversos testes relacionados à bioinformática e à matemática, o GPT-5.5 demonstrou progresso significativo e, em um experimento, o modelo ajudou a obter uma nova prova matemática, o que os desenvolvedores consideram um sinal de que ele atingiu o nível de um “co-pesquisador” e não apenas de uma ferramenta.

Ao mesmo tempo, esse aumento de capacidade não resultou em perda de velocidade. O GPT-5.5 opera com níveis de latência comparáveis ​​à geração anterior, mas executa tarefas com mais eficiência e consome menos recursos computacionais. Em tarefas de programação, o custo é até metade do de modelos concorrentes comparáveis. Em outras palavras, o desenvolvimento está focado não apenas na qualidade, mas também na eficácia prática.

Juntamente com essas capacidades aprimoradas, as medidas de segurança também foram reforçadas. O modelo passou por extensos testes, incluindo cenários de cibersegurança, e recebeu controles mais rigorosos para consultas potencialmente perigosas. A OpenAI enfatiza que busca manter um equilíbrio entre a proteção contra abusos e a disponibilidade para tarefas úteis, principalmente em cibersegurança de infraestrutura.

O GPT-5.5 já começou a ser disponibilizado gradualmente aos usuários. Ele está disponível no ChatGPT para assinantes pagos dos planos Plus, Pro, Business e Enterprise, e também é utilizado no Codex com contexto expandido.Os planos Pro, Business e Enterprise também incluem uma versão mais avançada do GPT-5.5 Pro, projetada para tarefas complexas onde a precisão e a profundidade da análise são cruciais. O acesso à API para esses novos recursos será adicionado posteriormente.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Pronto para a missão: o thriller de espionagem 007 First Light, dos criadores de Hitman, alcançou o status gold duas semanas antes do lançamento.

O ambicioso thriller de espionagem 007 First Light, da desenvolvedora dinamarquesa IO Interactive (da série…

7 horas atrás

Um asteroide do tamanho de uma casa passará perto da Terra na próxima semana – ele estará quatro vezes mais perto do que a Lua.

Na segunda-feira, 18 de maio, um asteroide descoberto há poucos dias passará perto da Terra,…

7 horas atrás

O setor de tecnologia foi atingido por uma onda de demissões, com mais de 100 mil funcionários perdendo seus empregos desde o início do ano.

No início de maio, o número de demissões no setor de tecnologia ultrapassou 100 mil…

7 horas atrás

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que os drivers fossem atualizados sem permissão.

A Microsoft corrigiu um bug no Windows Autopatch que fazia com que alguns dispositivos Windows…

8 horas atrás

A primeira bateria de gravidade da África será construída na África do Sul.

A empresa estatal sul-africana de energia elétrica, Eskom, anunciou o lançamento de um dos projetos…

8 horas atrás

A Devolver Digital anunciou The Talos Principle 3, o grande final da trilogia de quebra-cabeças filosóficos dos criadores de Serious Sam.

A editora Devolver Digital e a desenvolvedora Croteam (série Serious Sam) anunciaram The Talos Principle…

9 horas atrás