A OpenAI apresentou oficialmente sua família de modelos de linguagem GPT-5.6, que inclui três modelos em diferentes níveis: o principal, Sol; o equilibrado, Terra; e o acessível, Luna. Atualmente, esses modelos estão disponíveis apenas para um número limitado de parceiros confiáveis por meio da API e do Codex, mas a empresa espera disponibilizá-los amplamente nas próximas semanas, inclusive por meio do ChatGPT.
Fonte da imagem: OpenAI
Com o lançamento do GPT-5.6, a OpenAI alterou o esquema de nomenclatura de seus modelos. Um número agora indica a geração do modelo, enquanto os nomes Sol, Terra e Luna designarão permanentemente os níveis de desempenho. Modelos de diferentes níveis serão desenvolvidos independentemente.
De acordo com os desenvolvedores, o GPT-5.6 é a família de modelos mais poderosa da empresa até o momento. Ele dá ênfase especial à programação, segurança cibernética, biologia e cenários de longa duração baseados em agentes que exigem o planejamento e a execução de uma sequência de ações.
O Sol apresenta dois modos de operação adicionais. O modo Max aloca mais tempo para o modelo raciocinar ao resolver problemas complexos, enquanto o Ultra usa vários subagentes para acelerar fluxos de trabalho complexos.
A OpenAI publica seus próprios resultados de benchmark de desempenho. No benchmark TerminalBench 2.1, que avalia tarefas complexas de linha de comando, o GPT-5.6 Sol no modo Ultra obteve 91,9%, o Sol regular 88,8%, o Terra 84,3% e o Luna 82,5%. Além disso, a empresa afirma que o Sol supera o GPT-5.5 em pesquisas biológicas (GeneBench v1) usando menos tokens, e também é o modelo de cibersegurança mais robusto da OpenAI.
Os preços dos modelos também variam significativamente. O GPT-5.6 Sol custa US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída, o Terra custa US$ 2,50 e US$ 15, respectivamente, enquanto o Luna custa apenas US$ 1 e US$ 6 por milhão de tokens. A OpenAI também aprimorou seu mecanismo de cache de requisições de API para os modelos GPT-5.A versão 6 agora oferece suporte a breakpoints de cache explícitos e o tempo mínimo de retenção de consultas em cache foi aumentado para 30 minutos.
Atenção especial da OpenAIA OpenAI priorizou a segurança. A empresa afirma que o GPT-5.6 possui o conjunto de defesas mais robusto da sua história. O modelo foi treinado para negar solicitações proibidas relacionadas a ataques cibernéticos, mesmo que o usuário tente ocultar suas intenções, enganar ou burlar restrições por meio de jailbreaks. Segundo os desenvolvedores, o Sol é significativamente mais eficiente em encontrar e corrigir vulnerabilidades do que em realizar ataques completos contra sistemas de computador.
A empresa também informou que mais de 700.000 horas de GPU foram dedicadas a testes automatizados de segurança do modelo em aceleradores NVIDIA da classe A100. Especialistas independentes em segurança também participaram dos testes e continuarão a testá-lo durante todo o período de pré-visualização.
Durante os testes limitados, a OpenAI está intencionalmente utilizando medidas de segurança mais rigorosas. A empresa alerta que algumas solicitações legítimas, principalmente aquelas relacionadas à pesquisa em segurança da informação, podem ser bloqueadas temporariamente ou sujeitas a revisão adicional. Esses casos devem ajudar os desenvolvedores a ajustar seus mecanismos de segurança antes de um lançamento em larga escala.
O lançamento do GPT-5.6 ocorreu menos de um dia após surgirem notícias de que a OpenAI adiaria o lançamento do novo modelo a pedido do governo Trump. Segundo relatos da mídia, durante os testes preliminares, o acesso ao modelo será concedido apenas a um número limitado de organizações aprovadas pelas autoridades americanas.
No entanto, a OpenAI ressalta que não considera esse procedimento a norma.A empresa afirmou ter colaborado com o governo dos EUA antes do lançamento do GPT-5.6, mas espera que modelos semelhantes sejam lançados no futuro sem a necessidade de aprovação prévia do governo.
A demo para PC do jogo de ação gótica cult Bloodborne, que encantou os fãs…
Um entusiasta criou uma ferramenta online que guia o novo controle Steam da Valve de…
Após 28 anos de buscas, os fãs do clássico jogo de terror e sobrevivência Resident…
A Wikipédia pode ser editada por qualquer um de seus 53 milhões de membros, mas…
Segundo fontes familiarizadas com o assunto, a Volkswagen está considerando fechar quatro fábricas na Alemanha…
A nomenclatura dos processadores móveis Snapdragon da Qualcomm costuma causar confusão: pequenas variações levam a…