A Anthropic apresentou seu principal modelo de IA, o Opus 4.7, que se tornou mais autônomo e melhor em tarefas complexas.

A Anthropic anunciou o lançamento público de seu novo modelo de IA, Claude Opus 4.7. Esta versão foi lançada dois meses após a atualização anterior, em conformidade com o cronograma de atualizações da Anthropic. Segundo a empresa, o Opus 4.7 requer menos supervisão para tarefas de programação complexas e é capaz de reconhecer imagens de alta resolução. Ele oferece maior criatividade e é capaz de produzir interfaces, slides e documentos de alta qualidade.

Fonte da imagem: Anthropic

De acordo com a Anthropic, o Opus 4.7 representa uma melhoria significativa em relação ao Opus 4.6 na área de desenvolvimento de software avançado, particularmente para as tarefas mais complexas. A empresa destacou melhorias no rastreamento de instruções, suporte multimodal, desempenho em situações reais e utilização de memória.

Resultados comparativos do modelo Opus 4.7 em diversos benchmarks

“Os usuários relatam que podem confiar plenamente em seu trabalho de programação mais complexo — trabalhos que antes exigiam revisão cuidadosa — ao Opus 4.7. O Opus 4.7 lida com tarefas complexas e extensas com rigor e consistência, presta muita atenção às instruções e desenvolve maneiras de verificar seus próprios resultados antes de enviar um relatório”, relatou a Anthropic.

Gestão do Conhecimento em Tarefas de Escritório

A empresa relatou “resultados favoráveis” em diversas áreas de aplicação, incluindo programação de agentes e computação desktop, colocando o Opus 4.7 à frente do 4.6, GPT-5.4 e Gemini 3.1 Pro, mas atrás do Claude Mythos Preview, de uso mais geral. No entanto, o Mythos não é uma versão disponível publicamente como o Opus 4.7, já que a Anthropic o compartilha apenas com os principais fornecedores de plataformas de software, como a Apple.

Pontuação geral de incompatibilidade comportamental para o modelo Opus 4.7 com base nos resultados da auditoria automatizada

“O Opus 4.7 faz melhor uso da memória baseada em arquivos”, observou a empresa. “O modelo memoriza notas importantes ao longo de longas execuções em várias sessões e as utiliza para navegar até novas tarefas, que, portanto, exigem menos contexto prévio.”

A Anthropic focou especificamente nas mudanças no tratamento de tokens no Opus 4.7: “O Opus 4.7 é uma atualização direta do Opus 4.6, mas duas mudanças são notáveis ​​porque impactam o uso de tokens. Primeiro, o Opus 4.7 usa um tokenizador atualizado, o que melhora o tratamento de texto pelo modelo. A contrapartida é que os mesmos dados de entrada podem ser correspondidos com mais tokens — aproximadamente 1,0 a 1,35 vezes mais, dependendo do tipo de conteúdo. Em segundo lugar, o Opus 4.7 tem um desempenho mais eficiente em níveis de complexidade mais altos, especialmente em estágios posteriores de cenários baseados em agentes. Isso melhora a robustez na resolução de problemas complexos, mas também significa que mais tokens de saída são gerados.”

Avaliação de código baseada em agentes e no uso de tokens

A Claude Code também introduziu um novo comando de revisão avançada que, segundo a Anthropic, “inicia uma sessão de revisão dedicada que lê suas alterações e sinaliza o que um revisor cuidadoso notaria”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A MediaTek apresentou o chip Dimensity 8550 para smartphones potentes de gama média – ele é compatível com o Gemini Nano v3.

O Google anunciou recentemente o Gemini Intelligence, uma interface interativa para smartphones Android. No entanto,…

35 minutos atrás

A Gigabyte lançou a segunda revisão da GeForce RTX 5060 Gaming OC, que é 7 MHz mais rápida.

A Gigabyte lançou mais uma variante da placa gráfica GeForce RTX 5060, a GeForce RTX…

35 minutos atrás

Modine recebe US$ 4 bilhões em pré-encomendas para sistemas de refrigeração de data centers.

Uma nova tendência surgiu no mercado de infraestrutura de IA. A fabricante de sistemas de…

49 minutos atrás

A Apple aumentou os valores pagos na troca de iPhones e MacBooks mais antigos.

Hoje, a Apple atualizou os valores máximos de troca para iPhones, Apple Watches, Macs, iPads…

1 hora atrás

Um jogo grandioso em um formato compacto: os críticos deram seu veredicto sobre a aventura clássica Mina the Hollower, dos criadores de Shovel Knight.

Antes de seu lançamento iminente, Mina the Hollower, o jogo de ação e aventura em…

1 hora atrás

O YouTube aprendeu a etiquetar automaticamente vídeos criados com o auxílio de inteligência artificial.

Hoje, o YouTube anunciou que seus sistemas internos irão sinalizar automaticamente vídeos caso detectem o…

1 hora atrás