A Anthropic apresentou seu principal modelo de IA, o Opus 4.7, que se tornou mais autônomo e melhor em tarefas complexas.

A Anthropic anunciou o lançamento público de seu novo modelo de IA, Claude Opus 4.7. Esta versão foi lançada dois meses após a atualização anterior, em conformidade com o cronograma de atualizações da Anthropic. Segundo a empresa, o Opus 4.7 requer menos supervisão para tarefas de programação complexas e é capaz de reconhecer imagens de alta resolução. Ele oferece maior criatividade e é capaz de produzir interfaces, slides e documentos de alta qualidade.

Fonte da imagem: Anthropic

De acordo com a Anthropic, o Opus 4.7 representa uma melhoria significativa em relação ao Opus 4.6 na área de desenvolvimento de software avançado, particularmente para as tarefas mais complexas. A empresa destacou melhorias no rastreamento de instruções, suporte multimodal, desempenho em situações reais e utilização de memória.

Resultados comparativos do modelo Opus 4.7 em diversos benchmarks

“Os usuários relatam que podem confiar plenamente em seu trabalho de programação mais complexo — trabalhos que antes exigiam revisão cuidadosa — ao Opus 4.7. O Opus 4.7 lida com tarefas complexas e extensas com rigor e consistência, presta muita atenção às instruções e desenvolve maneiras de verificar seus próprios resultados antes de enviar um relatório”, relatou a Anthropic.

Gestão do Conhecimento em Tarefas de Escritório

A empresa relatou “resultados favoráveis” em diversas áreas de aplicação, incluindo programação de agentes e computação desktop, colocando o Opus 4.7 à frente do 4.6, GPT-5.4 e Gemini 3.1 Pro, mas atrás do Claude Mythos Preview, de uso mais geral. No entanto, o Mythos não é uma versão disponível publicamente como o Opus 4.7, já que a Anthropic o compartilha apenas com os principais fornecedores de plataformas de software, como a Apple.

Pontuação geral de incompatibilidade comportamental para o modelo Opus 4.7 com base nos resultados da auditoria automatizada

“O Opus 4.7 faz melhor uso da memória baseada em arquivos”, observou a empresa. “O modelo memoriza notas importantes ao longo de longas execuções em várias sessões e as utiliza para navegar até novas tarefas, que, portanto, exigem menos contexto prévio.”

A Anthropic focou especificamente nas mudanças no tratamento de tokens no Opus 4.7: “O Opus 4.7 é uma atualização direta do Opus 4.6, mas duas mudanças são notáveis ​​porque impactam o uso de tokens. Primeiro, o Opus 4.7 usa um tokenizador atualizado, o que melhora o tratamento de texto pelo modelo. A contrapartida é que os mesmos dados de entrada podem ser correspondidos com mais tokens — aproximadamente 1,0 a 1,35 vezes mais, dependendo do tipo de conteúdo. Em segundo lugar, o Opus 4.7 tem um desempenho mais eficiente em níveis de complexidade mais altos, especialmente em estágios posteriores de cenários baseados em agentes. Isso melhora a robustez na resolução de problemas complexos, mas também significa que mais tokens de saída são gerados.”

Avaliação de código baseada em agentes e no uso de tokens

A Claude Code também introduziu um novo comando de revisão avançada que, segundo a Anthropic, “inicia uma sessão de revisão dedicada que lê suas alterações e sinaliza o que um revisor cuidadoso notaria”.

admin

Compartilhar
Publicado por
admin

Postagens recentes

O RPG de ação hardcore Outward 2 perdeu sua data de lançamento em Acesso Antecipado – os desenvolvedores não querem decepcionar os jogadores.

Apenas um mês após anunciar a data de lançamento do acesso antecipado de Outward 2,…

1 hora atrás

A melhor tecnologia de processo N+3 da China, a SMIC, só alcançou a TSMC N6 em densidade de transistores, mas apresenta alguns avanços.

Pesquisadores da SemiAnalysis publicaram os resultados do primeiro estudo realizado em seu novo laboratório de…

2 horas atrás

As vítimas de crimes cibernéticos nos EUA perderam quase 21 bilhões de dólares no ano passado.

A Comissão Federal de Comércio dos EUA (FTC) informou que os americanos perderão US$ 3,5…

2 horas atrás

O kernel do Linux perdeu o suporte para o Intel 486 e outras “relíquias do passado”.

O kernel Linux 7.1 foi lançado, refletindo mudanças que vinham sendo planejadas há anos, incluindo…

2 horas atrás

A AMD adquiriu a MEXT, uma startup que desenvolve tecnologias de cache NAND.

A escassez de memória, que afetou praticamente todos os setores da economia, foi desencadeada pelo…

3 horas atrás