A Anthropic revelou o Claude Sonnet 4.5, a “melhor” IA do mundo para programação e computação complexa.

A Anthropic anunciou o Claude Sonnet 4.5, o modelo de linguagem em larga escala mais poderoso da família Claude até o momento. De acordo com os desenvolvedores, ele é focado em programação, construção de agentes de IA e resolução de problemas complexos. A Anthropic garantiu que o Sonnet 4.5 não apenas lidera em benchmarks especializados, mas também demonstra um avanço significativo na compreensão de código, cálculos matemáticos e controle de computadores.

O Claude Sonnet 4.5 conquistou o primeiro lugar no SWE-bench Verified, um benchmark do setor que mede as capacidades reais de modelos de IA na escrita e análise de código. De acordo com a Anthropic, o Sonnet 4.5 pode manter a concentração por mais de 30 horas ao trabalhar em tarefas complexas de várias etapas, superando as versões anteriores do Claude e seus concorrentes mais próximos.

Em um benchmark OSWorld que testa o desempenho da IA ​​em tarefas de computação do mundo real, o Sonnet 4.5 alcançou uma pontuação de 61,4%, em comparação com 42,2% do Sonnet 4, demonstrando uma melhoria drástica de desempenho nos últimos meses.

O novo modelo se provou não apenas em programação. De acordo com testes internos e independentes, o Sonnet 4.5 demonstra melhorias significativas em inferência e matemática, bem como em áreas especializadas como finanças, medicina, direito e STEM. Os desenvolvedores observam melhorias na geração e análise de código, no gerenciamento de arquivos e em cálculos complexos em tempo real.

Um modo experimental “Imagine com Claude” também foi adicionado: agora a IA pode criar soluções de software literalmente em tempo real, adaptando totalmente o código às necessidades do usuário.

Junto com o lançamento do Sonnet 4.5, a empresa revelou atualizações importantes para o ecossistema Claude.No serviço Claude CodePontos de verificação para salvar o progresso, um terminal atualizado e uma extensão nativa para o Visual Studio Code foram adicionados. Os aplicativos Claude agora oferecem suporte à interação direta com o código, criação de arquivos (incluindo planilhas, apresentações e documentos) diretamente na caixa de diálogo, e usuários com uma assinatura Max agora têm uma extensão do Chrome.

Um novo conjunto de ferramentas, o Claude Agent SDK, foi disponibilizado aos desenvolvedores. Ele permite a criação de agentes inteligentes personalizados com base nas mesmas tecnologias que sustentam o Claude Code. O SDK implementa gerenciamento complexo de memória, gerenciamento de direitos e coordenação de subtarefas entre agentes, abrindo caminho para a construção de soluções avançadas para qualquer tarefa.

Além de ser a versão mais eficiente do Claude Sonnet 4.5, também é o modelo de IA mais bem-comportado da empresa: o número de padrões de comportamento perigosos e indesejados, como cooperar com o usuário, tentar contornar restrições ou executar solicitações maliciosas, foi reduzido. Para proteger os usuários, a Anthropic utiliza filtros multinível (Nível de Segurança de IA 3), especialmente para tópicos relacionados a armas químicas, biológicas, nucleares e outras. Os filtros também se tornaram mais precisos: o número de falsos positivos foi reduzido em 10 vezes em comparação com as versões anteriores.

O Claude Sonnet 4.5 já está disponível para todos os usuários por meio da versão web do chatbot e em aplicativos móveis. O novo modelo de IA também está disponível via API pelo mesmo preço do modelo anterior (a partir de US$ 3 por milhão de tokens). Os novos recursos do Claude Code e do Agent SDK estão disponíveis para todos os desenvolvedores e clientes corporativos.

admin

Postagens recentes

A Huawei apresentará sistemas de supercomputação no MWC 2026 em Barcelona.

As fronteiras entre os gêneros tecnológicos estão se tornando cada vez mais tênues, portanto, a…

54 minutos atrás

Análise de Yakuza Kiwami 3 e Dark Ties – O Que Você Fez?! / Jogos

Jogado no Xbox Series S Em 2009 (ou 2010, se estivermos falando do lançamento fora…

7 horas atrás

A Hyundai investirá mais de US$ 6 bilhões em data centers com inteligência artificial, robótica, hidrogênio e energia solar.

O Grupo Hyundai Motor e o governo sul-coreano assinaram um acordo para investir aproximadamente ₩9…

7 horas atrás

A Asus revela detalhes da ProArt GeForce RTX 5090, que apresenta um design minimalista da Founders Edition e GPU com overclock de fábrica.

A Asus divulgou as especificações completas da placa de vídeo ProArt GeForce RTX 5090 32GB…

8 horas atrás

A Xiaomi revelou o hipercarro Vision GT para Gran Turismo 7 – ele será apresentado ao vivo no MWC 2026.

A Xiaomi confirmou na plataforma de mídia social chinesa Weibo que revelará seu primeiro hipercarro…

8 horas atrás

Os chineses descobriram uma maneira de produzir eletrônicos resistentes à radiação, tornando-os transparentes à radiação.

Pesquisadores da Universidade de Fudan (China) apresentaram uma abordagem revolucionária para a criação de componentes…

8 horas atrás