A Anthropic lançou o Claude Sonnet 5, um modelo de IA de nível intermediário que se aproxima do nível do Opus 4.8 e foi desenvolvido especificamente para trabalhar com agentes.

Uma das capacidades mais importantes para os modelos de IA modernos é a sua habilidade de gerenciar aplicações de agentes, e a Anthropic tornou isso uma prioridade máxima no desenvolvimento do novo Claude Sonnet 5.

Fonte da imagem: anthropic.com

“Ele consegue planejar, usar ferramentas como navegadores e terminais, e operar de forma autônoma em um nível que, há poucos meses, só era possível em modelos maiores e mais caros”, explicou a empresa. O conceito do Sonnet 5 se baseia no fato de que gerenciar agentes de IA é um novo requisito básico para modelos em qualquer segmento. O fator decisivo não é qual deles executa essa tarefa melhor, mas sim a maneira mais econômica e confiável com que o faz, sem intervenção humana.

O Sonnet 5, modelo intermediário da Claude, promete desempenho similar ao do Opus 4.8, mas a um preço significativamente menor. O novo modelo é o padrão para todos os usuários da plataforma Claude, tanto gratuitos quanto assinantes, a partir de hoje. O Sonnet 5 custa US$ 2 por milhão de tokens de entrada e US$ 10 por milhão de tokens de saída para acesso à API até 31 de agosto; após essa data, os preços subirão para US$ 3 e US$ 15, respectivamente. O novo modelo representa melhorias significativas em relação ao Sonnet 4.6, lançado em fevereiro. Em um teste de programação, o Sonnet 5 obteve 63,2%, comparado aos 69,2% do Opus 4.8 e aos 58,1% do Sonnet 4.6. Em um teste de processamento de dados, o Sonnet 5 superou até mesmo o Opus 4.8, conhecido por sua capacidade de resolver problemas complexos, tomar decisões complexas e conduzir pesquisas aprofundadas.

“O Opus 4.8 continua sendo o modelo preferido para maior precisão nessas tarefas, mas o Sonnet 5 oferece aos desenvolvedores opções de menor custo e maior qualidade do que as disponíveis anteriormente. Com o Sonnet 5 e o Opus 4.8, os usuários podem escolher o nível de complexidade para encontrar o equilíbrio ideal entre custo e desempenho”, explicou o desenvolvedor. O Sonnet 5 também apresenta níveis reduzidos de “comportamento indesejado”, o que significa que é menos propenso a abusos e mais seguro em contextos de agentes, rejeitando solicitações maliciosas e evitando ataques de injeção de requisições. Comparado ao Sonnet 4.6, ele exibe menos alucinações e comportamento subserviente.

É claro que o modelo de IA de gama média do Sonnet 5 ainda fica aquém do Opus 4.8 e da versão prévia do Claude Mythos. “As avaliações também mostram que ele tem uma capacidade significativamente menor de executar tarefas perigosas de segurança cibernética do que nossos modelos Opus atuais”, alertou a Anthropic.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A Meta começará a cobrar por um recurso de óculos inteligentes que funciona sem seus servidores.

A Meta✴ anunciou discretamente que o recurso Foco na Conversa, integrado aos seus óculos inteligentes,…

18 minutos atrás

A Tesla contratou um veterano da Intel para chefiar sua gigantesca fábrica de chips em Terafab.

O fundador e CEO da SpaceX, Elon Musk, não escondeu seu desejo de colaborar com…

18 minutos atrás

Agora é possível definir a Alice AI como assistente de voz padrão no Android.

Agora é possível definir a Alice AI como assistente padrão em dispositivos Android e invocá-la…

31 minutos atrás

Trump lucrou US$ 1,2 bilhão com projetos de criptomoedas, enquanto seus investidores perderam dinheiro.

O presidente dos EUA, Donald Trump, lucrou quase US$ 1,2 bilhão com suas startups de…

43 minutos atrás

Tim Cook se juntou às negociações com a UE para salvar o lançamento de uma Siri com inteligência artificial mais inteligente.

Os legisladores europeus estão a moldar ativamente o quadro regulamentar no qual as empresas de…

43 minutos atrás