Anthropic lança a rede neural mais inteligente Claude 3.7 Sonnet – é grátis e supera DeepSeek R1 e OpenAI o3

A Anthropic, uma das principais concorrentes da OpenAI, lançou o Claude 3.7 Sonnet, seu primeiro “modelo de raciocínio híbrido”. A empresa afirma que pode resolver problemas mais complexos do que seus antecessores e superá-los em áreas como matemática e codificação.

Fonte da imagem: Antrópico

A OpenAI e outras empresas oferecem modelos com capacidades de raciocínio separadas dos modelos regulares de IA generativa. A Anthropic decidiu combiná-los em um sistema para obter uma solução universal. Como resultado, o usuário pode escolher quando os modelos Claude 3.7 Sonnet devem responder normalmente e quando pensar mais sobre a resposta. No modo padrão, o Claude 3.7 Sonnet é simplesmente uma versão melhorada do anterior Claude 3.5 Sonnet com dados mais recentes (seu banco de dados inclui informações até novembro de 2024). No modo Pensamento Avançado, a IA pensa por si mesma antes de responder, o que melhora o desempenho ao resolver problemas de matemática, física, seguir instruções complexas, codificação e muitos outros.

A chefe de pesquisa de produtos da Anthropic, Dianne Penn, disse ao The Verge que a empresa queria tornar o modelo mais fácil de usar. “Nós pensamos fundamentalmente que o raciocínio é mais uma característica da IA ​​do que algo completamente separado”, ela diz, observando que Claude não demora muito para responder à pergunta “que horas são?” em comparação a uma consulta mais complexa como “planeje uma viagem de duas semanas para a Itália, considerando o clima no final de março”.

Além do novo modelo, a Anthropic também lançou uma “prévia de pesquisa limitada” de seu agente de programação de IA chamado Claude Code. Embora a Anthropic já ofereça ferramentas de codificação de IA como o Cursor, a empresa anuncia seu novo Claude Code como “um colaborador ativo que pode pesquisar e ler código, editar arquivos, escrever e executar testes, enviar e enviar código para o GitHub e usar ferramentas de linha de comando”.

O Anthropic também permite que os desenvolvedores controlem como o modelo “pensa” e até mesmo definam um limite de tempo para pensar. “Às vezes, você só precisa dizer a um desenvolvedor que a resposta a essa pergunta não deve levar mais de 200 milissegundos”, observa Michael Gerstenhaber, vice-presidente de produtos da Anthropic.

Penn diz que o Claude 3.7 da Sonnet é notavelmente melhor que seus concorrentes no manuseio de “codificação de agentes”, tarefas financeiras e jurídicas. Uma porta-voz da Anthropic disse que os funcionários da empresa estão usando ativamente o novo modelo para criar designs de sites, jogos interativos e até mesmo gastar até 45 minutos codificando, “criando casos de teste e editando casos de teste iterativamente”.

Penn também revelou que a empresa está testando seus modelos para ver se eles conseguem rodar o antigo videogame Pokémon simulando o pressionamento de botões do controle por meio de uma API. Claude 3.5 Sonnet não conseguiu escapar de Pallet Town no início do jogo, enquanto a versão 3.7 conseguiu derrotar vários chefes.

O lançamento do Claude 3.7 Sonnet mostra que a indústria de IA está caminhando para oferecer um modelo único que pode responder rapidamente e pensar em problemas complexos, em vez de vários modelos separados. O CEO da OpenAI, Sam Altman, falou recentemente sobre algo semelhante.

avalanche

Postagens recentes

A AMD lançou um driver com suporte para Forza Horizon 6 e 007 First Light.

A AMD lançou a versão mais recente do driver gráfico Radeon Software Adrenalin 26.5.2 WHQL.…

48 minutos atrás

“Todos estão infelizes, exceto a gerência”: o moral na Meta atinge o nível mais baixo da história, apesar dos lucros recordes.

O moral na Meta✴ atingiu um nível historicamente baixo às vésperas da demissão de quase…

2 horas atrás

Seguindo o caminho já trilhado: a crítica deu seu veredito sobre Forza Horizon 6.

Antes de seu lançamento iminente, o ambicioso jogo de corrida arcade de mundo aberto Forza…

3 horas atrás

As placas gráficas Radeon RX 6000 e RX 7000 receberão suporte para o escalonamento AMD FSR 4.1.

A AMD atendeu aos pedidos insistentes dos jogadores para fornecer suporte à tecnologia de escalonamento…

3 horas atrás

Amazon cancela MMO de Senhor dos Anéis, mas já tem um novo jogo “emocionante”.

A pedido do Eurogamer, Jeff Grattis, chefe da divisão de jogos da Amazon, comentou sobre…

3 horas atrás

A MSI lançará uma GeForce RTX 5080 em edição muito limitada, inspirada em “The Mandalorian e Grogu”.

A MSI apresentou a placa de vídeo GeForce RTX 5080 16GB OC em uma edição…

4 horas atrás