O novo modelo de IA da DeepSeek tornará o trabalho com contexto de longo prazo duas vezes mais barato e rápido.

Os engenheiros da DeepSeek introduziram um novo modelo experimental, V3.2-exp, que oferece custo de inferência 50% menor e acelerações significativas para cenários de longo contexto.

Fonte da imagem: DeepSeek/TechCrunch

“Como um passo intermediário em direção à arquitetura de próxima geração, a V3.2-Exp complementa a V3.1-Terminus com a introdução do DeepSeek Sparse Attention, um mecanismo de atenção esparsa projetado para explorar e validar otimizações para desempenho de treinamento e inferência em cenários de longo contexto”, anunciou a empresa em uma publicação na plataforma Hugging Face, observando em uma publicação nas redes sociais que os preços da API foram reduzidos em mais de 50%.

Usando o DeepSeek Sparse Attention (DSA), que atua como um filtro inteligente, o modelo seleciona os fragmentos de contexto mais importantes, a partir dos quais utiliza um sistema de seleção de tokens de granularidade fina para selecionar tokens específicos para carregamento na janela de atenção limitada do módulo.

O método combina compressão de tokens de granularidade grossa com seleção de granularidade fina, garantindo que o modelo não perca o contexto mais amplo. A DeepSeek afirma que o novo mecanismo difere da tecnologia Native Sparse Attention, introduzida no início deste ano, e pode ser modificado para modelos pré-treinados.

Em benchmarks, o V3.2-Exp apresenta desempenho equivalente ao da versão anterior do modelo de IA. Em testes de raciocínio, codificação e uso de ferramentas, as diferenças foram mínimas — frequentemente dentro de um ou dois pontos —, enquanto os ganhos de desempenho foram significativos, de acordo com o techstartups.com. O modelo apresentou desempenho 2 a 3 vezes mais rápido para inferência de longo contexto, reduziu o consumo de memória em 30 a 40% e dobrou a eficiência do treinamento. Para os desenvolvedores, isso significa tempos de resposta mais rápidos, custos de infraestrutura reduzidos e um caminho de implantação mais tranquilo.

Para operações de longo contexto, as vantagens do sistema são bastante significativas.O TechCrunch observou que serão necessários mais testes para avaliar o modelo de forma mais confiável, mas, como é de código aberto e está disponível gratuitamente na plataforma Hugging Face, os usuários podem avaliar o novo desenvolvimento do DeepSeek por meio de benchmarks.

admin

Postagens recentes

Para jogar o jogo de terror Reanimal, dos criadores de Little Nightmares, juntos, uma cópia do jogo é suficiente para duas pessoas.

A desenvolvedora sueca Tarsier Studios (responsável pela duologia Little Nightmares) anunciou que seu próximo jogo…

3 horas atrás

A Tesla inaugurou a primeira fábrica de processamento de lítio nos EUA, que Musk chamou de “licença para imprimir dinheiro”.

A Tesla divulgou recentemente o primeiro vídeo de sua própria unidade de processamento nos EUA…

4 horas atrás

Alto risco, dilemas morais e humor negro: a Amazon está transformando Fallout Shelter em um reality show onde os participantes terão que viver no Vault.

Os rumores que circulavam no final de 2025 foram confirmados. A Amazon realmente transformará o…

4 horas atrás

No aconchegante simulador Farming Camp, jovens agricultores irão resolver seus relacionamentos e desenvolver suas fazendas.

Os desenvolvedores da Innerfire, com o apoio da Soedesco, anunciaram Farming Camp, um simulador aconchegante…

5 horas atrás