DeepSeek atualiza modelo Open Source V3 com habilidades de programação aprimoradas

A DeepSeek lançou uma atualização para seu modelo de IA V3, chamado V3-0324, que supostamente fornece melhores recursos de programação ao mesmo tempo em que define novos padrões de precisão e eficiência, relata a Bloomberg. A atualização foi publicada na plataforma Hugging Face sem um anúncio oficial.

Fonte da imagem: Solen Feyissa/unsplash.com

O modelo de IA de código aberto DeepSeek V3 foi introduzido no final do ano passado. O modelo é construído na arquitetura Mixture of Experts (MoE) com um total de 671 bilhões de parâmetros e 37 bilhões de parâmetros ativados por token.

A empresa disse na época que custou US$ 5,5 milhões para treinar o DeepSeek V3, o que é significativamente menos do que outras empresas de tecnologia como a OpenAI gastam no treinamento de modelos semelhantes. Algumas semanas depois, a DeepSeek lançou um modelo de raciocínio de código aberto, o R1, que, apesar de um orçamento de desenvolvimento modesto, superou o modelo de IA o1 da OpenAI em vários benchmarks em diversas métricas importantes.

Em janeiro de 2025, o DeepSeek ultrapassou o chatbot de IA ChatGPT e se tornou o aplicativo gratuito mais popular na Apple App Store nos EUA. As conquistas da startup chinesa levantaram dúvidas entre os investidores sobre a justificativa para os enormes gastos das empresas americanas em tecnologia de IA, levando a um colapso no mercado de IA que fez com que suas ações caíssem significativamente. Em particular, a líder de mercado Nvidia perdeu US$ 593 bilhões em valor de mercado em um dia, o que foi a maior queda em um dia na história do mercado de ações.

avalanche

Postagens recentes

A aposta da SoftBank em IA está a afundar ainda mais num buraco de dívidas multimilionárias.

Para concluir a rodada de financiamento anterior da OpenAI, a corporação japonesa SoftBank vendeu às…

27 minutos atrás

A SK Hynix vai adquirir da ASML equipamentos de última geração para produção de chips EUV no valor de quase US$ 8 bilhões.

A empresa holandesa ASML raramente discute abertamente seus relacionamentos e acordos com clientes, mas ocasionalmente…

27 minutos atrás

Um ex-funcionário da Rockstar revelou um recurso técnico revolucionário do GTA VI.

Os detalhes técnicos do thriller de mundo aberto e crime da Rockstar Games, GTA VI,…

40 minutos atrás

A Electronic Arts encerrará em breve o modo multijogador de Battlefield Hardline no PS4 e no Xbox One – a versão para PC permanece segura.

Desenvolvido pelo extinto estúdio Visceral Games, o jogo de tiro Battlefield Hardline desaparecerá das lojas…

1 hora atrás

A Yandex vai implantar robôs de entrega em mais cinco cidades russas.

Os robôs da Yandex expandiram sua presença para cinco novas cidades: Khimki, Lyubertsy, Odintsovo, Dolgoprudny…

1 hora atrás

A Tesla já começou a procurar em Taiwan especialistas para produzir chips para sua megafábrica americana de 2nm, a Terafab.

A experiência anterior da Tesla com integração vertical de negócios a ajudou a alcançar uma…

2 horas atrás