Espera-se que o modelo de IA mais recente, DeepSeek V4, seja otimizado para aceleradores de computação chineses.

Segundo o Financial Times, esta semana a DeepSeek, empresa chinesa, deverá apresentar seu tão aguardado modelo de IA multimodal V4, otimizado para os aceleradores da Huawei e da Cambricon. Em conjunto, essas tecnologias permitirão que as empresas chinesas alcancem sucesso na implementação de tecnologias de IA sem depender excessivamente de soluções importadas.

Fonte da imagem: DeepSeek

De acordo com a fonte, o anúncio do modelo DeepSeek V4 estará ligado à sessão parlamentar na China, que começa em 4 de março. Este será o maior lançamento da DeepSeek desde janeiro do ano passado, quando o modelo de raciocínio R1 foi apresentado. Na época, alegou-se que a empresa chinesa havia criado um modelo de IA com desempenho comparável às soluções ocidentais a um custo significativamente menor. Posteriormente, foi revelado que a DeepSeek não apenas utilizou dados de modelos americanos para treinar o seu próprio, mas também dependeu de aceleradores da Nvidia, que estão sujeitos a sanções na China para os modelos que a empresa utiliza.

A otimização do DeepSeek V4 para aceleradores da Huawei e da Cambricon deverá impulsionar a demanda por essas soluções de hardware na China e reduzir a dependência de importações. Alega-se que a DeepSeek até mesmo deixou de otimizar deliberadamente seu modelo mais recente para aceleradores da Nvidia. Foi relatado anteriormente que as tentativas iniciais da DeepSeek de treinar o modelo V4 em aceleradores da Huawei não foram particularmente bem-sucedidas. Uma versão resumida do resumo do DeepSeek V4 será divulgada esta semana, mas a versão completa será publicada em cerca de um mês. A empresa americana Anthropic acusou recentemente a DeepSeek de “destilar” seus próprios modelos de IA.

admin

Compartilhar
Publicado por
admin

Postagens recentes

A autoridade reguladora holandesa aprovou o software de direção autônoma da Tesla no país.

A agência reguladora holandesa RDW aprovou o sistema de condução parcialmente automatizada da Tesla, conhecido…

37 minutos atrás

O WhatsApp enfrenta processos judiciais de usuários e críticas de Musk e Durov devido a problemas de criptografia de ponta a ponta.

O WhatsApp, sua proprietária Meta✴ e a consultoria Accenture foram citados como réus em uma…

37 minutos atrás

Os robôs humanoides Unitree estarão em breve disponíveis para compra fora da China no AliExpress.

Assim como acontece com os veículos elétricos, mais cedo ou mais tarde, as empresas chinesas…

1 hora atrás

A Tesla decidiu vender seu último lote de 350 veículos elétricos Model S e Model X para colecionadores.

No início do mês, foi anunciado que a Tesla havia descontinuado a produção dos veículos…

2 horas atrás

O CEO da Amazon autoriza a venda de seus próprios chips para clientes terceirizados.

Esta semana, o CEO da Amazon, Andy Jassy, ​​publicou sua carta anual aos acionistas, destacando…

8 horas atrás