Categorias: Mercado de tecnologia e TI. notíciaServidores, clusters, supercomputadores, computadores industriais e multiprocessadores

Problemas com aceleradores da Huawei adiam o lançamento do modelo de IA de ponta DeepSeek R2

A empresa chinesa DeepSeek demonstrou inicialmente um sucesso impressionante no treinamento de seus modelos de linguagem usando recursos computacionais limitados, mas as sanções dos EUA a impediram de avançar em um ritmo constante. Como observa o Financial Times, a empresa teve que adiar o lançamento de um novo modelo de linguagem devido à baixa eficiência dos aceleradores de computação da Huawei que utilizava.

Fonte da imagem: Huawei Technologies

Após o lançamento do modelo de linguagem R1 com grande sucesso em janeiro deste ano, a empresa chinesa recebeu recomendações das autoridades locais para migrar para os aceleradores Huawei Ascend. Como se sabe, muitos desenvolvedores de IA chineses enfrentam tais recomendações e, há algum tempo, são obrigados a apresentar justificativas sólidas para continuar comprando os aceleradores Nvidia.

A DeepSeek encontrou problemas técnicos ao utilizar aceleradores da Huawei para treinar seus modelos de linguagem e, como resultado, optou por reorientá-los para o trabalho de inferência e continuar o treinamento usando aceleradores da Nvidia. O lançamento do modelo de linguagem R2 estava originalmente previsto para maio, mas a estreia teve que ser adiada devido a esses problemas. Esse atraso afetou negativamente a posição competitiva da DeepSeek.

Os representantes da Huawei estavam cientes dos problemas do DeepSeek e, portanto, enviaram uma equipe de especialistas para auxiliar os desenvolvedores. No entanto, não houve progresso no treinamento do modelo R2 nos chips da Huawei. Mesmo a adaptação dos chips desta marca para trabalhar com a formação de conclusões lógicas (inferências) ainda não foi concluída. A gerência do DeepSeek acredita que o progresso atual no desenvolvimento do R2 é insuficiente e, portanto, levará mais tempo para que o modelo seja implementado. No entanto, algumas fontes esperam que o R2 seja lançado em breve.

Os concorrentes não estão dormindo; o próprio Alibaba tentou adotar as principais soluções conceituais do DeepSeek em seu modelo Qwen3, mas tornou seu desenvolvimento mais eficiente. Especialistas esperam que modelos de linguagem bem-sucedidos treinados em chips da Huawei ainda apareçam com o tempo.

admin

Próximo Internet a laser da startup Google atinge 100 Gbps no mar e nas montanhas »

Anterior « O jogo cooperativo de detetive Fatal Train envia os jogadores para resolver um assassinato em um trem que pode ser mal-assombrado

Deixar comentário

Publicado por

admin

7 meses atrás

Postagens recentes

Unidades e mídia CD, DVD, Blu-ray

A empresa japonesa Buffalo anunciou que irá cessar a produção de unidades de Blu-ray.

A popularidade do formato Blu-ray diminuiu e talvez nunca mais retorne aos seus antigos patamares.…

59 minutos atrás

Placas de vídeo

A Nvidia GeForce3 celebra seu 25º aniversário – foi a primeira placa de vídeo com shaders programáveis.

A Nvidia anunciou o 25º aniversário da família de placas gráficas GeForce3, que estreou em…

59 minutos atrás

Mercado de TI

As vendas globais de smartphones sofrerão uma queda de 13 anos devido à escassez de memória, e a recuperação será lenta.

O final de fevereiro marcou o momento em que os principais analistas do setor puderam…

2 horas atrás

Telefones celulares, smartphones, comunicações celulares, comunicadores, PDAs

A Honor tem o prazer de apresentar o smartphone ultrafino Magic V6 e a bateria ultrafina do tamanho de um cartão de baralho na MWC 2026.

Na próxima MWC 2026, que acontecerá em Barcelona no início de março, a Honor apresentará…

2 horas atrás

Inteligência Artificial, Aprendizado de Máquina, Redes Neurais

O êxodo dos fundadores da xAI continua, com Toby Polen se juntando como o sétimo.

Toby Pohlen, cofundador da xAI, anunciou sua saída da empresa, criada para desenvolver tecnologias de…

2 horas atrás

Programas

As ações da PJSC GC BASIS serão incluídas nas bases de cálculo atualizadas do índice da Bolsa de Valores de Moscou.

A Basis Group PJSC (MOEX: BAZA) (anteriormente e doravante denominada "Basis" ou "a Companhia") anuncia…

2 horas atrás

Problemas com aceleradores da Huawei adiam o lançamento do modelo de IA de ponta DeepSeek R2

Conteúdo relacionado

Postagens recentes

A empresa japonesa Buffalo anunciou que irá cessar a produção de unidades de Blu-ray.

A Nvidia GeForce3 celebra seu 25º aniversário – foi a primeira placa de vídeo com shaders programáveis.

As vendas globais de smartphones sofrerão uma queda de 13 anos devido à escassez de memória, e a recuperação será lenta.

A Honor tem o prazer de apresentar o smartphone ultrafino Magic V6 e a bateria ultrafina do tamanho de um cartão de baralho na MWC 2026.

O êxodo dos fundadores da xAI continua, com Toby Polen se juntando como o sétimo.

As ações da PJSC GC BASIS serão incluídas nas bases de cálculo atualizadas do índice da Bolsa de Valores de Moscou.