Modelo de IA DeepSeek R1 lançado nos aceleradores chineses soberanos da Sophgo

A alta demanda por aceleradores de computação da Nvidia e de outras marcas populares, por si só, limita sua disponibilidade e, no caso dos desenvolvedores chineses de IA, tudo é agravado pelas sanções americanas. Não é de surpreender que, nas circunstâncias atuais, eles tenham preferido recorrer a aceleradores de origem local; para a DeepSeek, os aceleradores da Sophgo foram adequados nesse sentido.

Fonte da imagem: DeepSeek

Pelo menos, seu uso bem-sucedido é relatado pelo South China Morning Post, citando declarações da Sophgo. De acordo com o laboratório chinês CTTL, os aceleradores SC11 FP300 desta empresa demonstraram alto desempenho e operação estável em tarefas relacionadas à formação de conclusões lógicas (inferência) usando o modelo de linguagem de grande porte DeepSeek R1. Essas tarefas exigem menos recursos computacionais em comparação com a etapa de treinamento de modelos de linguagem de grande porte.

O acelerador FP300 foi lançado pela Sophgo no ano passado. Ele é equipado com 256 GB de memória de alta velocidade, proporcionando uma taxa de transferência de até 1,1 TB/s, e é tecnicamente adequado para treinar grandes modelos de linguagem. Ao mesmo tempo, esta solução de hardware é ainda mais adequada para trabalhar com modelos de raciocínio.

Conforme observado anteriormente, a empresa chinesa DeepSeek já teve que adiar o lançamento de seu modelo R2, que estava programado para maio, devido a problemas com o acesso aos recursos computacionais necessários para seu treinamento. Enquanto isso, a empresa chinesa iFlyTek já anunciou uma transição completa para aceleradores de computação da Huawei. As soluções chinesas da série Ascend 910B permitem atingir eficiência computacional no nível de 73% contra os 25% que estavam disponíveis ao usar o Nvidia A800 no final do ano passado. No entanto, a migração para aceleradores chineses ainda causou um atraso de três meses no lançamento de novos modelos de linguagem. A iFlyTek e a Sophgo estão sob várias sanções dos EUA, então elas são forçadas a se aproximar para atingir seus objetivos diante de restrições externas.

admin

Postagens recentes

Uma inteligência artificial desafiou cientistas ao escrever um artigo para uma revista científica do zero, com aprovação para publicação.

Na conferência ICLR 2025, um grupo de cientistas demonstrou a capacidade da IA ​​de gerar,…

25 minutos atrás

Foremay revela SSD espacial resistente à radiação da série InterStellar

A Foremay anunciou sua família de SSDs InterStellar, projetada para uso em satélites comerciais e…

59 minutos atrás

Jackpot: A segunda temporada de Fallout se tornou um dos maiores sucessos da Amazon.

O Hollywood Reporter, citando a Amazon MGM Studios, compartilhou informações sobre o sucesso da segunda…

1 hora atrás

A Samsung pretende dominar a tecnologia de processo de 1 nanômetro e introduzir folhas em formato de garfo em transistores até 2030.

A escassez de capacidade da TSMC está abrindo novas oportunidades para a rival Samsung Electronics…

2 horas atrás

A Microsoft forçou IAs a testarem umas às outras em pesquisa do Copilot.

A Microsoft introduziu a capacidade de usar vários modelos de IA em um único fluxo…

2 horas atrás

A Meta começou a testar uma assinatura do Instagram Plus com Stories expandidos e mais recursos.

A Meta começou a testar uma assinatura paga para recursos adicionais do Instagram em alguns…

2 horas atrás