Declaração de depseek sobre o baixo custo do ensino da IA ​​e o uso de apenas 2048 GPU NVIDIA é refutado por analistas

A startup chinesa Deepseek atraiu atenção geral, anunciando a criação de um modelo competitivo de inteligência artificial (AI) com custos mínimos. A empresa alegou que apenas US $ 6 milhões foram gastos em treinamento de chatbot e 2048 processadores gráficos (GPU) foram utilizados. No entanto, o relatório da semiânica mostrou que pelo menos US $ 1,6 bilhão foram investidos e 50.000 GPU Nvidia foram utilizados.

Fonte da imagem: nvidia, tomshardware.com

Lembre-se de que a Deepseek apareceu como uma subsidiária do High-Flyer Chinese Fund, que desde 2023 alocou uma startup em uma direção separada, focada nas tecnologias de IA. Diferentemente da maioria das startups que alugam capacidades de fornecedores de nuvem, a empresa possui seus próprios data centers, o que fornece controle total em termos de otimização de modelos II e permite que você apresente rapidamente inovações. Além disso, como a Deepseek continua sendo uma organização totalmente auto -financeira, quaisquer soluções são tornadas mais rápidas e mais flexíveis, tornando a empresa mais eficaz em comparação com os participantes do mercado tradicional.

A política pessoal merece atenção especial. A empresa contrata especialistas exclusivamente da China, com foco nas habilidades e na capacidade de resolver problemas complexos, e não em diplomas formais. Ao mesmo tempo, os salários de alguns pesquisadores da Deepseek excedem US $ 1,3 milhão por ano, o que permite atrair talentos das principais universidades do país.

Embora o DeepSeek se posicione como um inovador capaz de desafiar os líderes da indústria, os analistas de semiânica enfatizam que o sucesso da empresa é baseado em investimentos em vários bilhões de dólares, avanços técnicos e uma equipe forte e as declarações sobre o “orçamento revolucionário” gasto na IA O modelo pode ser exagerado.

avalanche

Postagens recentes

SUBSTITUÍDO – Amor e Ódio em Phenix City. Crítica

Intel Core i5-8400 2.8 GHz / AMD Ryzen 5 2600 3.4 GHz, 16 GB de…

2 horas atrás

SUBSTITUÍDO — Amor e Ódio em Phenix City. Análise / Jogos

Intel Core i5-8400 2.8 GHz / AMD Ryzen 5 2600 3.4 GHz, 16 GB de…

2 horas atrás

A ASRock apresenta o poderoso sistema de refrigeração líquida WS 360D para processadores AMD Threadripper e Intel Xeon W.

A ASRock lançou no Japão os sistemas de refrigeração WS TR 360D, que não necessitam…

3 horas atrás

Um britânico construiu uma motocicleta movida a vapor que se tornou a segunda moto mais rápida do mundo.

No evento Festival of Power, na vila britânica de Podington, Bedfordshire, na pista de aceleração…

5 horas atrás

Astrônomos observaram, pela primeira vez, uma explosão de supernova inexplicável, o que exige uma nova teoria.

Astrônomos podem ter descoberto um novo tipo de explosão cósmica, apelidada de "superkilonova". Este evento,…

8 horas atrás

Um entusiasta de hardware modificou a VBIOS de uma placa gráfica S3 antiga para tornar o preto verdadeiramente preto.

Um criador de conteúdo do canal do YouTube Bits und Bolts descobriu uma falha em…

8 horas atrás