Os desenvolvedores de modelos de linguagem chinesa DeepSeek divulgaram esta semana alguns dados interessantes sobre a lucratividade estimada de seus modelos de linguagem V3 e R1 em um período de 24 horas. Segundo os autores dos cálculos, esses modelos permitem que você ganhe seis vezes e meia mais do que gasta alugando poder de computação.

Fonte da imagem: Unsplash, Solen Feyissa

De fato, com base em informações publicadas por representantes da DeepSeek em suas páginas do GitHub, a empresa gastou US$ 87.072 no aluguel de aceleradores de computação em um dia selecionado aleatoriamente, enquanto a potencial monetização de seus modelos V3 e R1 poderia ter rendido US$ 562.027 no mesmo período. Comparando esses valores, os autores dos cálculos obtiveram uma lucratividade condicional de 545%.

No entanto, é importante entender que os cálculos que usam esse método implicam uma série de suposições. Primeiramente, a renda potencial foi calculada sem descontos, e a política de preços para o modelo R1 mais caro foi tomada como base. Em segundo lugar, nem todos os serviços DeepSeek disponíveis publicamente são monetizados e pagos pelos usuários. Se o acesso a eles fosse cobrado a um preço comercial, o número de usuários poderia diminuir, o que reduziria a receita recebida.

Por fim, os cálculos neste exemplo não levam em consideração os custos da DeepSeek com eletricidade, armazenamento de dados ou pesquisa e desenvolvimento em si. De qualquer forma, essa tentativa de demonstrar suas perspectivas e viabilidade a potenciais investidores deve inspirar representantes de outras startups a publicar cálculos semelhantes. Até agora, o campo da inteligência artificial exige grandes investimentos dos investidores, e o retorno financeiro é muito efêmero e distante no tempo.

A DeepSeek explica que a empresa alcançou a alta eficiência de seus serviços por meio de uma série de otimizações. Primeiro, o tráfego é distribuído da forma mais uniforme possível entre vários data centers. Em segundo lugar, o tempo de processamento da solicitação do usuário é regulado de forma flexível. Em terceiro lugar, os dados processados ​​são classificados em lotes para carregar a infraestrutura de forma otimizada.

avalanche

Postagens recentes

O Internet Archive está assumindo a tarefa de curar a internet da “deterioração de links”.

O Internet Archive Project é uma organização sem fins lucrativos que, como o próprio nome…

2 horas atrás

“Então Concord não te ensinou nada?” A Sony anunciou o jogo de ação cooperativo Horizon Hunters Gathering, e os fãs estão confusos.

A editora Sony Interactive Entertainment e a desenvolvedora Guerrilla Games revelaram por completo o spin-off…

2 horas atrás

O Bitcoin despencou para menos de US$ 67.000, com os investidores assustados e vendendo suas moedas.

O Bitcoin caiu para US$ 66.896,43 hoje, com o sentimento dos investidores se inclinando cada…

3 horas atrás

A Starlink se tornou uma mina de ouro para a SpaceX e está prestes a se expandir, passando de dispositivos de IA para satélites ao controle orbital.

Antecipando seu IPO previsto para este ano, a SpaceX planeja expandir sua divisão Starlink e…

3 horas atrás

A Intel desenvolveu uma nova geração de capacitores integrados — a chave para o fornecimento estável de energia para os chips de IA do futuro.

Ao discutirmos novas tecnologias de processo, constantemente mencionamos os transistores como componentes-chave que determinam o…

3 horas atrás

The Elder Scrolls IV: Oblivion Remastered chegará ao Nintendo Switch 2, mas os fãs não estão exatamente entusiasmados.

Juntamente com as datas de lançamento das versões para Nintendo Switch 2 de Fallout 4…

4 horas atrás