Os jogos acabaram: os serviços de jogos em nuvem ajudarão a sobreviver à escassez de aceleradores para IA

À medida que a IA generativa se torna mais popular, a escassez de recursos computacionais também aumenta, criando barreiras significativas para os recém-chegados que desejam entrar em negócios nesta área. Como relata o DigiTimes, os serviços de jogos em nuvem, que possuem um grande número de aceleradores de alto desempenho que podem ser usados ​​para projetos de IA, podem ajudar a resolver o problema.

Por exemplo, o provedor de serviços taiwanês Ubitus possui dezenas de milhares de aceleradores, um número que poucas empresas do setor de TI possuem. De acordo com alguns especialistas, os serviços de jogos em nuvem poderão em breve participar de desenvolvimentos relacionados à IA generativa. De acordo com a classificação da SemiAnalysis, as empresas de TI foram divididas em dois grupos: “ricas” em aceleradoras e “pobres”. O primeiro grupo inclui algumas empresas que possuem mais de 20 mil aceleradores A100 ou H100, por exemplo, Google, Anthropic, X, Meta✴, Inflection e OpenAI, e algumas possuem mais de 100 mil aceleradores.

Imagem: NVIDIA

Na primeira quinzena de novembro de 2023, a Ubitus anunciou uma parceria com a National Taiwan University na área de computação de IA – a empresa é talvez a maior operadora de aceleradores da ilha, originalmente destinados a projetos de jogos em nuvem. Na verdade, recursos excessivos já estão a ser dedicados ao trabalho com grandes modelos linguísticos (LLMs), em particular em chinês. Segundo alguns relatos, gigantes de TI como o Google já convidaram a empresa a considerar a participação no desenvolvimento da indústria de IA em Taiwan.

Ao mesmo tempo, especialistas taiwaneses enfatizam que, para jogos em nuvem, eles geralmente usam GPUs emblemáticas da série RTX – elas são muito menos produtivas em tarefas de IA, mas também são uma ordem de magnitude mais baratas que aceleradores especializados. No entanto, a Ubitus afirma que utiliza principalmente aceleradores deste tipo, incluindo o H100, A100 e L40S na versão PCIe.

avalanche

Postagens recentes

O TikTok está investindo mais € 1 bilhão em um centro de dados na Finlândia para armazenar e processar dados de usuários europeus.

O TikTok, uma criação da chinesa ByteDance, anunciou um investimento de € 1 bilhão em…

1 hora atrás

A Intel lançou um driver com suporte para as placas gráficas profissionais Arc Pro B70 e Arc Pro B65.

A Intel lançou a versão mais recente do driver Arc Graphics, a 32.0.101.8629 WHQL. O…

2 horas atrás

O YouTube agora pode acelerar e desacelerar vídeos automaticamente, mas apenas para usuários pagos.

O YouTube Premium costuma ser escolhido para se livrar de anúncios irritantes, mas a assinatura…

2 horas atrás

A GoPro vai demitir 23% de seus funcionários para voltar a ser lucrativa.

A fabricante de câmeras de ação GoPro anunciou planos para demitir quase um quarto de…

2 horas atrás

“Não aos centros de dados”: Tiros são disparados contra a casa de um funcionário de Indianápolis que aprovou a construção de um centro de dados.

Os protestos contra a construção de data centers nos Estados Unidos estão se tornando mais…

2 horas atrás