À medida que a IA generativa se torna mais popular, a escassez de recursos computacionais também aumenta, criando barreiras significativas para os recém-chegados que desejam entrar em negócios nesta área. Como relata o DigiTimes, os serviços de jogos em nuvem, que possuem um grande número de aceleradores de alto desempenho que podem ser usados para projetos de IA, podem ajudar a resolver o problema.
Por exemplo, o provedor de serviços taiwanês Ubitus possui dezenas de milhares de aceleradores, um número que poucas empresas do setor de TI possuem. De acordo com alguns especialistas, os serviços de jogos em nuvem poderão em breve participar de desenvolvimentos relacionados à IA generativa. De acordo com a classificação da SemiAnalysis, as empresas de TI foram divididas em dois grupos: “ricas” em aceleradoras e “pobres”. O primeiro grupo inclui algumas empresas que possuem mais de 20 mil aceleradores A100 ou H100, por exemplo, Google, Anthropic, X, Meta✴, Inflection e OpenAI, e algumas possuem mais de 100 mil aceleradores.
Imagem: NVIDIA
Na primeira quinzena de novembro de 2023, a Ubitus anunciou uma parceria com a National Taiwan University na área de computação de IA – a empresa é talvez a maior operadora de aceleradores da ilha, originalmente destinados a projetos de jogos em nuvem. Na verdade, recursos excessivos já estão a ser dedicados ao trabalho com grandes modelos linguísticos (LLMs), em particular em chinês. Segundo alguns relatos, gigantes de TI como o Google já convidaram a empresa a considerar a participação no desenvolvimento da indústria de IA em Taiwan.
Ao mesmo tempo, especialistas taiwaneses enfatizam que, para jogos em nuvem, eles geralmente usam GPUs emblemáticas da série RTX – elas são muito menos produtivas em tarefas de IA, mas também são uma ordem de magnitude mais baratas que aceleradores especializados. No entanto, a Ubitus afirma que utiliza principalmente aceleradores deste tipo, incluindo o H100, A100 e L40S na versão PCIe.
O TikTok, uma criação da chinesa ByteDance, anunciou um investimento de € 1 bilhão em…
A Alibaba e a China Telecom pretendem inaugurar um centro de dados no sul da…
A Intel lançou a versão mais recente do driver Arc Graphics, a 32.0.101.8629 WHQL. O…
O YouTube Premium costuma ser escolhido para se livrar de anúncios irritantes, mas a assinatura…
A fabricante de câmeras de ação GoPro anunciou planos para demitir quase um quarto de…
Os protestos contra a construção de data centers nos Estados Unidos estão se tornando mais…