Os jogos acabaram: os serviços de jogos em nuvem ajudarão a sobreviver à escassez de aceleradores para IA

À medida que a IA generativa se torna mais popular, a escassez de recursos computacionais também aumenta, criando barreiras significativas para os recém-chegados que desejam entrar em negócios nesta área. Como relata o DigiTimes, os serviços de jogos em nuvem, que possuem um grande número de aceleradores de alto desempenho que podem ser usados ​​para projetos de IA, podem ajudar a resolver o problema.

Por exemplo, o provedor de serviços taiwanês Ubitus possui dezenas de milhares de aceleradores, um número que poucas empresas do setor de TI possuem. De acordo com alguns especialistas, os serviços de jogos em nuvem poderão em breve participar de desenvolvimentos relacionados à IA generativa. De acordo com a classificação da SemiAnalysis, as empresas de TI foram divididas em dois grupos: “ricas” em aceleradoras e “pobres”. O primeiro grupo inclui algumas empresas que possuem mais de 20 mil aceleradores A100 ou H100, por exemplo, Google, Anthropic, X, Meta✴, Inflection e OpenAI, e algumas possuem mais de 100 mil aceleradores.

Imagem: NVIDIA

Na primeira quinzena de novembro de 2023, a Ubitus anunciou uma parceria com a National Taiwan University na área de computação de IA – a empresa é talvez a maior operadora de aceleradores da ilha, originalmente destinados a projetos de jogos em nuvem. Na verdade, recursos excessivos já estão a ser dedicados ao trabalho com grandes modelos linguísticos (LLMs), em particular em chinês. Segundo alguns relatos, gigantes de TI como o Google já convidaram a empresa a considerar a participação no desenvolvimento da indústria de IA em Taiwan.

Ao mesmo tempo, especialistas taiwaneses enfatizam que, para jogos em nuvem, eles geralmente usam GPUs emblemáticas da série RTX – elas são muito menos produtivas em tarefas de IA, mas também são uma ordem de magnitude mais baratas que aceleradores especializados. No entanto, a Ubitus afirma que utiliza principalmente aceleradores deste tipo, incluindo o H100, A100 e L40S na versão PCIe.

avalanche

Postagens recentes

Conforme as cartas forem lançadas, conforme a rede ditar: a AWS está implementando uma arquitetura de rede RNG quase aleatória em seus data centers.

A AWS publicou uma descrição técnica da arquitetura de rede de data center que implementará…

1 dia atrás

O chefe da NASA afirma que os voos do foguete New Glenn não serão retomados antes de 2028, eliminando a Blue Origin da corrida lunar.

Durante um teste estático de ignição em 29 de maio de 2026, o foguete New…

1 dia atrás

Foi anunciado o sucessor espiritual de Zeus: Master of Olympus – o jogo de estratégia de construção de cidades Theos: Cities of Myth, onde história e mito se entrelaçam.

A editora Dotemu (Ninja Gaiden: Ragebound, Marvel Cosmic Invasion) e a Triskell Interactive, desenvolvedora de…

1 dia atrás

Plataforma de referência de IA Qualcomm Dragonwing IQ10 para robótica é apresentada.

Cristiano Amon, CEO da Qualcomm, apresentou a plataforma robótica Dragonwing IQ10 atualizada na Computex 2026.…

1 dia atrás

O RPG infernal baseado em turnos, Entropy, do criador de Dread Delusion, recebeu uma demo e uma data de lançamento no Acesso Antecipado do Steam.

A editora DreadXP e o estúdio britânico Lovely Hellplace (Dread Delusion) anunciaram a data de…

1 dia atrás