Aplicativos e serviços de IA generativa estão se tornando cada vez mais caros, à medida que os desenvolvedores enfrentam custos crescentes de infraestrutura. Uma nova geração de GPUs e aceleradores de IA promete aliviar a crescente demanda por inferência (implantação de IA), mas é improvável que os usuários finais percebam a economia, segundo reportagem do The Register.
Fonte da imagem: BoliviaInteligente / unsplash.com
Vários anos se passaram desde o início do boom da IA, desenvolvedores gastaram bilhões de dólares criando novos modelos e aplicações práticas de IA já estão surgindo — os exemplos mais proeminentes são Claude Code, Codex, GitHub Copilot e outros serviços de programação. Mais surgirão em breve. O problema é que data centers projetados para treinamento de modelos não são projetados para inferência — são tarefas completamente diferentes. Desenvolvedores de aceleradores estão agora desenvolvendo ativamente novos hardwares; a Nvidia adquiriu a startup Groq por US$ 20 bilhões, e AMD, AWS, Intel e Google estão desenvolvendo suas próprias versões de aceleradores — todos tentando reduzir o preço do token.
Tokens mais baratos otimizam a economia, e os investidores esperam que a OpenAI e a Anthropic eventualmente se recuperem de suas perdas. O hardware de próxima geração ainda não está pronto para chegar ao mercado: os fabricantes falam sobre o segundo semestre deste ano, mas, na realidade, provavelmente teremos que esperar até o início ou meados de 2020. Consequentemente, os desenvolvedores de IA já começaram a aumentar os preços: o preço do OpenAI GPT-5.5 dobrou em comparação com seu antecessor, e até mesmo o novo Google Gemini 3.5 Flash custa de 3 a 6 vezes mais que o Gemini 3.1 Flash-Lite e o Gemini 3 Flash Preview. O aumento de preço é agravado pelo fato de que os agentes de IA baseados nesses modelos consomem mais tokens do que os chatbots.
Como resultado, os desenvolvedores de IA estão abandonando o modelo de preços fixos: não faz sentido cobrar US$ 200 por mês se um cliente consome US$ 5.000 em recursos. A Microsoft já começou a mudar o modelo de preços do GitHub Copilot, passando de preços por usuário para preços baseados no consumo, e a Anthropic está seguindo na mesma direção.Como resultado, os empregadores que esperavam que a IAAqueles que substituem seus funcionários por quase nada terão uma surpresa desagradável: em vez de US$ 40 por hora e benefícios, terão que pagar US$ 30 por hora por tokens.
Enquanto isso, uma onda de demissões continua a varrer o setor de tecnologia. A Meta✴ demitirá 10% de sua equipe, fechará 6.000 vagas e transferirá 7.000 pessoas para novas posições; a Cloudflare demitirá cerca de 1.100 trabalhadores; e até mesmo o governo da Nova Zelândia anunciou planos para demitir cerca de 9.000 funcionários públicos devido à IA. A vantagem até agora está com as grandes empresas, que podem arcar com perdas em algumas áreas em detrimento de outras. A OpenAI e a Anthropic ainda não estão em perigo: alguém precisa desenvolver modelos de IA, e empresas como Microsoft, Meta✴ e AWS ainda não conseguiram. Apenas o Google obteve sucesso.
Em seu relatório do ano fiscal de 2026, a holding americana Take-Two Interactive Software não…
Conforme previsto pelo renomado analista Ming-Chi Kuo, a Apple poderá começar a produzir MacBook Pros…
Os novos controles para os consoles Xbox Series X e Series S da Microsoft sofreram…
A receita da Lenovo, a maior fabricante de PCs do mundo, cresceu 27% no último…
O Morgan Stanley calculou que um rack de servidor Nvidia VR200 NVL72 de última geração,…
Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) demonstraram que um LiDAR comum de consumo…