Aplicativos e serviços de IA generativa estão se tornando cada vez mais caros, à medida que os desenvolvedores enfrentam custos crescentes de infraestrutura. Uma nova geração de GPUs e aceleradores de IA promete aliviar a crescente demanda por inferência (implantação de IA), mas é improvável que os usuários finais percebam a economia, segundo reportagem do The Register.

Fonte da imagem: BoliviaInteligente / unsplash.com

Vários anos se passaram desde o início do boom da IA, desenvolvedores gastaram bilhões de dólares criando novos modelos e aplicações práticas de IA já estão surgindo — os exemplos mais proeminentes são Claude Code, Codex, GitHub Copilot e outros serviços de programação. Mais surgirão em breve. O problema é que data centers projetados para treinamento de modelos não são projetados para inferência — são tarefas completamente diferentes. Desenvolvedores de aceleradores estão agora desenvolvendo ativamente novos hardwares; a Nvidia adquiriu a startup Groq por US$ 20 bilhões, e AMD, AWS, Intel e Google estão desenvolvendo suas próprias versões de aceleradores — todos tentando reduzir o preço do token.

Tokens mais baratos otimizam a economia, e os investidores esperam que a OpenAI e a Anthropic eventualmente se recuperem de suas perdas. O hardware de próxima geração ainda não está pronto para chegar ao mercado: os fabricantes falam sobre o segundo semestre deste ano, mas, na realidade, provavelmente teremos que esperar até o início ou meados de 2020. Consequentemente, os desenvolvedores de IA já começaram a aumentar os preços: o preço do OpenAI GPT-5.5 dobrou em comparação com seu antecessor, e até mesmo o novo Google Gemini 3.5 Flash custa de 3 a 6 vezes mais que o Gemini 3.1 Flash-Lite e o Gemini 3 Flash Preview. O aumento de preço é agravado pelo fato de que os agentes de IA baseados nesses modelos consomem mais tokens do que os chatbots.

Como resultado, os desenvolvedores de IA estão abandonando o modelo de preços fixos: não faz sentido cobrar US$ 200 por mês se um cliente consome US$ 5.000 em recursos. A Microsoft já começou a mudar o modelo de preços do GitHub Copilot, passando de preços por usuário para preços baseados no consumo, e a Anthropic está seguindo na mesma direção.Como resultado, os empregadores que esperavam que a IAAqueles que substituem seus funcionários por quase nada terão uma surpresa desagradável: em vez de US$ 40 por hora e benefícios, terão que pagar US$ 30 por hora por tokens.

Enquanto isso, uma onda de demissões continua a varrer o setor de tecnologia. A Meta✴ demitirá 10% de sua equipe, fechará 6.000 vagas e transferirá 7.000 pessoas para novas posições; a Cloudflare demitirá cerca de 1.100 trabalhadores; e até mesmo o governo da Nova Zelândia anunciou planos para demitir cerca de 9.000 funcionários públicos devido à IA. A vantagem até agora está com as grandes empresas, que podem arcar com perdas em algumas áreas em detrimento de outras. A OpenAI e a Anthropic ainda não estão em perigo: alguém precisa desenvolver modelos de IA, e empresas como Microsoft, Meta✴ e AWS ainda não conseguiram. Apenas o Google obteve sucesso.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Red Dead Redemption 2 é um dos três jogos mais vendidos de todos os tempos.

Em seu relatório do ano fiscal de 2026, a holding americana Take-Two Interactive Software não…

36 minutos atrás

O MacBook Pro com tela OLED está chegando – a Samsung está quase pronta para a produção em massa de displays.

Conforme previsto pelo renomado analista Ming-Chi Kuo, a Apple poderá começar a produzir MacBook Pros…

36 minutos atrás

A Microsoft começou a remover a porta de acessórios dos controles do Xbox.

Os novos controles para os consoles Xbox Series X e Series S da Microsoft sofreram…

1 hora atrás

A crise de memória impulsiona as vendas de PCs, com a receita da Lenovo disparando 27%.

A receita da Lenovo, a maior fabricante de PCs do mundo, cresceu 27% no último…

1 hora atrás

Cientistas transformaram um smartphone instável em uma câmera capaz de enxergar através de cantos.

Pesquisadores do Instituto de Tecnologia de Massachusetts (MIT) demonstraram que um LiDAR comum de consumo…

1 hora atrás