Agentes de IA estão impulsionando a demanda por tokens, com empresas investindo milhões e se perguntando se o investimento valerá a pena.

Grandes empresas de tecnologia estão tentando ativamente justificar o rápido aumento dos preços dos sistemas de inteligência artificial, que já afetou até mesmo empresas como Microsoft e Uber.

Fonte da imagem: Igor Omilaev / unsplash.com

A Uber esgotou todo o seu orçamento para IA em questão de meses, conforme relatado recentemente pelo diretor de tecnologia (CTO) Praveen Neppalli Naga. No entanto, o gasto com tokens não está diretamente ligado ao desenvolvimento de recursos úteis para os consumidores, acrescentou o diretor de operações (COO) Andrew Macdonald. A Microsoft começou a cortar o acesso de desenvolvedores à assinatura corporativa de seu assistente de programação, o Anthropic Claude Code, e pretende migrar totalmente seus funcionários para o Copilot até 30 de junho. Essa medida pode parecer uma tentativa de consolidar ferramentas de desenvolvimento, mas há motivos para acreditar que a decisão tem uma base financeira. O Goldman Sachs estima que o uso ativo de agentes de IA poderá aumentar o gasto global com tokens em 24 vezes nos próximos anos.

Empresas e seus executivos na maioria dos setores estão ansiosos para encontrar benefícios tangíveis com a rápida adoção da IA, mas os exemplos da Uber e da Microsoft demonstraram que essa não é uma tarefa fácil. A Microsoft, em particular, começou a migrar o GitHub Copilot de uma taxa fixa para pagamentos diretos com tokens porque o custo do serviço havia aumentado. O principal motivo para a mudança foi a popularidade da IA ​​baseada em agentes, que consome até mil vezes mais recursos do que os chatbots. Em março, o CEO da Nvidia, Jensen Huang, afirmou que se um engenheiro que ganha US$ 500.000 por ano não usar US$ 250.000 em tokens no mesmo período, isso é motivo de preocupação. Isso não é incomum: executivos de empresas agora competem entre si para exibir a escala do uso de IA em suas operações.O Airbnb relatou que 60% dos novos códigos são gerados por IA; no Google, esse número é de 50%; no Uber, 80% dos engenheiros de software usam IA e 60% do código é gerado por IA.A IA gera custos – e não há garantia de que tais despesas sejam justificadas.

Peter Steinberger, criador do OpenClaw e atual funcionário da OpenAI, admitiu recentemente que sua equipe, composta por apenas três pessoas, consumiu o equivalente a US$ 1,3 milhão em tokens em um único mês. Isso confirma claramente a tese de que o custo da IA ​​está crescendo mais rápido do que os salários dos trabalhadores que ela pretende substituir — as demissões em massa que a administração das empresas tenta justificar com a IA parecem cada vez mais injustificadas. Há, no entanto, esperança de que o hardware de próxima geração reduza significativamente o custo de utilização da IA: a Nvidia, por exemplo, está preparando a plataforma Vera Rubin, que promete um aumento de dez vezes no desempenho por watt em comparação com as soluções existentes.

Isso dará às empresas que utilizam aceleradores de próxima geração uma enorme vantagem sobre os concorrentes que usam os atuais aceleradores Blackwell e, principalmente, os obsoletos aceleradores Hopper. Enquanto isso, mais de 50% dos projetos de data center anunciados com hardware Blackwell foram cancelados ou congelados, e há uma crescente incerteza sobre como eles operarão se forem lançados este ano. No final de 2025, Google, Oracle e Microsoft prometeram usar esse hardware por seis anos antes de atualizá-lo — e isso parece inconciliável com o progresso prometido pelos fabricantes de aceleradores.

Por ora, a realidade é que, mesmo com a queda nos preços dos tokens, o crescimento explosivo no número de agentes de IA não pode ser compensado pelo aumento da eficiência do hardware. E não há garantia de que esse hardware será suficiente para atender à demanda por IA. Mesmo que empresas como a Microsoft…Com a Uber ajustando seus planos de implementação de IA, torna-se cada vez mais difícil imaginar como o restante da empresa deveria se comportar. Se a IA for menos utilizada para cortar custos, os desenvolvedores de IA nunca terão os recursos necessários para compensar os enormes custos de infraestrutura.

admin

Compartilhar
Publicado por
admin

Postagens recentes

Corsair Cove, um jogo de estratégia de construção de cidades com temática pirata, ganhou um novo trailer, data de lançamento e demo no Steam.

A editora Hooded Horse e os desenvolvedores do estúdio alemão Limbic Entertainment (Might & Magic:…

24 minutos atrás

O anel inteligente Oura Ring 5 já está disponível por US$ 399. Ele é 40% menor e pode monitorar a pressão arterial.

A Oura anunciou a próxima geração do seu anel inteligente, o Ring 5, focado no…

1 hora atrás

A Chuwi lança o CoreBook Air, um PC Copilot+ com Intel Core Ultra e IA baseada em nuvem.

A Chuwi apresentou o CoreBook Air, um notebook Copilot+ com processador potente, bateria de longa…

1 hora atrás

Os louros do MacBook Neo ainda assombram: Acer revela o primeiro laptop com Snapdragon C a um “preço inicial”

Aparentemente, o preço acessível e a qualidade de design do MacBook Neo da Apple chamaram…

1 hora atrás

A Acer apresentou o console portátil Predator Atlas 8, equipado com a nova GPU Intel Arc G3.

A Intel anunciou oficialmente o Arc G3 e o Arc G3 Extreme, seus primeiros processadores…

2 horas atrás