No verão de 2025, o serviço de nuvem da Amazon (AWS) enfrentou dificuldades para lidar com a crescente demanda por IA e com a perda de receita. O Bedrock, um serviço essencial para o desenvolvimento de IA da empresa, sofreu com a escassez de capacidade naquele verão, o que levou alguns clientes a migrarem para concorrentes, incluindo o Google, segundo o Business Insider. Isso resultou em dezenas de milhões de dólares em perda de receita.

Por exemplo, o projeto Fortnite, avaliado em US$ 10 milhões, foi adquirido pelo Google Cloud depois que a AWS não conseguiu alocar as cotas necessárias (limites de tokens ou chamadas de API). De acordo com um documento interno da AWS obtido por jornalistas, a empresa de comércio de petróleo Vitol também migrou projetos da AWS, e alguns clientes importantes, incluindo Atlassian e GovTech Singapore, foram obrigados a esperar por aumentos de cotas naquele verão, resultando em pelo menos US$ 52,6 milhões em “vendas adiadas”. Além disso, atrasos na aprovação de capacidade e a recusa de cargas de trabalho irregulares forçaram Stripe, Robinhood e Vanguard a abandonarem seus planos de migrar cargas de trabalho para o Bedrock.

É importante ressaltar que os problemas da Bedrock podem levar a perdas de receita e problemas para os clientes. Isso explica por que as empresas de nuvem estão correndo para construir o máximo possível de data centers de IA. A alta demanda só é benéfica se puder ser atendida e impedir que os clientes migrem para a concorrência. Ex-funcionários e funcionários atuais da AWS observam que os problemas de capacidade estiveram entre os mais significativos para a empresa em setembro. A AWS já havia enfrentado escassez de capacidade anteriormente, até mesmo para suas próprias necessidades, mas a situação agora se tornou mais crítica.

Fonte da imagem: LARAM/unsplash.com

Enquanto isso, a Amazon afirma que o Bedrock está crescendo rapidamente e a AWS está expandindo sua capacidade para atender à demanda, adicionando 3,8 GW em 12 meses. Isso é mais do que qualquer outro provedor de nuvem consegue oferecer. A AWS dobrou sua capacidade desde 2022 e pretende fazer o mesmo até 2027. A empresa continuará sendo “muito agressiva” na expansão de sua capacidade computacional, com a AWS capaz de monetizar a nova capacidade “quase imediatamente”, e o Bedrock não tem menos potencial de crescimento do que o EC2.

Parte dos problemas do Bedrock pode estar relacionada à preferência da empresa por grandes clientes. Em outubro, foi declarado que a maioria das cargas de trabalho do Bedrock são executadas usando seus chips de IA Trainium “desenvolvidos internamente”, mas a maioria das cargas de trabalho é gerenciada por alguns clientes muito grandes, que aparentemente estão dispostos a investir no desenvolvimento de ferramentas em uma plataforma menos popular. Espera-se também que empresas de médio porte comecem a usar a próxima geração do Trainium nos próximos meses. No entanto, este último ainda apresenta dificuldades para competir com os chips da NVIDIA.

Contudo, não foi apenas a falta de capacidade que prejudicou o Bedrock. Figma, Intercom e Wealthsimple, por exemplo, preferiram usar o LLM Claude no Google Cloud ou na própria plataforma da Anthropic devido à falta de recursos e à alta latência no Bedrock. O Serviço Digital do Governo do Reino Unido considerou migrar para o Microsoft Azure apenas porque o Claude 3.7 Sonnet apresentava desempenho inferior no Bedrock.A Thomson Reuters também escolheu o Google Cloud para seu produto de IA, o CoCounsel, porque a AWS era de 15 a 30% mais lenta e não possuía certificações governamentais importantes.

Fonte da imagem: Vitaly Gariev/unsplash.com

O documento da AWS observa que a plataforma Bedrock é inferior ao Google. Para os modelos Gemini, as cotas são de cinco a seis vezes maiores, e o Gemini Pro supera o Claude no Bedrock em muitos benchmarks. Pior ainda, o Gemini Flash oferece qualidade comparável a uma fração do custo. Algumas startups literalmente abandonaram a plataforma por esse motivo. A TainAI migrou 40% de suas cargas de trabalho para o Gemini Flash, abandonando o Claude no Bedrock e economizando US$ 85.000 por dia, enquanto a Hotel Planner pretendia migrar para o Google Cloud ou OpenAI. Tudo isso ocorreu antes do lançamento do Gemini 3.

Um problema ainda mais significativo, segundo o documento, é que a AWS carece de uma visão holística para inferência de IA, apesar de ser um serviço central do Bedrock. Isso beneficiou não apenas os hiperescaladores, mas também empresas menores. Sem uma estratégia clara, a AWS corre o risco de perder uma das oportunidades mais atraentes do mercado de IA. Mas os problemas não param por aí. A interrupção da AWS em outubro demonstrou a dependência da rede global da líder do mercado de nuvem, levando muitos a considerar a migração de pelo menos parte de suas cargas de trabalho para outras plataformas, enquanto a União Europeia avalia a possibilidade de limitar a capacidade das gigantes americanas da nuvem.

Nas últimas semanas, os investidores têm se preocupado com os gastos em inteligência artificial, temendo o surgimento de outra bolha de TI. Nesse contexto, a escassez de capacidade da Amazon desempenha um papel duplo. Indica que a demanda dos clientes ainda é forte. Por outro lado, a escassez é mais um motivo para investir mais em desenvolvimento de infraestrutura, aumentando o risco de uma bolha. A Amazon afirma que pretende alocar US$ 125 bilhões em investimentos de capital este ano e ainda mais em 2026.Se você notar algum erro, por favor, destaque-o.Com o mouse, pressione CTRL+ENTER. | Você consegue escrever melhor? Ficaremos felizes em receber seu feedback.

Fonte:

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *