A AWS anunciou a versão mais recente do OpenSearch Serverless, um banco de dados totalmente gerenciado para pesquisa e processamento vetorial, projetado para cargas de trabalho baseadas em agentes.

Fonte da imagem: Igor Omilaev/unsplash.com

De acordo com Tia White, Gerente Geral do Amazon OpenSearch Service, os agentes estão passando da fase experimental para a produção, criando padrões de tráfego com mudanças instantâneas de intensidade para os quais a infraestrutura anterior simplesmente não foi projetada.

Os agentes podem experimentar picos de atividade sob demanda, criando múltiplos subagentes que consultam dados de centenas de bancos de dados, pesquisam documentos e chamam APIs em segundos, e são desligados com a mesma rapidez. Segundo a AWS, a próxima geração do OpenSearch Serverless pode escalar instantaneamente à medida que os agentes iniciam tarefas e retornar a zero quando ociosos.

A principal mudança é que o serviço desacopla os recursos de computação do armazenamento, permitindo que a capacidade de computação seja escalada em segundos para lidar com picos de tráfego de agentes e, em seguida, reduzida a zero, diminuindo os custos para o cliente quando os agentes estão ociosos. Os clientes pagam apenas pelos recursos consumidos por suas cargas de trabalho ativas, não por capacidade dedicada, o que gera economias significativas.

“A próxima geração do OpenSearch Serverless escala de zero a milhares de solicitações por segundo e retorna a zero quando ociosa, proporcionando uma economia de custos de até 60% em comparação com clusters do OpenSearch Service dedicados a picos de carga”, informou a AWS.

“Anteriormente, em nossa versão anterior do Serverless, era necessário ter pelo menos uma instância em execução, pois os recursos de armazenamento e computação eram acoplados”, disse White. “Não era possível simplesmente iniciar automaticamente uma instância.”[Recursos computacionais] na velocidade que você precisa, para que você sempre tenha recursos computacionais livres reservados para sua carga de trabalho, esteja você usando-os ou não.”

Tradicionalmente, trabalhar com o OpenSearch exigia o provisionamento de instâncias EC2, a configuração de clusters, o gerenciamento de escalabilidade e o tratamento de atualizações e backups. Com o OpenSearch Serverless, a AWS cuida de todas essas tarefas operacionais.

O serviço usa Unidades de Computação OpenSearch (OCUs) para medir e faturar recursos, escalando-os dinamicamente com base nas necessidades da carga de trabalho do cliente, desde períodos ociosos até picos repentinos, sem a necessidade de qualquer intervenção manual.

No lançamento, o OpenSearch Serverless se integrará a plataformas de desenvolvimento de IA como Vercel e Kiro, permitindo que os desenvolvedores implantem back-ends de pesquisa e vetorização prontos para produção para agentes sem gerenciar a infraestrutura.

O uso crescente de IA baseada em agentes transformou todo o setor de nuvem. A Microsoft lançou atualizações para a plataforma Azure projetadas para suportar picos de atividade de IA e memória compartilhada. No mês passado, a Cloudflare apresentou uma infraestrutura para fornecer aos agentes ambientes persistentes e escalabilidade instantânea.

De acordo com Nos últimos seis meses, os bots foram responsáveis ​​por quase um terço (31%) de todo o tráfego HTTP da Cloudflare. Aproximadamente um quarto de todas as solicitações de bots vieram de rastreadores da web, mecanismos de busca e assistentes de voz.

“O tráfego não humano ultrapassará o tráfego humano.””Por volta do primeiro semestre de 2027”, disse Lai Yi Ohlsen, gerente sênior de produtos da Cloudflare, ao TechCrunch.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *