Desenvolvedores de chatbots começaram a usar amplamente uma ferramenta especializada chamada Caveman, que força a inteligência artificial a gerar respostas extremamente breves que imitam um estilo de fala “primitivo”. De acordo com a 404 Media, o uso do Caveman é uma resposta das empresas ao rápido crescimento dos custos de tokens e à necessidade de um controle orçamentário rigoroso.

A ferramenta foi criada pelo desenvolvedor Julius Brussee, que observou que uma parcela significativa dos orçamentos das empresas era desperdiçada com “conversas” desnecessárias em modelos de linguagem. O Caveman remove palavras de preenchimento, saudações e construções introdutórias das respostas dos chatbots, deixando apenas o essencial, como código de programa, comandos, URLs e detalhes técnicos. Testes usando o plugin no Claude e no Codex mostram que ele reduz o número de tokens gerados em 65-75%, oferecendo aos usuários múltiplos níveis de compressão de texto. Brussee confirmou que sua ferramenta já está sendo usada por funcionários da OpenAI, Nvidia, GitHub e DEPT.

Notavelmente, os criadores de modelos de IA populares, que estão diretamente interessados ​​na otimização, também se juntaram ao desenvolvimento do projeto. De acordo com publicações no GitHub, Shane Sweeney, CTO da OpenAI, contribuiu pessoalmente com alterações no repositório do Caveman, adicionando suporte à ferramenta proprietária Codex. Além disso, o utilitário agora está disponível como um agente autônomo completo para uso em terminais, que consome quase metade dos tokens ao executar tarefas semelhantes e é totalmente compatível com o sistema de IA OpenClaw.

A criação do Caveman foi uma resposta ao problema global do aumento imprevisível do custo da computação em IA.Obrigando grandes empresas como Uber e Walmart a limitar o uso de inteligência artificial por seus funcionários. A fabricante de equipamentos Legrand também distribuiu um memorando interno incentivando os funcionários a monitorarem o uso de suas redes neurais devido às novas restrições. No documento, a gerência recomendou abandonar o uso regular dos modelos de linguagem mais poderosos e ativar a “linguagem primitiva” para reduzir o volume de respostas sem sacrificar a qualidade.

Anteriormente, o CEO da OpenAI, Sam Altman, afirmou que o hábito dos usuários de digitar “por favor” e “obrigado” em solicitações custa à OpenAI dezenas de milhões de dólares em custos adicionais de energia. Em meio a essa tendência, a consultoria Accenture começou a oferecer aos clientes novos serviços relacionados à tokenomics.

By admin

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *