Desenvolvedores de chatbots começaram a usar amplamente uma ferramenta especializada chamada Caveman, que força a inteligência artificial a gerar respostas extremamente breves que imitam um estilo de fala “primitivo”. De acordo com a 404 Media, o uso do Caveman é uma resposta das empresas ao rápido crescimento dos custos de tokens e à necessidade de um controle orçamentário rigoroso.
A ferramenta foi criada pelo desenvolvedor Julius Brussee, que observou que uma parcela significativa dos orçamentos das empresas era desperdiçada com “conversas” desnecessárias em modelos de linguagem. O Caveman remove palavras de preenchimento, saudações e construções introdutórias das respostas dos chatbots, deixando apenas o essencial, como código de programa, comandos, URLs e detalhes técnicos. Testes usando o plugin no Claude e no Codex mostram que ele reduz o número de tokens gerados em 65-75%, oferecendo aos usuários múltiplos níveis de compressão de texto. Brussee confirmou que sua ferramenta já está sendo usada por funcionários da OpenAI, Nvidia, GitHub e DEPT.
Notavelmente, os criadores de modelos de IA populares, que estão diretamente interessados na otimização, também se juntaram ao desenvolvimento do projeto. De acordo com publicações no GitHub, Shane Sweeney, CTO da OpenAI, contribuiu pessoalmente com alterações no repositório do Caveman, adicionando suporte à ferramenta proprietária Codex. Além disso, o utilitário agora está disponível como um agente autônomo completo para uso em terminais, que consome quase metade dos tokens ao executar tarefas semelhantes e é totalmente compatível com o sistema de IA OpenClaw.
A criação do Caveman foi uma resposta ao problema global do aumento imprevisível do custo da computação em IA.Obrigando grandes empresas como Uber e Walmart a limitar o uso de inteligência artificial por seus funcionários. A fabricante de equipamentos Legrand também distribuiu um memorando interno incentivando os funcionários a monitorarem o uso de suas redes neurais devido às novas restrições. No documento, a gerência recomendou abandonar o uso regular dos modelos de linguagem mais poderosos e ativar a “linguagem primitiva” para reduzir o volume de respostas sem sacrificar a qualidade.
Anteriormente, o CEO da OpenAI, Sam Altman, afirmou que o hábito dos usuários de digitar “por favor” e “obrigado” em solicitações custa à OpenAI dezenas de milhões de dólares em custos adicionais de energia. Em meio a essa tendência, a consultoria Accenture começou a oferecer aos clientes novos serviços relacionados à tokenomics.
O The Verge, citando fontes familiarizadas com os planos da Microsoft, noticiou mais uma possível…
A fabricante chinesa Titan Army apresentou o monitor gamer M27E6V-3D de 27 polegadas no Nuclear…
A Bethesda Softworks anunciou a data de lançamento de The Elder Scrolls IV: Oblivion Remastered,…
Um tribunal federal dos EUA negou o pedido da Meta para arquivar um processo movido…
O estúdio francês Quantic Dream (Heavy Rain, Beyond: Two Souls, Detroit: Become Human) respondeu às…
Pela primeira vez em mais de 15 anos, o comitê de Busca por Inteligência Extraterrestre…