Um estudo realizado pelo grupo sem fins lucrativos METR descobriu que o uso de ferramentas de IA existentes para auxiliar na codificação pode, na verdade, desacelerar, em vez de acelerar, até mesmo desenvolvedores experientes. Esperava-se que programadores de IA conhecidos, como Cursor e GitHub Copilot, aumentassem a produtividade dos programadores escrevendo código automaticamente, mas, como escreve o TechCrunch, o estudo não confirmou isso.
Fonte da imagem: Mohammad Rahmani/Unsplash
Cursor e GitHub Copilot, impulsionados por modelos poderosos da OpenAI, Google DeepMind, Anthropic e xAI, certamente mostram ganhos significativos em tarefas de engenharia de software. No entanto, um teste realizado pelo METR em 10 de julho de 2025 questiona a extensão desses ganhos. Os participantes foram 16 desenvolvedores experientes de software de código aberto que foram solicitados a concluir 246 tarefas reais em grandes repositórios nos quais trabalham comumente. Metade das tarefas foi concluída com o uso de ferramentas avançadas de IA, incluindo o Cursor Pro, e a outra metade sem elas.
Antes do teste, os desenvolvedores presumiram que a IA reduziria o tempo necessário para concluir tarefas em 24%. No entanto, os resultados foram opostos: em média, o uso de assistentes de IA aumentou o tempo necessário para concluir tarefas em 19%. Como os pesquisadores observaram, isso foi inesperado, já que se esperava que a automação acelerasse o processo, e não o contrário.
Ao mesmo tempo, apenas 56% dos participantes já haviam trabalhado com o Cursor, embora quase todos (94%) já tivessem utilizado interfaces web baseadas em modelos de linguagem de grande porte. Antes do experimento, os desenvolvedores foram treinados para trabalhar com a ferramenta, a fim de minimizar o impacto da falta de experiência. Como resultado, ficou claro que o tempo gasto compondo consultas de texto para a IA e aguardando uma resposta, em vez de programar diretamente, reduzia significativamente o tempo de trabalho. Ao longo do caminho, descobriu-se que a IA tem dificuldade em trabalhar com códigos grandes e complexos.
Os autores do estudo enfatizaram que não estão tirando conclusões definitivas, embora afirmem que os sistemas de IA são ineficazes, pelo menos para desenvolvedores experientes. Ao mesmo tempo, acrescentaram que a tecnologia está se desenvolvendo rapidamente e os resultados do experimento podem ficar desatualizados em apenas três meses.
Segundo Eddie Wu, CEO da Alibaba Cloud, a empresa planeja aumentar em dez vezes a…
O presidente dos EUA, Donald Trump, disse ter discutido esforços conjuntos para limitar o uso…
A confiança global na IA está prestes a ser testada novamente: a OpenAI planeja dar…
Os desenvolvedores do estúdio americano Unknown Worlds Entertainment (de propriedade da Krafton) anunciaram planos para…
Na WinHEC 2026 (Windows Hardware Engineering Conference), a Microsoft apresentou sua Iniciativa de Qualidade de…
O dispositivo, batizado de Robô Magnético Flexível Água-viva (J-MSR, na sigla em inglês), imita o…