Um estudo realizado pelo grupo sem fins lucrativos METR descobriu que o uso de ferramentas de IA existentes para auxiliar na codificação pode, na verdade, desacelerar, em vez de acelerar, até mesmo desenvolvedores experientes. Esperava-se que programadores de IA conhecidos, como Cursor e GitHub Copilot, aumentassem a produtividade dos programadores escrevendo código automaticamente, mas, como escreve o TechCrunch, o estudo não confirmou isso.
Fonte da imagem: Mohammad Rahmani/Unsplash
Cursor e GitHub Copilot, impulsionados por modelos poderosos da OpenAI, Google DeepMind, Anthropic e xAI, certamente mostram ganhos significativos em tarefas de engenharia de software. No entanto, um teste realizado pelo METR em 10 de julho de 2025 questiona a extensão desses ganhos. Os participantes foram 16 desenvolvedores experientes de software de código aberto que foram solicitados a concluir 246 tarefas reais em grandes repositórios nos quais trabalham comumente. Metade das tarefas foi concluída com o uso de ferramentas avançadas de IA, incluindo o Cursor Pro, e a outra metade sem elas.
Antes do teste, os desenvolvedores presumiram que a IA reduziria o tempo necessário para concluir tarefas em 24%. No entanto, os resultados foram opostos: em média, o uso de assistentes de IA aumentou o tempo necessário para concluir tarefas em 19%. Como os pesquisadores observaram, isso foi inesperado, já que se esperava que a automação acelerasse o processo, e não o contrário.
Ao mesmo tempo, apenas 56% dos participantes já haviam trabalhado com o Cursor, embora quase todos (94%) já tivessem utilizado interfaces web baseadas em modelos de linguagem de grande porte. Antes do experimento, os desenvolvedores foram treinados para trabalhar com a ferramenta, a fim de minimizar o impacto da falta de experiência. Como resultado, ficou claro que o tempo gasto compondo consultas de texto para a IA e aguardando uma resposta, em vez de programar diretamente, reduzia significativamente o tempo de trabalho. Ao longo do caminho, descobriu-se que a IA tem dificuldade em trabalhar com códigos grandes e complexos.
Os autores do estudo enfatizaram que não estão tirando conclusões definitivas, embora afirmem que os sistemas de IA são ineficazes, pelo menos para desenvolvedores experientes. Ao mesmo tempo, acrescentaram que a tecnologia está se desenvolvendo rapidamente e os resultados do experimento podem ficar desatualizados em apenas três meses.
Analistas independentes publicaram seus primeiros testes do novo console portátil para jogos MSI Claw 8…
A AOC lançou o monitor gamer OLED Agon Pro AGP277QKDC de 27,7 polegadas. O novo…
A Meta suspendeu seu programa interno de monitoramento de funcionários, que registrava a atividade do…
Nada foi confirmado se o primeiro smartphone da série "(b)" será de fato lançado com…
O estúdio britânico Firefly, pertencente à Devolver Digital, anunciou o lançamento de uma demo prometida…
A Microsoft expandiu discretamente o programa de implantação inteligente do Windows 11 25H2 para incluir…