Estudo da Microsoft mostra que a IA é ‘mais ou menos’ na correção de bugs em códigos de software

Um novo estudo da Microsoft Research descobriu que, embora a IA esteja ajudando os desenvolvedores a escrever código, mesmo os melhores modelos da OpenAI (o1) e da Anthropic (Claude 3.7 Sonnet) só conseguem corrigir erros metade das vezes. O teste foi realizado com base no melhor benchmark SWE-bench, que mede a capacidade dos sistemas de IA de criar código de programa.

Fonte da imagem: gerada por IA

Durante o experimento, os agentes de IA tentaram resolver 300 problemas para eliminar erros no código. O líder foi o modelo Claude 3.7 Sonnet, que completou a tarefa com uma taxa de sucesso de 48,4%, o segundo lugar foi para o OpenAI o1 (30,2%) e o terceiro para o o3-mini (22,1%). Entretanto, como você pode ver, mesmo esses números estão longe do nível que se esperaria de programadores humanos experientes. Como explica o TechCrunch, o principal problema é que a inteligência artificial ainda tem uma compreensão deficiente de como usar as ferramentas disponíveis e interpretar erros.

Segundo os autores do estudo, o principal obstáculo continua sendo a falta de dados para modelos de treinamento. “Acreditamos firmemente que o treinamento ou a reciclagem podem torná-los melhores depuradores interativos”, escrevem eles. “No entanto, isso requer dados especializados, por exemplo, uma cadeia de registros de todos os processos de interação entre pessoas e depuradores de IA.”

Atualmente, esses dados são insuficientes, o que limita as capacidades dos modelos. Por exemplo, a popular ferramenta Devin da startup Cognition Labs só conseguiu lidar com três dos 20 testes de codificação por esse motivo. E embora a IA esteja sendo muito usada por empresas como o Google, o CEO Sundar Pichai diz que um quarto do código criado usando inteligência artificial pode, na verdade, introduzir bugs.

Líderes de tecnologia estão céticos quanto à automação completa da profissão de programação. Bill Gates está confiante de que a programação como profissão certamente não desaparecerá. O CEO da Replit, Amjad Masad, o CEO da Okta, Todd McKinnon, e o CEO da IBM, Arvind Krishna, compartilham opiniões semelhantes.

Apesar dos desafios óbvios, o interesse em ferramentas de desenvolvimento de IA continua crescendo. Os investidores veem potencial para ganhos de eficiência, mas os principais desenvolvedores acreditam que é muito cedo para confiar completamente na IA.

avalanche

Postagens recentes

A Mitsubishi Heavy Industries está modernizando sua produção de turbinas a gás para atender à demanda de operadores de data centers com inteligência artificial.

A Mitsubishi Heavy Industries (MHI), fabricante japonesa de turbinas a gás, anunciou uma modernização de…

22 minutos atrás

Um desenvolvedor da tecnologia de pontos quânticos para TVs revelou as deficiências dos painéis de LED RGB.

No evento anual Display Week, em Los Angeles, a Nanosys, desenvolvedora da tecnologia "superquantum dot"…

4 horas atrás

A Microsoft aprimorou a experiência do touchpad e do teclado virtual no Windows 11, além de aumentar a estabilidade do Explorador de Arquivos.

Esta semana, a Microsoft lançou quatro versões beta do Windows 11 para o programa Windows…

5 horas atrás

Os Estados Unidos estão investigando acidentes envolvendo os robôs-táxi da Avride, empresa que antes fazia parte da Yandex.

A Administração Nacional de Segurança Rodoviária dos Estados Unidos (NHTSA) abriu uma investigação sobre a…

6 horas atrás

Os usuários do Instagram foram privados da criptografia de ponta a ponta em mensagens privadas.

Em 8 de maio, o Instagram descontinuou a criptografia de ponta a ponta para mensagens…

6 horas atrás