Estudo da Apple mostra que modelos de IA não pensam, apenas simulam o pensamento

Os pesquisadores da Apple descobriram que grandes modelos de linguagem, como o ChatGPT, são incapazes de pensamento lógico e são facilmente confundidos ao adicionar detalhes irrelevantes à tarefa em questão, relata o TechCrunch.

Fonte da imagem: Dkoi/Unsplash

O artigo publicado, “Compreendendo os limites do raciocínio matemático em grandes modelos de linguagem”, levanta questões sobre a capacidade da inteligência artificial de raciocinar logicamente. O estudo descobriu que grandes modelos de linguagem (LLMs) podem resolver problemas matemáticos simples, mas adicionar informações irrelevantes leva a erros.

Por exemplo, o modelo pode muito bem resolver o seguinte problema: “Oliver colheu 44 kiwis na sexta-feira. Ele então colheu 58 kiwis no sábado. No domingo ele coletou o dobro de kiwis que na sexta-feira. Quantos kiwis Oliver tem? No entanto, se você adicionar a frase “No domingo, 5 desses kiwis eram ligeiramente menores que a média”, o modelo provavelmente subtrairá esses 5 kiwis do total, apesar do fato de que o tamanho dos kiwis não afeta seu número.

Fonte da imagem: Copiloto

Mehrdad Farajtabar, um dos coautores do estudo, explica que tais erros indicam que os LLMs não entendem a essência da tarefa e estão simplesmente reproduzindo padrões dos dados de treinamento. “Nossa hipótese é que esse declínio [na eficiência] se deve ao fato de que os LLMs modernos são incapazes de um raciocínio lógico verdadeiro; em vez disso, eles tentam reproduzir as etapas de raciocínio observadas em seus dados de treinamento”, afirma o artigo.

Outro especialista da OpenAI argumentou que resultados corretos podem ser obtidos usando engenharia imediata. No entanto, Farajtabar observou que tarefas complexas podem exigir dados exponencialmente mais contextuais para neutralizar distrações que uma criança, por exemplo, ignoraria facilmente.

Isso significa que os LLMs não conseguem raciocinar? Talvez. Ninguém ainda deu uma resposta exata, pois não há uma compreensão clara do que está acontecendo. Os LLMs podem ser “raciocínios”, mas de uma forma que ainda não reconhecemos ou não podemos controlar. De qualquer forma, este tópico abre perspectivas interessantes para futuras pesquisas.

avalanche

Postagens recentes

Memória antiga de uma nova maneira: ASIC Meta✴ Vistara te ajudará a instalar DDR4 a partir de memória usada.

A Meta✴ desenvolveu o ASIC Vistara que, utilizando a tecnologia CXL, permitirá a instalação de…

33 minutos atrás

Uma galáxia distante explodiu em um aglomerado galáctico e proporcionou um espetáculo de luzes que ocupou metade do céu.

Astrônomos relataram a descoberta de uma radiogaláxia incomum, RAD-BAARG, ao redor da qual se formou…

3 horas atrás

O Ayaneo Pocket Micro 2, um console portátil compacto com um processador Snapdragon 865 personalizado, foi lançado por US$ 239.

A Ayaneo lançou o Pocket Micro 2, seu segundo console Android em miniatura e formato…

4 horas atrás

Os Raspberry Pi 4 Modelo B com clock reduzido já estão disponíveis para compra.

Uma nova versão do computador de placa única Raspberry Pi 4 Modelo B já está…

6 horas atrás

A Comissão Europeia tomou conhecimento da AWS e do Microsoft Azure.

A Comissão Europeia anunciou que chegou a uma conclusão preliminar para incluir os principais serviços…

6 horas atrás

Um entusiasta conseguiu executar o Windows 11 em um computador com memória DDR, um processador Intel Core 2 Quad e uma placa de vídeo Radeon HD 4650.

A escassez de chips de memória e os preços exorbitantes estão inspirando entusiastas a grandes…

6 horas atrás