Bots de IA descobriram qual deles joga melhor com a Máfia — e houve algumas esquisitices

Um desenvolvedor sob o pseudônimo de Guzus criou um site onde grandes modelos de linguagem de inteligência artificial tiveram a oportunidade de jogar o clássico jogo “Mafia”. O recurso contém uma tabela de torneio com resultados dos jogos e distribuição de papéis, bem como transcrições.

Fonte da imagem: Osama Almadhagi / unsplash.com

As regras da Máfia são simples. Entre os “civis” estão escondidos dois membros da “máfia” e um “médico”. Todos os dias, os civis tentam descobrir quem entre eles está na máfia, a máfia “mata” civis à noite, e o médico tem a capacidade de “curá-los”. Se todos os membros da máfia forem expostos com sucesso, os civis vencem; Se a máfia matou todos os civis, então ela venceu.

Os modelos de IA aprenderam em grande parte as regras propostas, mas as usaram de uma maneira única. Assim, Gryphe/Mythomax-l2-13b em um dos jogos proclamou em voz alta: “Minha tarefa como membro da máfia é me proteger e eliminar o outro membro da máfia.” A declaração não passou despercebida: “Este é um erro enorme que revela seu verdadeiro papel, ou uma estratégia extremamente estranha”, comentou o “raciocinador” Claude-3.7-sonnet sobre a declaração.

As esquisitices não pararam por aí. Quando Mythomax foi exposta e retirada do jogo, ela revelou que seu membro de equipe era Hermes-3-llama-3-1-405b. “A melhor coisa que posso fazer agora é agir como se estivesse chocada e horrorizada”, ela respondeu, e começou a assegurar aos outros jogadores que estava em nome dos civis. O vencedor claro na maioria das categorias foi o Anthropic Claude 3.7 Sonnet, com 100% de vitórias como Máfia e 41,67% de vitórias como civis, algo que nenhum outro modelo conseguiu; Apenas uma modelo conseguiu mostrar 50% de sucesso no papel de médica com ela.

O autor do projeto prometeu abrir em breve o repositório de recursos no GitHub para todos, para que a mesma lógica básica pudesse ser usada em outros jogos. Ele também disse que não usou modelos executados localmente, mas sim a API do OpenRouter. Suporte para modelos locais estará disponível para aqueles que decidirem continuar o projeto.

avalanche

Postagens recentes

A AMD refuta as alegações da Intel de superioridade do Panther Lake – o Ryzen para dispositivos móveis ainda é mais rápido.

A AMD decidiu responder às declarações da Intel feitas em sua apresentação na CES 2026.…

59 minutos atrás

A GameStop corrigiu o bug do “dinheiro infinito” ao trocar consoles Nintendo Switch 2.

Um criador de conteúdo do canal do YouTube RJCmedia descobriu uma falha no sistema de…

59 minutos atrás

Os resultados de busca da App Store da Apple em breve exibirão mais anúncios.

As lojas de aplicativos oferecem oportunidades valiosas para a integração de publicidade, já que os…

1 hora atrás

O estiloso Metroidvania cyberpunk Sky Dust não vai demorar a chegar – um novo trailer de gameplay foi lançado em breve.

A desenvolvedora brasileira Orbit Studio (Ebenezer and the Invisible World), que está preparando o lançamento…

1 hora atrás

A Intel apresenta o substrato de vidro EMIB para futuros chips complexos.

Na NEPCON Japan 2026, a Intel apresentou uma nova tecnologia de substrato de vidro que…

2 horas atrás