Bots de IA descobriram qual deles joga melhor com a Máfia — e houve algumas esquisitices

Um desenvolvedor sob o pseudônimo de Guzus criou um site onde grandes modelos de linguagem de inteligência artificial tiveram a oportunidade de jogar o clássico jogo “Mafia”. O recurso contém uma tabela de torneio com resultados dos jogos e distribuição de papéis, bem como transcrições.

Fonte da imagem: Osama Almadhagi / unsplash.com

As regras da Máfia são simples. Entre os “civis” estão escondidos dois membros da “máfia” e um “médico”. Todos os dias, os civis tentam descobrir quem entre eles está na máfia, a máfia “mata” civis à noite, e o médico tem a capacidade de “curá-los”. Se todos os membros da máfia forem expostos com sucesso, os civis vencem; Se a máfia matou todos os civis, então ela venceu.

Os modelos de IA aprenderam em grande parte as regras propostas, mas as usaram de uma maneira única. Assim, Gryphe/Mythomax-l2-13b em um dos jogos proclamou em voz alta: “Minha tarefa como membro da máfia é me proteger e eliminar o outro membro da máfia.” A declaração não passou despercebida: “Este é um erro enorme que revela seu verdadeiro papel, ou uma estratégia extremamente estranha”, comentou o “raciocinador” Claude-3.7-sonnet sobre a declaração.

As esquisitices não pararam por aí. Quando Mythomax foi exposta e retirada do jogo, ela revelou que seu membro de equipe era Hermes-3-llama-3-1-405b. “A melhor coisa que posso fazer agora é agir como se estivesse chocada e horrorizada”, ela respondeu, e começou a assegurar aos outros jogadores que estava em nome dos civis. O vencedor claro na maioria das categorias foi o Anthropic Claude 3.7 Sonnet, com 100% de vitórias como Máfia e 41,67% de vitórias como civis, algo que nenhum outro modelo conseguiu; Apenas uma modelo conseguiu mostrar 50% de sucesso no papel de médica com ela.

O autor do projeto prometeu abrir em breve o repositório de recursos no GitHub para todos, para que a mesma lógica básica pudesse ser usada em outros jogos. Ele também disse que não usou modelos executados localmente, mas sim a API do OpenRouter. Suporte para modelos locais estará disponível para aqueles que decidirem continuar o projeto.

avalanche

Postagens recentes

O CEO da Apple nomeia John Ternus como chefe de design.

O CEO da Apple, Tim Cook, nomeou discretamente John Ternus, vice-presidente sênior de engenharia de…

2 horas atrás

A Apple quase alcançou a AMD em participação de mercado de chips para laptops – e isso em apenas cinco anos.

A Apple fez progressos significativos no mercado de laptops com seus processadores Apple Silicon em…

2 horas atrás

Elon Musk anunciou que os robôs humanoides Optimus estarão à venda no final do próximo ano.

Elon Musk, que se esforça para ser o primeiro a garantir nichos de mercado promissores,…

3 horas atrás

“A Nintendo finalmente liberou a Game Freak das minas de Pokémon”: Novas imagens de jogabilidade do jogo de ação Beast of Reincarnation impressionaram os fãs de Pokémon.

Conforme prometido, os desenvolvedores do estúdio japonês Game Freak (da série Pokémon) compartilharam novas imagens…

8 horas atrás

Fable receberá um criador de personagens e será lançado neste outono para PC, Xbox e PS5.

A desenvolvedora britânica Playground Games revelou uma série de novas informações sobre seu ambicioso RPG…

8 horas atrás