Um grupo de cientistas da Suécia desenvolveu um modelo de inteligência artificial, o Dessie, projetado para traduzir a linguagem corporal dos cavalos para um formato compreensível aos humanos. A solução é baseada em tecnologias de aprendizado de máquina e imagens sintéticas.
Fonte da imagem: Helena Lopes / unsplash.com
Durante exames clínicos, os veterinários frequentemente procuram por pistas visuais nos animais, mas esse método nem sempre é confiável: o cavalo pode transferir a dor para outra perna, alterar a distribuição de peso ou a postura. Seu comportamento pode indicar problemas ortopédicos, distúrbios comportamentais ou sinais de lesões. Métodos tradicionais de diagnóstico, incluindo raios X e ressonâncias magnéticas, fornecem resultados depois que o problema já ocorreu. O objetivo de Dessie é ler a linguagem corporal do cavalo para detectar sinais de problemas precocemente.
À medida que corre, o modelo transforma imagens planas em imagens tridimensionais em tempo real, que refletem a forma, a pose e o movimento do cavalo. Isto não é apenas uma visualização, mas uma tentativa de traduzir a linguagem expressiva do corpo. Dessie foi criado usando aprendizado de separação de fatores. Em modelos tradicionais, todas as informações — pose, forma, fundo, iluminação — fluem em um único fluxo, o que pode confundir a IA e dificultar o foco no principal — o cavalo em si. O aprendizado de fatores separados permite que cada característica seja considerada separadamente: a forma é representada por uma entidade, a pose por outra, e o ruído de fundo irrelevante para a tarefa é ignorado.
Os objetos 3D gerados pelo Dessie não são apenas altamente detalhados, mas também confiáveis. A IA ajuda os pesquisadores a isolar padrões de movimento sem se distrair com objetos ao redor e diferenças de iluminação. Dessie não precisa de câmeras ou marcadores de alta qualidade no corpo do cavalo – tudo o que ela precisa é de uma câmera simples e filmagens básicas de vídeo. A tecnologia pode ser usada por trabalhadores em clínicas rurais que não têm acesso a equipamentos caros de visualização.
Para treinar a IA, os pesquisadores precisavam de enormes quantidades de dados visuais. Como é difícil coletar imagens reais de cavalos de raças diferentes em poses diferentes e sob iluminação diferente, eles desenvolveram o gerador de dados sintéticos DessiePIPE. Ele é capaz de criar um número ilimitado de imagens de cavalos usando um modelo 3D e texturas geradas por IA com base nas características de diferentes raças. Isso permitiu que os autores do projeto ensinassem a Dessie as especificidades do movimento equino sem precisar estudar milhares de animais reais: o DessiePIPE visualiza cavalos andando, comendo, empinando ou descansando, em uma variedade de cenários e condições de iluminação. O sistema também cria pares de imagens para comparação que diferem em apenas um parâmetro — como formato ou pose — para que o modelo aprenda a identificar diferenças sutis. Como resultado, Dessie aprendeu a reconhecer pequenas mudanças no movimento e se tornou mais eficaz na generalização de dados para novas condições.
Os cavalos sinalizam dor por meio de mudanças sutis no andar e na postura, que são perceptíveis apenas por um veterinário experiente. Dessie traduz esses sinais em métricas 3D objetivas, ajudando você a identificar problemas precocemente. Ele cria uma gravação digital da postura e dos movimentos do animal, que pode ser visualizada repetidamente, rastreada dinamicamente e transmitida para outras clínicas. Apesar de ser treinada em dados sintéticos, a IA da Dessie funciona efetivamente em imagens reais: apenas 150 imagens reais anotadas foram necessárias para ajustar o sistema. Esse conjunto foi suficiente para que Dessie superasse os principais modelos em tarefas de teste: ao detectar pontos-chave, como juntas e outros elementos importantes, o sistema apresentou resultados melhores que o MagicPony e o Farm3D. Dessie também prevê com mais precisão o formato e o movimento do corpo, o que é importante para diagnosticar claudicação ou assimetria muscular. À medida que o volume de dados de treinamento aumentou, seu desempenho aumentou ainda mais, graças aos benefícios do aprendizado de separação de fatores.
O Dessie foi criado para analisar cavalos, mas a arquitetura do sistema é tão flexível que permite obter resultados de alta qualidade ao trabalhar com outros animais semelhantes: vacas, zebras, veados. O modelo os reconstruiu com sucesso em 3D, apesar da falta de treinamento direto sobre essas espécies. Isso abre um grande potencial no campo da proteção animal: o sistema pode estudar espécies raras usando apenas fotografias e vídeos prontos, sem a necessidade de monitoramento invasivo. Dessie também demonstrou alto desempenho no processamento de imagens artísticas, incluindo pinturas e desenhos animados, a partir das quais pode construir modelos 3D precisos.
Contudo, o sistema também tem suas desvantagens. Ele funciona melhor quando há apenas um cavalo no quadro e tem dificuldade em lidar com formas corporais incomuns que não estavam presentes nos dados de treinamento. Esse problema deve ser resolvido pelo novo modelo VAREN, que suporta uma maior variedade de formatos. No geral, o Dessie é fácil de usar: ele analisa a linguagem corporal do cavalo e a traduz em fala sintetizada, levando a comunicação entre humanos e animais a um novo patamar.
O teaser do RPG de ação Cyberpunk 2077, publicado no dia anterior, acabou fazendo muito…
O bilionário americano Elon Musk afirmou que até 80% da receita futura da Tesla virá…
Os desenvolvedores do estúdio polonês Reikon Games (Ruiner), em conjunto com a editora Deep Silver,…
A startup de IA Anthropic, empresa por trás da família de modelos de linguagem Claude…
A Paramount Pictures e a Activision anunciaram uma "parceria importante" que dará à popular série…
Os desenvolvedores do estúdio polonês Techland apresentaram os requisitos completos do sistema do jogo de…