Escritos Desgastados pelo Tempo para Serem Lidos por Eneias – A IA do Google DeepMind Restaurará Textos Antigos e Sua História

A equipe do Google DeepMind introduziu um novo modelo generativo, o Aeneas. Trata-se de uma ferramenta incrivelmente poderosa para historiadores e arqueólogos. Treinado com centenas de milhares de textos latinos, o Aeneas não apenas restaurará fragmentos perdidos de inscrições descobertas, como também contará sua história e origem, bem como sua datação aproximada.

Fonte da imagem: DeepMind

Os cidadãos do Império Romano sabiam e adoravam escrever. Isso se refletiu até mesmo na série “Roma”, da HBO, onde grafites nas paredes de antigos edifícios romanos eram a norma. Algumas dessas inscrições sobreviveram até os dias atuais, embora bastante danificadas. Muitos fragmentos de texto em monumentos, papiros e outros fragmentos da civilização passada também permanecem indecifrados. Para restaurar, datar e contextualizar os fragmentos descobertos, os historiadores precisam se debruçar sobre cada um deles por anos, confiando apenas em sua experiência e na ajuda de colegas. A IA “Eneias” mudará radicalmente a abordagem deste trabalho.

Ressaltamos que “Eneias” não se trata apenas de restaurar textos altamente fragmentados. O modelo até ajuda a determinar a origem geográfica de uma inscrição danificada — ele apontará com alta precisão para uma das 62 províncias do antigo Império Romano onde a inscrição foi feita. Além de datar a inscrição, o contexto será importante, o que a IA explicará de forma compreensível, o que, com o tempo, certamente encontrará sua expressão em chatbots históricos para entusiastas de história e cidadãos comuns.

Em geral, o Aeneas é uma rede neural generativa multimodal que processa textos e imagens de inscrições. Para treinar o modelo, foi criado um extenso conjunto de dados — o Latin Epigraphic Dataset (LED), que inclui mais de 176.000 inscrições latinas de uma seleção das fontes científicas mais abrangentes. Para processar a entrada de texto, o modelo utiliza um decodificador transformador, bem como redes especializadas para restaurar caracteres perdidos e datar textos.

A origem geográfica das inscrições é determinada levando em consideração informações textuais e visuais. Eneias é capaz de encontrar paralelos textuais e contextuais entre milhares de inscrições em segundos, o que acelera significativamente o trabalho dos historiadores.

Testar o modelo na prática mostrou que Eneias restaura inscrições danificadas com uma precisão de 73% se as lacunas não excederem dez caracteres ausentes. Esse número cai para 58% somente se a duração da restauração for desconhecida, o que já é uma tarefa incrivelmente difícil. Usando dados visuais, o modelo consegue atribuir uma das antigas inscrições romanas a 62 províncias com uma precisão de 72%. Para a datação, Eneias situa o texto em um intervalo de 13 anos a partir das datas fornecidas pelos historiadores.

Os principais recursos do modelo incluem a busca por paralelos, expressa na análise de um enorme corpus de inscrições latinas, o que permite identificar textos com redação, sintaxe, fórmulas padronizadas ou origem semelhantes (isso ajuda os historiadores a situar as inscrições em um contexto histórico mais amplo); análise simultânea de informações textuais e visuais e sua combinação; restauração de lacunas de comprimento desconhecido, o que o torna uma ferramenta única para trabalhar com artefatos muito danificados.

Por fim, o modelo Aeneas pode funcionar com qualquer outro script e mídia, bastando ensinar-lhe novos idiomas. O desenvolvedor promete distribuir gratuitamente o Aeneas, que é baseado em código aberto. Como prova disso, a empresa publicou links para todos os arquivos e bancos de dados necessários, incluindo materiais de treinamento.

Vale ressaltar que o Aeneas foi desenvolvido em colaboração com a Universidade de Nottingham, além de pesquisadores das Universidades de Warwick, Oxford e da Universidade de Economia e Negócios de Atenas.

O modelo foi testado com 23 historiadores que analisaram inscrições datadas com e sem Eneias. Os resultados mostraram que, em 90% dos casos, o modelo gerou novas ideias de pesquisa e melhorou a precisão na determinação da origem e da datação dos textos. Por exemplo, Eneias esclareceu a datação do texto Res Gestae Divi Augusti, atribuído ao imperador romano Augusto, ao oferecer dois intervalos prováveis sobre os quais os historiadores discutem. Além disso, a IA fez isso quantitativamente, o que demonstra a clareza da pesquisa científica.

É claro que o Eneias não substitui os historiadores, mas atua como uma ferramenta que se integra ao seu fluxo de trabalho, fornecendo hipóteses e paralelos para análises posteriores. O modelo apresenta potencial para expansão a outras línguas antigas, como hieróglifos gregos ou egípcios, o que poderia enriquecer a historiografia global. Uma versão interativa do Eneias está disponível gratuitamente em predictingthepast.com, e o código e o conjunto de dados estão disponíveis para pesquisadores aprimorarem ainda mais o modelo.

admin

Postagens recentes

Ex-funcionário processa WhatsApp por ignorar questões de segurança cibernética

Um ex-executivo de alta responsabilidade em segurança cibernética do WhatsApp entrou com uma ação judicial…

1 hora atrás

OpenAI considera sair da Califórnia para reduzir burocracia

De acordo com o The Wall Street Journal, a reestruturação planejada da OpenAI enfrenta obstáculos…

1 hora atrás

Sonhava em construir fábrica na Alemanha para produzir os “carros mais rápidos do mundo”

Enquanto concorrentes como a Xiaomi avançam gradativamente, primeiro dominando a produção de carros elétricos na…

2 horas atrás

Xbox Cloud Gaming chega aos carros elétricos graças à LG

A Microsoft e a LG se uniram para levar o Xbox Cloud Gaming aos carros…

2 horas atrás