Home Science O papel de brasileiros na decifração de textos do Vesúvio – 25/09/2024...

O papel de brasileiros na decifração de textos do Vesúvio – 25/09/2024 – Darwin e Deus

24
0

No começo deste ano, escrevi sobre o Vesuvius Challenge ou Desafio Vesúvio, uma competição internacional destinada a fomentar a criação de ferramentas computacionais capazes de “ler” os célebres rolos de papiros carbonizados pela erupção do vulcão italiano Vesúvio há quase 2.000 anos. Os papiros, achados na cidade romana de Herculano, provavelmente contêm obras inéditas da Antiguidade.

Acontece que um grupo de jovens pesquisadores da USP de São Carlos alcançou o segundo lugar nesse desafio, e eu tive o prazer de receber uma narrativa em primeira pessoa de como foi esse trabalho de um dos integrantes do time, Elian Rafael Dal Prá. Se você está interessado nessa intrigante interface entre arqueologia, literatura antiga e inteligência artificial, recomendo muito que leia o texto enviado pelo Elian ao blog. Segue abaixo. Boa leitura!

Interesse no desafio:

Conheci o desafio por meio de um tuíte do Nat Friedman (um dos fundadores do desafio). Ali me encantei de pronto com a possibilidade de recuperar textos nunca antes lidos num período de dois milênios. Dizia-se que, se solucionado o problema, teríamos mais conteúdo da Antiguidade do que temos hoje. Além disso, o possível conteúdo dos papiros era (e ainda é, em parte) um mistério, o que tornou muito mais interessante solucionar o problema. Ademais, na época fazia Iniciação Científica no tópico de Inteligência Artificial (IA) com o professor do IFSC/USP Odemir Bruno (e esse desafio tinha IA em seu fundamento). Contudo, não tive interação de forma prática com o problema desde esse primeiro contato, mas acompanhava alguns desenvolvimentos por parte da comunidade. Um deles foi o encontro da primeira palavra nos papiros (o termo grego “porphyrias”).

A solução que levou à descoberta da primeira palavra foi disponibilizada para todos em outubro, e, em novembro, baseado nessa solução, iniciou-se o treinamento dos nossos modelos próprios. Vale notar que a competição nunca foi um incentivo para tentar resolver o desafio (ainda mais quando considerado o pouco tempo restante para a submissão e a disponibilidade de recursos no Brasil), mas, sim, fazer o melhor para ir o mais longe possível e, quem sabe, encontrar algum texto inédito antes de a solução final ser revelada ao público.

Nisso, o professor Odemir Bruno sugeriu conversar com o pós-doutorando Leonardo Scabini, também parte do Grupo de Computação Científica no IFSC/USP, para fazer parte do time e colaborar no desafio. Adicionalmente, entrei em contato com o norte-americano Sean Johnson (administrador de sistemas) para se juntar à equipe. Além disso, meu irmão e alguns amigos meus ajudaram com a parte de rotulação dos dados, ou seja, na criação do banco de dados que “alimentou” a IA para que ela aprendesse os padrões de tinta.

Uma frase que resume bem o sentimento relacionado ao interesse em solucionar o desafio é a de um tuíte que publicamos: “Ser responsável por um projeto que, do começo ao fim, todos fizeram pelo puro prazer de fazê-lo me enche de alegria.” De fato, nunca imaginamos que chegaríamos ao pódio; ter chegado com um processo feito a partir do interesse genuíno de encontrar os textos é algo a se orgulhar. Não só isso, um time majoritariamente brasileiro estar entre os premiados de uma competição internacional em tão pouco tempo de desenvolvimento e com recursos limitados mostra que a ciência no Brasil tem um grande futuro se a ela for dada a devida atenção.

Esse é o time completo: Elian Rafael Dal Prá, Sean Johnson, Leonardo Scabini, Raí Fernando Dal Prá, João Vitor Brentigani Torezan, Daniel Baldin Franceschini, Bruno Pereira Kellm, Marcelo Soccol Gris e Odemir Martinez Bruno.

Como funciona a nossa solução

De forma bem resumida, nossa solução consistiu em duas partes. A primeira delas foi fazer a IA classificar o que era tinta ou não de forma bem rústica, de uma forma aproximada, sem dar atenção para nenhuma forma relacionada às letras.

Depois, usamos os resultados dessa IA e os “jogamos” para outra IA, dessa vez um pouco mais preocupada com as formas para que obtivéssemos um resultado mais legível. É notável que isso sempre foi feito considerando partes muito pequenas de letras, a IA nunca aprendia letras por completo para evitar alucinação de letras.


LINK PRESENTE: Gostou deste texto? Assinante pode liberar sete acessos gratuitos de qualquer link por dia. Basta clicar no F azul abaixo.

Previous articleTuristas estrangeiros gastam R$ 26 bi no Brasil de janeiro a agosto
Next articlePoupança Viacredi de forma simples e segura

LEAVE A REPLY

Please enter your comment!
Please enter your name here