La UAH crea un sistema de lectura semiautomática de jeroglíficos egipcios

El proyecto interdisciplinar Transcripción semi-automática de documentos en jeroglífico egipcio (OCR-PT-CT) concebirá y desarrollará un set de herramientas digitales para aplicar reconocimiento óptico de caracteres (OCR) a los jeroglíficos de los textos de las pirámides y de los ataúdes del antiguo Egipto. 

Financiado por la Universidad de Alcalá, OCR-PT-CT es un proyecto puntero en tecnología y humanidades digitales que tiene como objeto conseguir una transcripción semi-automática de los textos originales. Esto significa dos cosas: primero, la máquina propondrá lecturas de los jeroglíficos usando reconocimiento de imágenes y redes neuronales; segundo, los egiptólogos comprobarán y corregirán esas lecturas enseñando a la máquina a leer cada vez mejor.

La Universidad de Alcalá se suma así a los esfuerzos que unas pocas instituciones del mundo están realizando en un área de investigación muy avanzada en humanidades digitales, entre las que se encuentran la Universidad de California Berkeley, la Universidad de Saint Andrews, la Academia de Ciencias de Berlín, la Universidad de Maguncia, la Universidad de Helsinki o el Laboratorio Cédric de París.

A diferencia de los proyectos de estas instituciones, que se basan en las anotaciones de los egiptólogos (la mayoría) o en el reconocimiento automático de imágenes (una minoría), el proyecto de la Universidad de Alcalá es un proyecto de prueba de concepto que combina ambos procedimientos para mejorar las lecturas.

Esto es posible porque el equipo interdisciplinar de OCR-PT-CT está compuesto por miembros de dos grupos de investigación de la UAH (Ingeniería y Egiptología): Daniel Pizarro, Álvaro Hernández, Sira Palazuelos y Rubén Nieto, del grupo GEINTRA; y Carlos Gracia (coordinador del proyecto), Jónatan Ortiz, Beatriz Noria y Sika Pedersen, del grupo CIARQ. Asimismo, el proyecto ha contratado a dos becarios de investigación: Laura de Diego (Electrónica, UAH) y César Guerra (Máster en Egiptología, Universidad de Liverpool).

El proyecto cuenta con la cooperación internacional del Oriental Institute de la Universidad de Chicago y del Profesor James P. Allen, de la Universidad Brown (Providence), que proporcionan los materiales sobre los que se realizará el proyecto.

El proyecto OCR-PT-CT permitirá a los investigadores supervisar de manera interactiva la transcripción completa del corpus elegido, sin necesidad de realizar el etiquetado a nivel de frase de una gran parte de este. Esto podría facilitar en un futuro la labor de los egiptólogos para buscar paralelos de textos, hacer análisis gramaticales, lexicales y filológicos con gran cantidad de textos y restaurar lagunas, entre otras muchas aplicaciones posibles. De esta manera, también podrán hacer accesibles sus investigaciones a sectores más amplios de la sociedad mediante la difusión del patrimonio escrito de la civilización egipcia, la más longeva de las civilizaciones con escritura.

Sistema OCR

 

Publicado en: Reportaje