Cultura

Conocer el pasado con la Inteligencia Artificial: descubrir obras de Lope o geoglifos en Nazca

La Biblioteca Nacional de España informó esta semana del descubrimiento de una obra de Lope de Vega gracias al uso de la inteligencia artificial

La mejor forma de identificar un Leonardo, o un Velazquez será, o es ya, un programa informático. Lo mismo se podrá decir para discernir si unos versos encontrados en un archivo fueron manuscritos por Cervantes o por algunos de sus imitadores. Lo hará mucho mejor que cualquier investigador que se ha dejado las pupilas en cada pincelada de un Sorolla o que conoce todas las rimas de Quevedo. Mucho más sencillo también será sustituir al que escribe un texto como este. La inteligencia artificial, todavía en pañales, con la que nos divertimos planteándole dilemas éticos en un chat o le pedimos que nos pinte como un héroe de Marvel, también está dando zancadas en el mundo de la investigación histórica. 

Este martes, la Biblioteca Nacional de España comunicó que había descubierto en su fondo de manuscritos teatrales una comedia de Lope de Vega titulada La francesa Laura, una obra escrita cinco o seis años antes de su muerte. La atribución de la autoría fue posible al trabajo, entre otros, de una inteligencia artificial. Según informó la BNE, el hallazgo ha sido posible gracias a su colaboración con el proyecto ETSO: Estilometría aplicada al Teatro del Siglo de Oro, dirigido por Álvaro Cuéllar y Germán Vega, los investigadores responsables del hallazgo, y que cuenta con hasta 150 colaboradores dedicados a la aplicación de análisis informáticos a la literatura teatral del Siglo de Oro para desentrañar sus problemas de autoría.

El proceso comenzó con una transcripción automática con técnicas de Inteligencia Artificial a través de la herramienta Transkribus. Este programa permite transcribir de forma certera manuscritos antiguos con un alto grado de precisión, algo imposible hasta hace unos pocos años. Para ello, tuvo que ser entrenada mediante el suministro de manuscritos y su correspondiente transcripción (en este caso, fueron necesarios unos 3 millones de palabras correctamente identificadas) hasta que llega a un punto en el que la máquina ha aprendido lo suficiente para reconocer las letras y las palabras de forma autónoma, señaló la Biblioteca Nacional. El siguiente paso fue procesar unas mil trescientas obras teatrales del Siglo de Oro, tanto impresas como manuscritas. Una tarea que hubiera llevado años de trabajo a varios investigadores y que la herramienta realizó en unas horas. 

Transcripción automática realizada con Transkribus y un modelo entrenado con 3 millones de palabras.

La siguiente fase consiste en identificar al autor a través del análisis de las palabras utilizadas en el texto. Según explican desde la BNE, cada persona utiliza palabras con muy distinta frecuencia, y la inteligencia artificial es capaz de cribar entre autores con aciertos superiores al 99%. La reciente investigación ha determinado que los usos léxicos de La francesa Laura se alineaban estrechamente con los de Lope de Vega, y no con los otros 350 dramaturgos de la época con los que se contaba en el experimento. Por último, los estudios filológicos tradicionales confirmaron la autoría. Un equipo humano confirmó que la métrica, la pronunciación y las ideas y asuntos lopescos concordaban en esta obra. 

Líneas Nazca

Este último hallazgo es un nuevo ejemplo de la enorme potencialidad de una tecnología prácticamente recién nacida. El año 2022 se cerraba con el descubrimiento de 142 nuevos geoglifos en Perú, englobadas en las conocidas como líneas de Nazca. La universidad japonesa de Yagamata se apoyó en imágenes de alta resolución e inteligencia artificial para la identificación de las figuras trazadas hace unos dos milenios.

Geoglifo de Nazca identificado mediante el uso de una inteligencia artificial.

La universidad japonesa lleva varios años trabajando combinando las imágenes en alta resolución con el procesamiento de datos de la inteligencia artificial. En 2019 se descubrió el conocido como geoglifo número 143, también llamado hombre del bastón, una figura antropomorfa que se convirtió en la primera descubierta por una inteligencia artificial.

Como en el caso de los textos del Siglo de Oro español, la herramienta realiza un aprendizaje automático con millones de datos y a través de algoritmos se les puede entrenar para buscar cierto tipo de información, en este caso patrones lineales o figurativos, y que de nuevo ahorran miles de horas de trabajo a los investigadores.

Los casos anteriormente expuestos no dejan de ser un programa identificando patrones para lo que han sido entrenados, el problema llega cuando este tipo de herramientas trata de generar situaciones como recrear el aspecto físico de personajes o conversaciones con ellos. En ambos casos se ha demostrado que la falta de contextualización y la presencia de importantes sesgos culturales hacen que, de momento, solo sean un entretenimiento, una ficción. 

Apoya TU periodismo independiente y crítico

Ayúdanos a contribuir a la Defensa del Estado de Derecho Haz tu aportación
Salir de ver en versión AMP