La Biblioteca Nacional de España (BNE) ha guardado más de 1.970.000 dominios durante 25 días, rozando los 68 TB de información, lo que permite a la institución conservar el 87% de los dominios .es en internet.
El número de dominios .es ha aumentado en 180.000 desde 2016 y la infraestructura tecnológica usada ha mejorado su eficacia reduciendo considerablemente el tiempo necesario para la descarga de la información, de los 92 días en aquel año a los 25 días en 2021.
Para guardar los contenidos se trabaja con un software de recolección automático, NetarchiveSuite, que utiliza 71 arañas que rastrean la web y guardan los contenidos pinchando y descargando la información de los enlaces que encuentra.
Límite por cada dominio
El contenido se almacena en un formato específico, conocido como WARC (Web Archive), que permite la consulta de los sitios web tal y como se haría navegando por Internet. A las recolecciones se les establece un límite de tamaño de descarga por cada sitio web para evitar la sobrecarga y saturación del sistema de recolección.
La BNE establece un límite de 150 Megabytes por cada dominio, por lo que una vez llegado a este límite la recolección para, continuando con el siguiente dominio. Este año y con esta configuración, se ha logrado guardar de manera completa el 87% del total de los dominios.