Asamblea general del consorcio para la preservación de internet
La recolección y archivado de las publicaciones en línea
La necesidad de abordar recolecciones web colaborativas a nivel mundial, las expectativas de los investigadores ante estas colecciones, la evolución de las herramientas que se usan para archivar la web, y los límites y oportunidades derivados de la legislación sobre depósito legal de publicaciones en línea en distintos países, han sido los temas principales que se han discutido en la Asamblea General del Consorcio Internacional para la Preservación de Internet, que se ha celebrado en la Biblioteca Nacional de Francia entre el 19 y el 23 de mayo.
Para la Biblioteca Nacional de España, que forma parte del Consorcio desde 2010 y este año acudió por primera vez como miembro de su Consejo Directivo, es especialmente importante la participación en las actividades de la organización en un momento en el que el texto del real decreto que regulará el depósito legal de las publicaciones en línea está en su última etapa de tramitación. Preparándose para su entrada en vigor, la Biblioteca ha instalado un entorno de pruebas con el software NetarchiveSuite, con el que ya ha realizado recolecciones selectivas de la web española. Este paquete de herramientas de código abierto fue diseñado por la Biblioteca Real de Dinamarca y lo usan hoy también para sus recolecciones las bibliotecas de Estonia, Austria y Francia. En el marco de la Asamblea General se han celebrado reuniones y talleres sobre esta herramienta, en los que los usuarios y desarrolladores han compartido experiencias y conocimiento para sacar el mayor partido de ella en sus respectivos proyectos.
Ante la ingente tarea de preservar el patrimonio documental en línea y la escasez de recursos para abordarla, Paul Wagner, director general de la Biblioteca y Archivos de Canadá, subrayó la necesidad de que las instituciones que afrontan esta responsabilidad tomen conciencia de lo que supone la preservación de toda esta información para el futuro y lo contemplen a la luz de los “muchos recursos humanos y materiales que a lo largo de la Historia las bibliotecas y los archivos han empleado en la preservación de los documentos en soportes tangibles”.
Son 49 las instituciones que forman parte del Consorcio –que por primera vez cuenta con un miembro de Sudamérica: Chile-. La Asamblea se divide en dos partes: una primera jornada abierta al público con intervenciones de investigadores en el campo del archivado web y de miembros del Consorcio, que dan a conocer sus respectivos proyectos; y una segunda en la que se celebran reuniones de los distintos grupos de trabajo y se analizan los principales retos.
Además de abordar las recolecciones colaborativas, se analizó la evolución de Heritrix, la pieza software clave de las recolecciones web, el desarrollo de la Wayback, el software ideado por Internet Archive que permite la recuperación de la información archivada y lo convierte en código abierto (Open Wayback). También se revisaron algunas herramientas usadas por las distintas instituciones para adaptarse a los nuevos formatos de los contenidos en línea, como fue el caso de la Biblioteca Británica que pasó de las recolecciones selectivas a las masivas del dominio .uk., a partir de la puesta en marcha del depósito legal de las publicaciones electrónicas en Reino Unido.
Para más información consulte: http://www.bne.es/es/AreaPrensa/