OpenProdoc: superando los silos de información
14/01/2016
Quería en este artículo reflexionar sobre la tendencia que nos lleva a aislar la información y a enfoques cerrados y frente a ello el planteamiento abierto que se ha adoptado en el diseño del gestor documental OpenProdoc.
Lamentablemente, en el mundo de la documentación tienden a formarse silos de información que empobrecen y limitan el uso. Es decir, se acaba creando sistemas aislados de otros sistemas, de forma que la información no puede asociarse o intercambiarse. Podría considerarse varias formas de aislamiento:
- Limitaciones para intercambiar información con sistemas similares.
- Limitaciones para asociar información dispar.
- Limitaciones para compartir información entre personas.
La primera se suaviza en gran parte con el uso de estándares de intercambio (RDF, SKOS, NTI, etc..) por lo que me centraré en los dos últimos, que quizá son los más habituales.
Integrando información
Recientemente he participado en un proyecto para integrar una herramienta de gestión de tesauros de un importante fabricante de software con un gestor documental de ese mismo fabricante. El proyecto tenía cierta complejidad ya que aunque ambas herramientas tenían posibilidades de ampliación, no estaban preparadas para hacerlo. El propio proyecto era una prueba de que hay necesidad de integrar esos sistemas.
Otro ejemplo de esta separación se me ha planteado recientemente al hablar de productos para repositorios digitales, donde un usuario consideraba que debería utilizarse un gestor documental para un tipo de documentación y una herramienta diferente para el repositorio digital (cuando en general la mayor parte de las herramientas para repositorios digitales contienen solo un subconjunto de todas las funciones disponibles en los gestores documentales).
Y este no es un caso aislado. Tenemos productos de gestión de tesauros, de gestión de referencias bibliográficas, de gestión de documentos electrónicos, de gestión de expedientes, de repositorios digitales,..
Como usuarios, no se puede manejar un proyecto o expediente que combine todo de forma integrada. En el fondo, tanto los documentos que se elaboren como los recogidos, las referencias o las URL, ¿No son todos documentos? ¿Por qué manejarlos de forma TAN diferente? La referencia que se maneja en el gestor de referencias, una vez descargada ¿Debemos manejarla de forma diferente por estar guardada localmente? Se podrá alegar que no se necesita los mismos metadatos para describir una referencia que un documento “local”. Pero lo mismo es cierto para los distintos tipos de referencias: el estándar de referencias RIS incluye metadatos referentes a páginas (que no aplicarían a grabaciones) duración (que no aplicaría a libros), formato, etc. ; también distintos tipos de documentos pueden requerir distintos conjuntos de metadatos y eso no implica que deban manejarse separados. Realmente lo necesario es poder clasificar y describir documentos para facilitar su manejo, localización y filtrado y desde luego el poder abrirlos, visualizarlos y editarlos (si somos “propietarios”). Y esto independientemente de otros factores de los documentos (locales o remotos, accesibles o no, sean un artículo “formal” o una página web). Es decir lo ideal sería manejar todos los documentos en un único repositorio y programa, cada uno con su tipo documental y los metadatos adecuados a su tipología, soporte, conservación u otros criterios.
Evidentemente me refiero a lo que es propiamente el manejo de la información y no a ciertas tareas específicas del tipo o soporte. Por ejemplo, una sistema de gestión de bibliotecas debe realizar préstamos y adquisiciones y podrá tener un control del tejuelado para los libros físicos que no requiere para los electrónicos, y un sistema de gestión de registros debe realizar un seguimiento de la ubicación de los originales en su apartado de “registros físicos”. Sin embargo el gestor documental sobre el que se apoya la gestión de registros puede manejar los documentos de forma genérica excepto en algunos detalles imprescindibles.
¿Y respecto a los tesauros? Pues de forma similar, parece triste que después de todo el trabajo de análisis y creación de un tesauro, este no se pueda utilizar automáticamente para asociar términos a los documentos o mejor aún, a metadatos concretos de los distintos tipos documentales, de forma que por ejemplo un tesauro geográfico pueda utilizarse para introducir y controlar un metadato “localización” y un tesauro de materias para el metadato “materia”. El consultar el tesauro y luego utilizar el término (o copiar y pegar su texto) en el metadato correspondiente no puede llamarse integración, al margen del riesgo de errores o de la posibilidad de incoherencias si se modifican o borran términos.
Compartiendo información
Respecto a compartir información, en el apartado de los gestores documentales no suele haber limitaciones, es algo intrínseco a ellos. En las herramientas de gestión de tesauros también es posible, aunque algunas están orientadas a un único usuario o tiene limitaciones en cuanto a la concurrencia de usuarios. Es quizá en la gestión de referencias bibliográficas y de hipervínculos donde las herramientas suelen ser monousuario (en el caso de url como parte del propio navegador o como complemento del mismo). Es cierto que hay webs donde puede compartirse url, pero:
- No hay gestión de la seguridad de forma que se restrinja qué grupos/usuarios pueden verlo
- No puede asignarse a metadatos a las url ni asignarse estas a proyectos/expedientes concretos.
Por tanto, si alguien de un equipo quiere aportar información de interés, en el caso de los documentos, los añadiría al gestor documental, en el caso de los términos del tesauro, al gestor de tesauros, y en el caso de referencias o url, puede enviar un correo o escribir un documento donde las introduzca.
Planteamiento de OpenProdoc
En OpenProdoc el primer paso sería definir las estructuras “contenedoras” (Carpetas, expedientes, fondos, etc.). Puede definirse distintos tipos de contenedores con diferentes metadatos, por ejemplo en un centro docente una “ficha de alumno” con datos personales (nombre, apellidos, DNI, dirección, teléfono, fecha nacimiento,..) para contener todos los documentos y referencias del alumno, o en una empresa una “ficha de proyecto” con los datos del proyecto (Código, nombre, descripción, departamento, fechas inicio y fin…) para contener toda la documentación que genere un proyecto. Para esos expedientes puede definirse un ciclo de vida por medio de las tarea programadas, de forma que por ejemplo se borren automáticamente a los 6 años de la creación, con todos los documentos contenidos
A continuación podría definirse los tipos documentales a manejar, independientemente de si esos documentos se almacenarán localmente o serán referencias. En el caso de referencias que se deseen importar desde formato RIS, podría utilizarse las funciones RIS de OpenProdoc para importar los documentos, manteniendo el formato original una vez importado o adaptándolo a nuestras necesidades con un formato más sencillo y manejable. Cuando se importe los documentos en el sistema, en el caso de los documentos locales, se guardará una copia en el repositorio de OpenProdoc y podría borrarse la copia local, en el caso de las referencias, solo se guardarían los metadatos y la url del documento.
Para asegurar la coherencia de los metadatos, podría definirse varios tesauros para diferentes metadatos de los distintos tipos documentales. Los usuarios no podrán utilizar otros valores que los ya introducidos (evitando ese efecto de la aparición de múltiples términos equivalentes ; Ej.: “Documento”, “Documentos”, “Documentación”, ..) y el sistema asegurará que no se borren del tesauro términos en uso en cualquier documento.
Para facilitar la búsqueda, podrían definirse tareas automáticas de indexación por texto completo, de forma que pueda buscarse con el buscador interno (Lucene) por cualquier palabra o combinación de palabras tanto en el documento como en los metadatos.
La búsqueda y manejo podrá ser por diversos criterios (incluyendo el uso de los tesauros), visualizando un expediente completo conteniendo todos los documentos de cualquier tipo de la misma forma.
Reflexiones finales
El hecho de integrar la gestión de múltiples elementos es un factor positivo que creo que debería ser la norma y no la excepción, y que debe sopesarse junto al resto de las características. Por supuesto, un profesional cuya única función sea elaborar un tesauro no requiere ninguna función adicional, o un bibliotecario que elabore boletines con referencias bibliográficas igualmente puede considerar más adecuada con una herramienta especializada debido a las funciones específicas (que no usa el 90% de los usuarios “normales”).
No obstante la mayoría de los trabajos requieren un enfoque múltiple, donde se maneje muchos elementos de forma integrada. Para ello existe la opción de elegir múltiples herramientas o una sola. En el caso de los programas de ordenador, no existen las limitaciones “físicas” que pueden limitar el enfoque de “navaja suiza” que puede darse en otros ámbitos. Desde luego enfrentar una “navaja suiza” con una sierra, una herramienta de corte y un destornillador “profesionales” no admite comparación para un uso intensivo/profesional. Pero en el ámbito del software no hay las limitaciones de tamaño ni funciones que colisionen entre sí como en el mundo físico. Podemos incluir muchas funciones sin “que aumente el tamaño” siempre que se haga de forma adecuada.
Evidentemente debe sopesarse los requerimientos, funciones y características y puntuar cada uno convenientemente, pero creo que el uso de una sola herramienta no solo es una puntuación adicional para los sistemas integrados desde el punto de vista de los usuarios, sino que implica una sola instalación, un solo servidor (o varios según el volumen por supuesto) y un ahorro de costes que merece la pena tener en cuenta y ponderar en la hoja de evaluación. En ese sentido, quizá el enfoque no debería ser, “voy a buscar un gestor documental, un gestor de referencias ,.. “ sino, “voy a buscar una solución para manejar la información” (solución que podrá estar compuesta de 1, 2 o N componentes).
¿Quiere esto decir que OpenProdoc sea mejor o peor que otros productos o combinaciones de productos? Simplemente quería destacar el interés y las ventajas de un enfoque integrado. La calidad y el grado de consecución de este objetivo es algo que los usuarios deben juzgar. Quien esté interesado en una evaluación rápida, puede probar la versión portable, a la que basta descomprimir en cualquier directorio (en Windows, Linux o Mac) y arrancar.
Fuente: DoKumentalistas