Naciones Unidas

Gestión de datos de investigación

Preservación de los datos

Algunas de las diferencias más significativas entre los datos que se generan en las investigaciones y formas tradicionales de recopilar información (principalmente en papel), hacen que la preservación de los datos sea un desafío constante. Una de las grandes lecciones que es posible extraer es que, cuando hablamos de datos, la planificación de la preservación es esencial.

Algunas de las causas que hacen necesaria la planificación de la preservación son:

  • El volumen de datos en la actualidad y su crecimiento exponencial cada año, lo que es un desafío no solo desde el punto de vista del almacenamiento, sino también de la identificación y recuperación de los mismos.

  • La variedad de formatos y tipos de datos y la rapidez con que estos van cambiando, lo que hace imperativo el monitorear los avances tecnológicos de forma constante y considerar acciones para evitar que  estos pueden limiten el acceso a los datos en el mediano y largo plazo

  • Unido a lo anterior, la dependencia de tipos específicos de hardware o software para acceder y utilizar los datos. En este caso, el rápido ritmo con que se vuelven obsoletos también debe ser considerado.

  • La degradación a la que inevitablemente se ven sujetos los medios físicos de almacenamiento. A diferencia del papel, en un lapso de pocos años, este avance puede volver un set de datos totalmente inutilizables. Por otra parte, existen amenazas informáticas que pueden hacer que los datos se pierdan o dañen de forma irrecuperable de un minuto a otro.

El modelo de referencia OAIS

Dentro de los principales estándares utilizados en preservación digital se encuentra el modelo de referencia OAIS (Open Archival Information System, en español: Sistema Abierto de Información de Archivo).

OAIS fue desarrollado originalmente por el Consultative Committee for Space Data Systems (CCSDS) con el objeto de generar un estándar para la preservación en el largo plazo de datos de misiones espaciales. Puesto que no existían estándares previos que sirvieran de base a las actividades de preservación digital, el trabajo del CSSDS se expandió más allá de los límites del ámbito de los datos espaciales y se orientó a la creación de un modelo de referencia que pudiese ser utilizado por cualquier organización, sin importar la naturaleza de la información a preservar. Este trabajo se consolidó con la publicación del modelo en la forma de norma internacional, denominada en su versión actual como ISO 14721:2012.

El concepto central del modelo OAIS es el sistema de información de archivo, definido por la norma como

“una organización, que puede ser parte de una organización más grande, de personas y sistemas que han aceptado la responsabilidad de preservar información y ponerla a disposición de una Comunidad Designada”

La norma establece las responsabilidades de un OAIS que pueden resumirse en:

  1. Negociar y aceptar información apropiada a productores de información
  2. Obtener suficiente control de la información de manera de cumplir con los objetivos de preservación en el largo plazo
  3. Determinar el rango que abarca la comunidad de usuarios del archivo
  4. Asegurar que la información preservada sea entendida de forma independiente por el usuario de la comunidad sin la asistencia del productor de la información
  5. Seguir políticas y procedimientos documentados para asegurar que la información sea preservada contra toda contingencia razonable, y permitir la difusión de copias autentificadas de la información, ya sea en su forma original, o en una forma que pueda ser rastreable hasta el original
  6. Hacer que la información preservada sea accesible a la comunidad de usuarios.

El modelo está integrado por tres componentes:

  • El ambiente externo en el cual opera un OAIS
  • Los componentes funcionales internos que permiten el cumplimiento de los objetivos
  • Los objetos de información que ingresan, son gestionados y diseminados por el OAIS.

Representación del Modelo de Referencia OAIS

Para saber más sobre este estándar, puede consultar el siguiente recurso:

Depósito de datos en repositorios

Para facilitar el acceso y preservación de los datos, se recomienda depositarlos en repositorios creados para dicho fin. Si bien los datos pueden compartirse de manera informal (por ejemplo, al ser solicitados por correo electrónico), esto de ninguna manera asegurará la disponibilidad de los datos en el mediano y largo plazo e introduce barreras innecesarias tanto para quienes comparten los datos como para quienes quieren acceder a ellos.

En cuanto a los repositorios, existen dos opciones comunes:

  • Repositorios institucionales. Generalmente están a cargo de una universidad o centro de investigación y permiten que sus propios investigadores puedan depositar y asignar licencias a los datos generados, para que puedan ser consultados y/o reutilizados por otros

  • Repositorios nacionales. Generalmente están asociados a agencias de financiamiento de investigación o a organismos nacionales vinculados a la ciencia y la tecnología. En estos casos, pueden ofrecer servicios de almacenamiento, licenciamiento y acceso a los datos a diferentes comunidades de investigadores, sin que necesariamente deban estar afiliados a una institución específica.

En ciertas disciplinas, pueden encontrarse repositorios creados específicamente para compartir datos de cierto tipo o que se vinculan con un área del conocimiento determinada, reuniendo conjuntos de datos generados por investigadores de diferentes investigaciones e incluso de diferentes países. Esto puede ser particularmente útil a algunas disciplinas dedicadas al estudio de problemas de tipo global, donde las barreras institucionales o nacionales no son totalmente relevantes, como por ejemplo aquellos vinculados al cambio climático o la biodiversidad.
 

Repositorios Digitales Confiables

Desde mediados de la década del 90 ha existido una preocupación por contar con infraestructuras de archivo digital que sean capaces de almacenar, migrar y dar acceso a diversos objetos digitales. Fue en la década del 2000 que diferentes grupos de interés comenzaron a trabajar por alcanzar un consenso en las características comunes que los archivos digitales o repositorios debían tener, para cumplir con dicho propósito de forma confiable.

Un resultado de este proceso fue el desarrollo del modelo de referencia OAIS, descrito anteriormente. De forma posterior, las diversas comunidades profesionales involucradas han llegado a un consenso sobre la necesidad de que los repositorios no solo declaren, sino que sean capaces de demostrar su confiabilidad. Así, ha surgido el concepto Repositorio Digital Confiable (TDR, por sus nombre en inglés), entendido como aquel que tiene como misión “ofrecer acceso fiable en el largo plazo a recursos digitales gestionados a una comunidad designada, ahora y en el futuro” (Research Libraries Group, 2002).

Desde entonces, se han creado diversas instancias y herramientas para la certificación de repositorios digitales confiables.

Una de ellas es Trusted Repositories Audit & Certification (TRAC), que ofrece herramientas para la auditoría, evaluación y certificación de repositorios, basada en la existencia de buenas prácticas en la infraestructura técnica y organizacional requerida para que un repositorio sea considerado confiable.

TRAC evalúa las siguientes áreas:

  • Estructura organizacional
  • Gestión de objetos digitales, y
  • Tecnologías, infraestructura tecnológica y seguridad.

Existen otras iniciativas, siendo una de gran relevancia en el ámbito europeo el European Framework for Audit and Certification,  que propone tres niveles diferentes de certificación (core, extended y formal). De forma similar a TRAC,  las áreas comunes que se evalúan en los tres niveles son:

  • Organización
  • Manejo de entidades intelectuales y representaciones
  • Infraestructura, y
  • Seguridad.

Cada nivel tiene requisitos específicos, y es certificado según el nivel correspondiente por las organizaciones que participan de la iniciativa: ICSU World Data System, Data Seal of Approval, el German Institute for Standardization e ISO.

Así también, CoreTrustSeal es una organización de certificación creada por el Sistema Mundial del Consejo Científico Internacional (WDS) y el Sello de Aprobación (DSA). Está orientada a ofrecer a cualquier repositorio de datos una certificación básica de calidad basada en el catálogo y los procedimientos de DSA – WDS Core Trustworthy Data Repositories Requirements. Este catálogo refleja las características centrales de los repositorios de datos de calidad y confianza. Son 16 requisitos que analizan distintos aspectos de un repositorio y se agrupan de la siguiente manera:

  • Información de contexto
  • Infraestructura organizacional
  • Administración de objetos digitales
  • Seguridad y tecnología

La certificación CoreTrustSeal pretende ser el primer paso de un marco global de certificación de repositorios, puesto que sumado a él se encuentran la certificación de nivel extendido Nestor-Seal DIN 31644 y la certificación de nivel formal ISO 16363.

Fuentes utilizadas