Naciones Unidas

Gestión de datos de investigación

El concepto de ciclo vital

El concepto ciclo vital es ampliamente usado dentro del campo de la GDI, tanto para referirse al proceso de investigación y sus diferentes fases, como a las etapas asociadas a la creación, uso, difusión y preservación de los datos.

Diversos autores e instituciones han creado distintas representaciones para entender el ciclo vital de los datos de investigación, identificando sus respectivas etapas. A pesar de estas diferencias, todas comparten la visión de los datos como un conjunto dinámico que va cambiando a lo largo de la investigación, como consecuencia de su utilización y análisis y según de los propósitos que a los que sirven durante y después concluida la investigación.

A continuación presentamos algunas de estas visiones en torno al ciclo vital de los datos de investigación.

El ciclo de la investigación y de los datos

Toda investigación tiene un ciclo vital. Podemos decir que esta atraviesa, en términos genéricos, siete momentos o fases:

  • Concepción inicial
  • Planificación
  • Creación de la propuesta de investigación
  • Comienzo de la investigación
  • Recolección de datos
  • Finalización de la investigación

En la medida que la investigación transita entre estas etapas, las actividades asociadas al manejo y uso de los datos van cambiando.

A continuación, presentamos una forma de ver cada una de las etapas de manejo de los datos desde el punto de vista del investigador, articulada originalmente por la organización DataONE (Data Observation Network for Earth)

Fase 1: Planificar

Mientras se crea la propuesta de investigación, se identifica y describe qué datos serán compilados, como se manejarán durante la investigación y cómo se dará acceso a ellos.

Algunas preguntas que deberán responderse son ¿qué datos se recolectarán a través de que técnicas o instrumentos? ¿Qué infraestructura será necesaria para su manejo? ¿Cómo se organizarán los datos? ¿Qué formatos se utilizarán? ¿Cómo se manejarán sus versiones? ¿Cómo se describirán? ¿Qué recursos serán necesarios? ¿Cómo se preservarán y cómo se compartirán los datos?

Fase 2: Recolectar

Los datos son recogidos de forma manual o a través de instrumentos, y se almacenan en formato digital. El proceso de recolección de datos seguirá lo estipulado en el Plan de Gestión de Datos, de manera de asegurar su calidad y utilidad. Junto con la recolección de datos, se deberá crear y almacenar información descriptiva que será necesaria para su posterior recuperación. 

Fase 3: Controlar la calidad

A través de verificaciones e inspecciones, se asegura que los datos sean de calidad. El control se realiza tanto en la recolección como en el ingreso y análisis de datos, detectando errores o potenciales problemas para encontrar soluciones oportunas.

Fase 4: Describir

Los datos se describen de forma precisa y completa, utilizando estándares de metadatos apropiados y validados por la comunidad científica más pertinente. El describir datos permitirá que luego se cuente con la información necesaria para comprensión, utilización y reutilización. Algunos de los aspectos a describir son: su contexto digital (nombres, fechas de creación, software, procesamiento, etc.), personas y otros agentes involucrados en la recolección de los datos, el contexto científico (propósitos, técnicas o instrumentos utilizados, aspectos técnicos relevantes, etc.) y parámetros utilizados.

Fase 5: Preservar

Los datos son enviados a centros de datos o servicios de archivo para su almacenamiento y  preservación en el largo plazo. Para que ello sea posible, deberán haberse identificado aquellos datos que tienen valor en el largo plazo y la información descriptiva esencial para su acceso y reutilización. También será necesario considerar el marco normativo que sea relevante, considerando aspectos como la privacidad, el derecho de autor y el licenciamiento. Tampoco deberá olvidarse el proporcionar información necesaria para que quienes reutilicen o citen los datos conozcan su procedencia, condiciones de uso y puedan citarlos correctamente.

 

 

 

 

Fase 6: Descubrir

Se identifican y obtienen nuevos datos que son potencialmente útiles a la investigación, junto con información relevante de los mismos (metadatos). Estos conjuntos de datos podrán encontrarse en directorios o repositorios, que pueden ir desde un ámbito general (por ejemplo, en sitios de gobiernos) a otros más específicos (de una institución o de un área del conocimiento en particular) 

 

Fase 7: Integrar

Los datos obtenidos desde distintas fuentes son combinados en un set de datos homogéneo que pueda ser utilizado en la investigación. La capacidad que se tenga de integrar sets de datos de fuentes diversas dependerá de su calidad e interoperabilidad, por lo tanto, está ligada al l uso de buenas prácticas y la apropiada documentación de los datos durante su manejo.

Fase 8: Analizar

Según sea el caso, podrán utilizarse diversas herramientas que permitan explorar, analizar y visualizar los datos, según los objetivos y métodos propuestos por cada  investigación.

Es importante considerar que, dependiendo del tipo de investigación, no necesariamente será necesario que se aborden todos los pasos mencionados (por ejemplo, podría no requerir fuentes externas de datos, haciendo innecesaria la integración), o algunos pasos podrían tener que realizarse más de una vez.

Ciclo de vida de los datos desde la perspectiva de la curatoría

El ciclo de vida de los datos también puede explorarse desde la perspectiva de quienes están a cargo de la curatoría y preservación de los datos. Puede tratarse de los mismos investigadores, pero también puede incorporarse la participación de unidades de apoyo del organismo de investigación respectivo.

El Digital Curation Center propone un modelo que incluye cuatro acciones que abarcan todo el ciclo vital de los datos, ocho acciones secuenciales  y tres acciones ocasionales para su gestión y preservación.

Son las actividades que se realizan en todo momento en el ciclo de curatoría de los datos y que son relevantes para otras acciones de tipo secuencial. Es recomendable que en su realización se involucren los diversos actores que tienen responsabilidades sobres las acciones secuenciales de la gestión de datos.

Estas actividades son:

  • Descripción y asignación de información de representación
  • Planificación de la preservación
  • Participación y vigilancia de la comunidad
  • Curatoría y preservación

Son acciones que se realizan de forma repetida en la curatoría de los datos, con el objeto de asegurar que se sigan buenas prácticas. No se realizan de forma secuencial una sola vez, sino que son la base de la cadena de curatoría de datos.  Las acciones secuenciales son:

  • Conceptualizar
  • Crear o recibir
  • Valorar y seleccionar
  • Ingesta
  • Acción de preservación
  • Almacenar
  • Acceder, usar y reutilizar
  • Transformar

Son acciones que interrumpen o causan la reordenación de las acciones secuenciales como resultado de una decisión. Estas acciones son:

  • Disposición
  • Revaloración
  • Migración

Fuentes utilizadas