Naciones Unidas

Gestión de datos de investigación

¿Por qué seleccionar datos de investigación?

Generalmente, a lo largo de una investigación se recopilan conjuntos de datos de diverso tipo, que pueden llegar a tener grandes dimensiones. Aún cuando los costos de almacenamiento disminuyen cada día, existen motivos que hacen necesario decidir qué datos preservar en el largo plazo (más allá de los límites de la investigación) y qué datos eliminar.

Debemos considerar, por ejemplo, que existen otros costos asociados a la mantención de los datos como, por ejemplo, el costo de los respaldos, de la gestión y de las acciones de preservación que serán necesarias para que los datos se mantengan accesibles a lo largo del tiempo. Por otra parte, no todos los datos generados dentro de una investigación tienen necesariamente el mismo valor o el mismo potencial de ser reutilizado en el futuro. Por último, la constante expansión del universo digital significa que deberán hacerse esfuerzos cada vez mayores recuperar conjuntos de datos dentro de grandes volúmenes de información. Es así como  llegamos a la conclusión de que es importante tomar decisiones sobre la selección de datos.

Esta es una decision compleja que debe ser evaluada cuidadosamente por el equipo de trabajo, teniendo en cuenta factores tales como las necesidades de investigación, los requerimientos de las instituciones involucradas o los marcos normativos y la factibilidad y viabilidad económica de la preservación en el largo plazo.

¿Cómo seleccionar los datos de investigación?

El Digital Curation Center (DCC) ha sugerido una metodología de 5 pasos para que investigadores puedan decidir qué datos preservar y qué datos eliminar. 

  • Paso 1: Identificar los propósitos que los datos podrían cumplir
  • Paso 2: Identificar los datos que deben preservarse
  • Paso 3: Identificar los datos que deberían preservarse
  • Paso 4: Considerar los costos
  • Paso 5: Completar la evaluación de los datos

Paso 1: Identificar los propósitos que los datos podrían cumplir

¿Qué propósitos justifican la retención de los datos más allá del tiempo de ejecución de una investigación? Esta lista puede usarse para considerar el uso potencial de los datos en el futuro. Recuerda que no necesariamente habrá un único propósito, y que estos pueden vincularse de distinta manera con los diferentes tipos de datos que se generan en la investigación:

  • Verificación: permitir que otros sigan el proceso que ha conducido a los hallazgos publicados y, posiblemente, reproducirlos o verificarlos.
  • Análisis adicional: contar con la posibilidad de hacer nuevos análisis a  los datos. Por ejemplo, pueden utilizarse nuevos métodos o integrarse nuevas fuentes de datos para hacer un metanálisis, ya sea a través de nuevas colaboraciones o mediante el análisis de terceras personas.
  • Fortalecer la reputación académica: poder localizar los datos hará que estos tengan mayor visibilidad, lo que puede aumentar el número de citas a los hallazgos de investigación publicados.
  • Desarrollo de recursos comunitarios: publicar un conjunto de datos que tiene valor para un grupo de usuarios conocido. Por ejemplo, un set de datos de referencia, un banco de pruebas de métodos o una base de datos dentro de un campo específico.
  • Otras publicaciones: publicar un artículo sobre los datos (describiendo el qué, cómo y cuándo de las recolección de datos) contribuirá a la comunicación y el debate académico sobre la gestión de datos o su reutilización dentro de un campo del saber.
  • Aprendizaje y enseñanza: incorporar datos en un recurso de enseñanza/aprendizaje o participación pública para potenciar la interacción, aprendizaje o participación en la investigación.
  • Uso privado: encontrar los datos más fácilmente en los próximos años para alcanzar otros usos potenciales.

Documentos complementarios

Fuentes utilizadas