Naciones Unidas

Gestión de datos de investigación

Documentación de los datos

Junto con manejar los datos de una investigación, es muy importante generar, preservar y dar acceso a toda la información que será necesaria para que estos puedan ser interpretados y reutilizados, ya sea por los mismos equipos de investigación que los han creado como por otras personas interesadas en el futuro.

Esta actividad, conocida como documentación de los datos, debiese comenzar una vez iniciada la investigación, y abordar aspectos tales como el contenido y estructura de los datos, su proceso de recopilación o creación, y las manipulaciones que han sido realizadas, entre otros.

La documentación de datos está relacionada al proceso de la creación de un PGD, ya que es aquí donde se documenta la recopilaciónalmacenamientoprocesamientoformas de compartir y eliminar los datos. Esta planificación permite que los datos sean FAIR, minimizando los riesgos de problemas técnicos, legales o prácticos a los que puedan estar asociados en una etapa posterior.

La planificación de la documentación de los datos es clave y básico para la totalidad del proyecto de investigación, si la documentación no es clara, los datos no son FAIR y no podrán ser interpretados. Así también, los elementos que deben ser documentados dependen del tipo de investigación, considerando los métodos de recopilación de datos, el libro de códigos, los protocolos de prueba, la configuración del dispositivo o procedimientos de laboratorio. En otros casos particulares, pueden ser considerados elementos adicionales.

La documentación bajo los principios FAIR permite al investigador, mostrar cómo se generaron los datos y con qué propósito, para ello se debe considerar toda la información necesaria con la intención asegurar estos objetivos.

Así también, publicar la documentación en un repositorio junto con sus datos de investigación, permitirá maximizar la reutilización de estos y aumentar la probabilidad de citas.

Las formas de documentación pueden variar según el tipo de investigación que se realice, y puede realizarse a través de diversas medios, desde cuadernos de laboratorio a reportes técnicos o publicaciones.

Para estimar las formas en que deberán documentarse los datos generados dentro de un proyecto, debe tenerse en consideración que se debe operar en tres niveles diferentes:

Niveles a considerar en la documentación de los datos

En este nivel, deben documentarse aspectos tales como:

  • Contexto de la investigación: historia del proyecto, propósito, objetivos e hipótesis, contribución al campo de estudio

  • Metodología empleada

  • Diseño de la muestra

  • Instrumentos, hardware, software utilizados

  • Protocolos, cuestionarios, instrucciones, guías de entrevistas

  • Resolución y escala de datos

  • Cobertura temporal y geográfica

  • Métodos de digitalización y transcripción

  • Estructura y relaciones de los ficheros de datos, número de casos y variables

  • Procedencia de los datos (cuando son derivados)

  • Procedimientos de aseguramiento y control de calidad, tales como procedimientos validación, prueba o limpieza de datos, detección de errores, calibración de instrumentos, edición, etc.

  • Modificaciones hechas a los datos a lo largo del tiempo e identificación de versiones cuando corresponda

  • Cambios en la metodología, variables, medidas, muestreo u otro, cuando se trata de estudios longitudinales

  • Información sobre confidencialidad, acceso y uso de los datos, cuando aplique

  • Información bibliográfica que indique cómo citar los datos de la investigación

En este nivel, deben documentarse aspectos tales como:

  • Relaciones entre tablas de la base de datos o ficheros del set de datos

  • Formatos

  • Relación con versiones previas o posteriores

Esta información puede registrarse mediante el uso de un fichero readme.txt

En este nivel, deben documentarse aspectos tales como:

  • Nombres, etiquetas y descripción de variables y valores

  • Cómo fueron operacionalizadas las variables

  • Explicación de códigos y esquemas de clasificación utilizados

  • Códigos y explicación de valores perdidos

  • Código, algoritmos o comandos usados para crear datos derivados

  • Explicación de ponderación y extrapolación de variables

  • Lista de ítems, individuos o casos estudiados

Fuentes utilizadas