Naciones Unidas

Gestión de datos de investigación

¿Qué es la Gestión de Datos de Investigación?

La Gestión de Datos de Investigación (GDI) es el proceso activo de manejo de los datos generados en una investigación. La GDI se realiza de forma continua y cubre todas las decisiones relacionadas con la gestión de los datos a lo largo de su ciclo vital, comenzando en la etapa de planificación de la investigación y abarcando su ejecución, la diseminación de sus resultados y la preservación de los conjuntos de datos de forma que estos sean precisos, completos, auténticos y fiables, y se mantengan accesibles y reutilizables a lo largo del tiempo.

Algunos de los aspectos que trata la GDI son:

  • Las formas y mecanismos de recolección de datos y la planificación de su uso;
  • la definición de formas de nombrar o identificar archivos de datos;
  • el aseguramiento de la calidad de los datos;
  • la documentación de los datos;
  • la creación o captura de metadatos;
  • la creación de vocabularios controlados;
  • la organización y estructuración de los conjuntos de datos;
  • el almacenamiento y respaldo;
  • la integridad, seguridad y privacidad de los datos;
  • el depósito de datos y su preservación a largo plazo;
  • la recuperación de datos;
  • el manejo de derechos asociados, y
  • la definición de los tiempos, formas y mecanismos utilizados para compartir los datos con colaboradores y con otras audiencias.

Taxonomía GDI Foster

Taxonomía GDI FOSTER. Imagen en inglés

Fuente: FOSTER. (s. f.). Task Definition. Recuperado 17 de diciembre de 2020, de https://www.fosteropenscience.eu/taxonomy/term/189

El contexto de la GDI

Los datos han sido desde siempre la materia prima fundamental para la investigación y el avance del conocimiento. Sin embargo, en los últimos años han aumentado las iniciativas que han situado a la creación, acceso, uso y preservación de datos como un eje más dentro del quehacer de las comunidades vinculadas a la investigación en diversas áreas del conocimiento.

Existen diversos factores que explican este desarrollo, como por ejemplo, el avance tecnológico en la últimas décadas y los cambios que ha implicado en la práctica científica. A continuación presentamos algunos de estos cambios y tendencias, que permitirán comprender mejor el panorama en el que se sitúa la GDI hoy. 

El avance tecnológico de las últimas décadas ha tenido un impacto notorio en el volumen de información existente, fenómeno que ha sido caracterizado como el diluvio de datos. En el campo de la investigación, el aumento en el volumen de datos disponibles tiene como origen principal el avance de las simulaciones gracias al uso de supercomputadoras, la realización de experimentos de gran escala y el desarrollo de sensores que son capaces de producir gran cantidad de datos de diverso tipo.

Ya desde principios de la década del 2000 se anticipaba que estos avances tendrían como consecuencia el desbordamiento de la capacidad de manejo de datos y el consiguiente desarrollo de nuevas formas de hacer ciencia, basadas en las redes y la colaboración, y la creación de infraestructuras tecnológicas para permitir el acceso a grandes volúmenes de datos, su procesamiento y visualización. Es en este contexto que vemos surgir el término e-ciencia o e-investigación, entendida como

“la ciencia de gran escala que será cada vez con más frecuencia realizada a través de colaboraciones globales distribuidas mediante la Internet. Típicamente, una característica de este tipo de empresa de colaboración científica es que requerirá el acceso a muy grandes colecciones de datos, recursos computacionales de gran escala y visualización de alto rendimiento para los usuarios científicos” (National e-Science Centre, The University of Edinburgh)

Los datos abiertos son datos que están disponibles para que cualquier persona o institución pueda acceder a ellos, utilizarlos y compartirlos. El propósito de esto es procurar mayores beneficios sociales, económicos y ambientales.

Según Open Data Handbook:

Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.

Dentro de esta definición se encuentran conceptos relevantes que determinan las características de los datos abiertos:

  • Disponibilidad y acceso: La información debe estar disponible, a un costo razonable, para su uso y reproducción de forma útil y modificable
  • Reutilización y redistribución: Los datos deben compartirse bajo términos que permitan su reutilización y redistribución, incluyendo la integración a otros conjuntos de datos.
  • Participación universal: Todos deben poder utilizar, reutilizar y redistribuir la información, sin discriminar según esfuerzo, personas o grupos.

La importancia de disponer los datos en abierto, es permitir la interoperabilidad entre diferentes conjuntos de datos. Esto permite el trabajo colaborativo entre sistemas complejos que se puedan orientar a desarrollar mejores productos y servicios.

Fuente: Open Knowledge Forundation. (s.f.). El manual de Open Data. Open Data Handbook. https://opendatahandbook.org/guide/es/

El volumen, riqueza y complejidad de los datos disponibles para investigación también han sido un elemento importante en lo que se denomina actualmente como Ciencia Abierta o Ciencia 2.0.

Según la OCDE,

“La ‘Ciencia Abierta’ se refiere a un abordaje de la investigación basado en un mayor acceso a los datos de investigación públicos, permitido por herramientas y plataformas de TIC y una más amplia colaboración en la ciencia, incluyendo la participación de no-científicos y, finalmente, el uso de herramientas alternativas de copyright para diseminar los resultados de investigación”

Ciencia Abierta es un concepto que engloba muchos componentes, incluidos la apertura, la colaboración, la comunicación y el uso de tecnologías para la ciencia. Su esfuerzo está orientado a transparentar y permitir el acceso al conocimiento bajo términos que permitan la reutilización, redistribución y reproducción de la investigación, tomando en cuenta todos los aspectos involucrados en el ciclo de vida de la investigación.

La Ciencia Abierta se enfoca en potenciar con mayor rigor, responsabilidad y reproducibilidad la investigación científica, permitiendo la participación, revisión, mejora y (re) uso de los conocimientos obtenidos. Es por esto que se basa en principios de inclusión, justicia, equidad y participación.

El concepto de “abierto” abarca varios aspectos de la ciencia. Open Definition lo define como la posibilidad de acceder, usar, modificar y compartir el conocimiento, con la salvedad de estar sujeto a medidas que preserven la procedencia y apertura. Así también, este concepto incluye, no tan solo los resultados de las investigaciones que se publican, si no también, implica a los datos de investigación, software o códigos, flujos de trabajo, ciencia ciudadana, recursos educativos y métodos de evaluación científica.

Actualmente, la ciencia abierta es fomentada por las academias de investigación e instituciones de financiamiento público con el fin de fomentar el crecimiento y la innovación social y/o económica.

Bajo este contexto, generalmente la ciencia abierta aplica licencias de derechos al acceso, las cuales son documentos legales que otorgan derechos a los usuarios relacionados a la reutilización y redistribución de un material bajo ciertas condiciones.

Si está interesado en profundizar más, FOSTER tiene disponible un curso en español titulado ¿Qué es la ciencia abierta? donde podrá entender qué es y porqué debería interesarle.

Así también, FOSTER y la Biblioteca Hernán Santa cruz desarrollaron una iniciativa en conjunto para traducir el documento "Open Science Training Handbook", dando como resultado el Manual de Capacitación en Ciencia Abierta, el cual busca acercar el tema de ciencia abierta al contexto latinoamericano.

El aumento en el volumen de los datos no solo ha sido importante dentro de la comunidad científica. Los gobiernos y el sector privado han estado liderando múltiples esfuerzos para manejar y utilizar los grandes volúmenes de datos generados en diversos ámbitos de la actividad humana, tanto por instituciones como por personas.

En 2014, Naciones Unidas publicó un reporte sobre el fenómeno que  denominó la Revolución de los Datos:

Los gobiernos, las empresas, los investigadores y los grupos de ciudadanos se encuentran
en una conmoción de experimentación, innovación y adaptación al nuevo mundo de los datos; un mundo en el que el volumen, el nivel de detalle y la velocidad de los datos son mayores que nunca. Esta es la revolución de los datos"

Señalando que los datos son el sustento para la toma de decisiones y la materia prima para la rendición de cuentas,  el mismo informe hace un llamado a los gobiernos a tomar acciones para conseguir que los datos alcancen su máximo potencial, siendo una herramienta para monitorear el progreso, hacer responsables a los gobiernos y avanzar en el desarrollo sostenible.

 

Fuentes utilizadas