Naciones Unidas

Gestión de datos de investigación

¿Por qué citar datos de investigación?

Como sostiene el DCC “la motivación para citar datos surge del reconocimiento que los datos generados en el transcurso de una investigación son tan valiosos para el discurso académico como lo son las monografías y los artículos.” (Bal & Duke, 2015)

 El citar apropiadamente los datos de investigación ofrece muchos beneficios para  investigadores e instituciones de investigación. Por ejemplo:

  • Dar mayor publicidad a la investigación realizada

  • Recibir el debido crédito por su rol en la recolección de datos

  • Hacer un seguimiento del impacto de un determinado set de datos, a través de métricas que apliquen específicamente a este tipo de resultados de investigación

  • Potencialmente, recibir incentivos por la publicación y uso de los sets de datos, como ocurre con otros productos de la investigación académica

  • Asegurar que los datos puedan ser efectivamente localizados y, con ello, reutilizados por otros

  • Al vincular las publicaciones directamente con los sets de datos (tanto desde revistas académicas como en los repositorios de datos), dar sustento a las afirmaciones que se realizan en la investigación, advertir faltas y proveer información contextual necesaria para comprender un set de datos específico (documentación)

¿Cómo citar datos de investigación?

Existen dos mecanismos que deben ser utilizados al citar los datos de investigación dentro de una publicación académica. Primero, debe incluirse siempre una declaración sobre acceso a los datos, y luego, deben incluirse las referencias en texto que sean necesarias. 

La declaración de acceso a los datos debe incluir:

  • La definición de qué datos están disponibles y en qué repositorio, o bien especificar qué persona debe ser contactada para solicitar acceso a los datos;
  • Una URL (idealmente debe ser un identificador persistente, por ejemplo un DOI) o la dirección de correo electrónico de la institución o departamento correspondiente (nunca una dirección de correo personal);
  • Una mención a la base legal o ética sobre la cual se restringen los datos, cuando aplique, y
  • Cuando los datos no estén disponibles de forma abierta, debe incluirse un enlace persistente a la información sobre condiciones que rigen el acceso a los datos.

Aunque algunas revistas exigen la ubicación de esta declaración dentro de una sección específica del artículo, podrían existir otros requerimientos o quedar al criterio de quien ha elaborado la publicación. En este último caso, puede ubicarse junto a mención de reconocimiento al organismo financiador.

 A continuación damos algunos ejemplos de declaraciones de acceso a los datos, dependiendo del tipo de acceso que se trate:

  • “Todos los datos creados en esta investigación están disponibles en el archivo de la Universidad del Valle en [enlace persistente] bajo licencia Creative Commons Atribución 3.0”
  •  “Este estudio ha sido elaborado en base a los datos que están disponibles de forma pública en [incluir enlace persistente]. Mayor información sobre el procesamiento de datos disponible en el Archivo de la Universidad del Valle en [enlace persistente]”
  • “Esta publicación ha sido elaborada en base múltiples conjuntos de datos que se encuentran disponibles de forma abierta en las ubicaciones citadas en la sección de referencias”
  •  “Los datos que apoyan esta investigación están disponibles a petición de las personas interesadas. Por favor solicitar acceso a dependencia@institución.com”

Deben incluirse las citas al set de datos dentro del texto cuando sea necesario, estando éstas vinculadas a la entrada correspondiente de la lista de referencias, tal como ocurre en escritos académicos convencionales.

Aunque los elementos a consignar dentro de la referencia variarán según los requisitos de la publicación y las características del conjunto de datos, existen elementos convencionales que debería tener toda referencia:

  • Autor: Persona que ha creado el conjunto de datos
  • Título: Título del conjunto de datos y del recurso que está siendo citado. Puede incluirse la mención a la colección a la cual pertenece el conjunto de datos
  • Fecha de publicación: La fecha más tardía, de entre la fecha en que los datos se han puesto a disposición, aquella en la que se completaron los procedimientos de control de calidad o la cual en la que ha finalizado el embargo, si es que fuese el caso.
  • Ubicación: URL persistente de la ubicación donde el conjunto de datos está disponible.
  • Editorial: Organización donde se alojan los datos o que realiza el control de calidad.

Fuente: DCC, pp. 16-17

El estilo en el que se consignen estos elementos también variará dependiendo de los requerimientos del editor de la publicación. Por ejemplo, Dataverse genera automáticamente las referencias con la siguiente estructura:

 Autor(es), Año, Título del conjunto de datos, Repositorio o archivo de datos, Versión, Identificador persistente global.

Fuente: Dataverse Project. (2015). Data Citation [Webpage]. Recuperado 3 de julio de 2017, a partir de http://best-practices.dataverse.org/data-citation/

Citar datos de investigación

Cita tus datos de investigación

Infografía elaborada por CRUE Universidades Españolas (2016)

¿Cómo citar datos que no han sido publicados?

En este caso, se recomienda que la referencia incluya tantos elementos como se posible, entre ellos:

  • Autor

  • Título

  • Fecha de depósito de datos en el repositorio respectivo, o de recolección, en aquellos casos en que el depósito aún se haya realizado

Adicionalmente, el estado del conjunto de datos (por ejemplo: depositado, bajo embargo, restringido, disponible) debe ser explicado en la declaración de acceso a los datos correspondiente.

 

Principios sobre la citación de datos de investigación

FORCE11, comunidad interdisciplinaria que trabaja de forma conjunta por promover cambios en la forma en que se crea y comparte el conocimiento, creó en 2014 un set de 8 principios sobre la citación de datos:

1. Importancia

Los datos debiesen ser considerados productos de investigación legítimos y citables. Se debe dar a las citas de datos la misma importancia que a otros objetos de investigación académica, tales como las publicaciones.

2. Crédito y atribución

Las citas de datos debiesen facilitar el dar crédito académico y atribución legal y normativa a todos quienes contribuyen a los datos, reconociendo que un único estilo o mecanismo de atribución puede no ser aplicable a todos los datos.

3. Evidencia

En la literatura académica, donde y cuando sea que se haga una afirmación basada en datos, los datos correspondientes deben ser citados.

4. Identificación única

Una cita de datos debe incluir un método persistente de identificación que sea procesable por computadora, globalmente único y utilizado ampliamente por una comunidad.

5. Acceso

Las citas de datos deberían facilitar el acceso a los datos mismos y a los metadatos, documentación, código y otros materiales asociados que sean necesario para que tanto humanos como máquinas puedan hacer un uso informado de los datos referidos.

6. Persistencia

Los identificadores únicos, los metadatos que describen los datos, y su disposición, debiesen persistir -aún más allá del ciclo vital de los datos que describen.

7. Especificidad y verificabilidad

Las citas de datos debiesen facilitar la identificación de, el acceso a, y la verificación de los datos específicos que dan sustento a una afirmación. Las citas o los metadatos de citas debiesen incluir información sobre la procedencia y fijeza de forma suficiente para facilitar la verificación de que la fracción de tiempo específica, versión y/o porción granular de datos recuperados subsecuentemente es la misma que fue originalmente citada.

8. Interoperabilidad y flexibilidad

Los métodos para cita de datos debiesen ser lo suficientemente flexibles para acomodar las prácticas variables en las comunidades, pero no debiesen diferir tanto como para que se vea comprometida la interoperabilidad y las prácticas de cita de datos entre ellas.

Identificador persistente de datos

Un identificador persistente (PDI) es una referencia duradera que se aplica a un recurso digital con el objetivo de proveer información necesaria para la identificación, verificación y ubicación de manera confiable de los datos de investigación, permitiendo evitar diferentes problemas de recuperación en el futuro. Un PDI también puede estar conectado a un conjunto de metadatos y no tan solo al elemento en sí.

Los PDI más considerados actualmente en el mundo científico es el identificador de objeto digital (DOI) y el Handle System, los cuales son aplicables a los datos para ser identificados de forma única, así también pueden ser utilizados en otras categorías de recursos digitales tales como publicaciones, software, flujos de trabajo, entre otros.

Los datos FAIR requieren disponer de un PDI, ya que si no es así, solo estarán almacenados en una institución o repositorio sin asegurar su ubicación, acceso, interoperabilidad y reutilización.

¿Cómo obtener un PDI?

Para que los datos sean accesibles y fáciles de encontrar, debe aplicar un PDI a sus datos y/o metadatos. Para esto, los recursos se pueden registrar en un repositorio de calidad o de confianza.

¿Por qué aplicar un PDI a los datos de investigación?

Un PDI aplicado a los datos garantiza que estos sean reproducibles y asegura su reutilización. Para esto es importante asignar un PDI a datos sin procesar, es decir, inmediatamente después de la recopilación de datos.

Fuentes utilizadas