Como sostiene el DCC “la motivación para citar datos surge del reconocimiento que los datos generados en el transcurso de una investigación son tan valiosos para el discurso académico como lo son las monografías y los artículos.” (Bal & Duke, 2015)
El citar apropiadamente los datos de investigación ofrece muchos beneficios para investigadores e instituciones de investigación. Por ejemplo:
Dar mayor publicidad a la investigación realizada
Recibir el debido crédito por su rol en la recolección de datos
Hacer un seguimiento del impacto de un determinado set de datos, a través de métricas que apliquen específicamente a este tipo de resultados de investigación
Potencialmente, recibir incentivos por la publicación y uso de los sets de datos, como ocurre con otros productos de la investigación académica
Asegurar que los datos puedan ser efectivamente localizados y, con ello, reutilizados por otros
Al vincular las publicaciones directamente con los sets de datos (tanto desde revistas académicas como en los repositorios de datos), dar sustento a las afirmaciones que se realizan en la investigación, advertir faltas y proveer información contextual necesaria para comprender un set de datos específico (documentación)
Existen dos mecanismos que deben ser utilizados al citar los datos de investigación dentro de una publicación académica. Primero, debe incluirse siempre una declaración sobre acceso a los datos, y luego, deben incluirse las referencias en texto que sean necesarias.
La declaración de acceso a los datos debe incluir:
Aunque algunas revistas exigen la ubicación de esta declaración dentro de una sección específica del artículo, podrían existir otros requerimientos o quedar al criterio de quien ha elaborado la publicación. En este último caso, puede ubicarse junto a mención de reconocimiento al organismo financiador.
A continuación damos algunos ejemplos de declaraciones de acceso a los datos, dependiendo del tipo de acceso que se trate:
Deben incluirse las citas al set de datos dentro del texto cuando sea necesario, estando éstas vinculadas a la entrada correspondiente de la lista de referencias, tal como ocurre en escritos académicos convencionales.
Aunque los elementos a consignar dentro de la referencia variarán según los requisitos de la publicación y las características del conjunto de datos, existen elementos convencionales que debería tener toda referencia:
Fuente: DCC, pp. 16-17
El estilo en el que se consignen estos elementos también variará dependiendo de los requerimientos del editor de la publicación. Por ejemplo, Dataverse genera automáticamente las referencias con la siguiente estructura:
Autor(es), Año, Título del conjunto de datos, Repositorio o archivo de datos, Versión, Identificador persistente global.
Fuente: Dataverse Project. (2015). Data Citation [Webpage]. Recuperado 3 de julio de 2017, a partir de http://best-practices.dataverse.org/data-citation/
En este caso, se recomienda que la referencia incluya tantos elementos como se posible, entre ellos:
Autor
Título
Fecha de depósito de datos en el repositorio respectivo, o de recolección, en aquellos casos en que el depósito aún se haya realizado
Adicionalmente, el estado del conjunto de datos (por ejemplo: depositado, bajo embargo, restringido, disponible) debe ser explicado en la declaración de acceso a los datos correspondiente.
FORCE11, comunidad interdisciplinaria que trabaja de forma conjunta por promover cambios en la forma en que se crea y comparte el conocimiento, creó en 2014 un set de 8 principios sobre la citación de datos:
Un identificador persistente (PDI) es una referencia duradera que se aplica a un recurso digital con el objetivo de proveer información necesaria para la identificación, verificación y ubicación de manera confiable de los datos de investigación, permitiendo evitar diferentes problemas de recuperación en el futuro. Un PDI también puede estar conectado a un conjunto de metadatos y no tan solo al elemento en sí.
Los PDI más considerados actualmente en el mundo científico es el identificador de objeto digital (DOI) y el Handle System, los cuales son aplicables a los datos para ser identificados de forma única, así también pueden ser utilizados en otras categorías de recursos digitales tales como publicaciones, software, flujos de trabajo, entre otros.
Los datos FAIR requieren disponer de un PDI, ya que si no es así, solo estarán almacenados en una institución o repositorio sin asegurar su ubicación, acceso, interoperabilidad y reutilización.
¿Cómo obtener un PDI?
Para que los datos sean accesibles y fáciles de encontrar, debe aplicar un PDI a sus datos y/o metadatos. Para esto, los recursos se pueden registrar en un repositorio de calidad o de confianza.
¿Por qué aplicar un PDI a los datos de investigación?
Un PDI aplicado a los datos garantiza que estos sean reproducibles y asegura su reutilización. Para esto es importante asignar un PDI a datos sin procesar, es decir, inmediatamente después de la recopilación de datos.
DataCite (s.f.). Welcome to Data Cite. Recuperado de https://datacite.org/