Naciones Unidas

Gestión de datos de investigación

¿Qué son los datos de investigación?

Antes de poner en práctica la gestión de datos, es necesario saber qué se entiende por datos de investigación.

En términos generales, podemos decir que los datos de investigación son datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales.

Sin embargo, es importante tener en cuenta que no existe una única definición, y que diferentes disciplinas o comunidades pueden diferir en su entendimiento de este concepto. Así, pueden haber grandes diferencias entre lo que constituye un dato para investigadores de la humanidades, de las artes o de las ciencias. En cualquiera de estos casos, es importante tener en cuenta que los datos pueden ser de tipo cuantitativo o cualitativo, y que pueden venir en muchos formatos y soportes, ya sean físicos o digitales.

Otras definiciones de datos de investigación

Hoja de Ruta LERU para Datos de Investigación

“Los datos de investigación, desde el punto de vista de la institución que tiene responsabilidad sobre el manejo de los datos, incluyen:

  • Todos los datos que son creados por investigadores  en el curso de su trabajo, y sobre los cuales la institución tiene una responsabilidad de curatoría, al menos durante el tiempo requerido por regulaciones relevantes de mantenimiento de registros y archivos
  • datos de terceras partes que han sido creados al interior de la institución o que provienen de otro lugar.”

Fuente: Ayris, P., Group, R. D. W., & others. (2013). LERU Roadmap for Research Data. Recuperado a partir de http://discovery.ucl.ac.uk/130535/2/AP14_LERU_Roadmap_for_Research_data_final.pdf 

 

Sabina Leonelli, University of Exeter, Exeter, UK

'Datos' es una categoría relacional aplicada a los resultados de la investigación que se toman, en momentos específicos de la investigación, para proporcionar evidencia de reivindicaciones de conocimiento de interés para los investigadores involucrados.

Los datos consisten en una forma específica de expresar y presentar la información que se produce y/o se incorpora en las prácticas de investigación para estar disponible como fuente de evidencia y cuya importancia científica depende del contexto en el que se utiliza.

No tienen valor de verdad en sí mismos, ni son representaciones directas de fenómenos dados. Más bien, los datos son objetos fungibles, que se definen por su portabilidad a través de diferentes contextos de uso y su utilidad prospectiva como evidencia.

The Australian Griffith University

"Los datos de investigación son registros concretos, que pueden tomar la forma de números, símbolos, texto, imágenes o sonidos, utilizados como fuentes primarias de investigación, que son comúnmente aceptados por la comunidad investigativa como necesarios para la validación de hallazgos de investigación.”

The University of Minnesota

"Los datos de investigación son datos en cualquier forma o soporte que se relacionan con o apoyan actividades de investigación, educativas o artísticas. Pueden clasificarse en: 

  • Datos primarios o sin procesar: información registrada en forma de notas, imágenes, encuestas en papel, archivos de computador, etc.
  • Datos procesados: análisis, descripciones y conclusiones preparadas en la forma de reportes o artículos.
  • Datos publicados: información distribuida a personas más allá de aquellas involucradas en la adquisición y administración de los datos."

Fuentes y tipos de datos de investigación

LEARN - Investigadoras de la CEPAL (2017, julio 13) - Fuentes y tipos de datos de investigación

Datos primarios y secundarios

MANTRA - John MacInnes (2012, mayo 4) - Datos primarios versus datos secundarios (active los subtítulos en español en YouTube) 

¿Cómo identificar tipos de datos de investigación?

  • Datos primarios o sin procesar: Datos originales que han sido recolectados pero aún no han sido procesados o analizados. Algunos ejemplos son los registros sonoros, observaciones, notas de campo o datos de experimentos.
  • Datos procesados: Datos que han sido digitalizados, traducidos, transcritos, limpiados, validados, verificados y/o anonimizados.
  • Datos analizados: Modelos, gráficos, tablas, textos u otros, que han sido creados a partir de los datos primarios y procesados, y que se pretende sean de ayuda en el descubrimiento de información útil, la presentación de conclusiones y la toma de decisiones.
  • Datos canónicos o de referencia: Sets de datos que pueden ser utilizados para validación, comparación o búsqueda de información (por ejemplo, secuencias del genoma humano, estructuras químicas o portales de datos espaciales)
  • Datos experimentales: Datos generados en experimentos científicos. Generalmente son reproducibles y pueden ser generados por equipos de laboratorio.  
  • Modelos o simulaciones: Datos generados en computadores por algoritmos, modelos matemáticos, o simulaciones de experimentos.
  • Datos derivados: Sets de datos creados al tomar datos ya existentes y realizar algún tipo de manipulación sobre los mismos.
  • Observaciones: Datos generados al registrar observaciones de un evento específico y posiblemente irrepetible, en un lugar y tiempo dados.

 

Algunos ejemplos son:

  • Documentos de texto electrónicos
  • Planillas de datos
  • Cuadernos de campo o anotaciones de laboratorio
  • Cuestionarios o transcripciones
  • Fotografías o películas
  • Registros sonoros
  • Muestras, artefactos, especímenes
  • Objetos digitales
  • Modelos, algoritmos, scripts
  • Bases de datos
  • Metadatos
  • Esquemas de metadatos
  • Configuraciones de software
  • Archivos de pre o post procesamiento de software

Algunos ejemplos son:

  • Textuales (Microsoft Wod, PDF, RTF, ODT, etc.)
  • Numéricos (Excel, CSV, etc.)
  • Multimedia (JPEG, MPEG, WAV, etc.)
  • Estructurados (XML, base de datos MySQL, etc.)
  • Código de software (Java, C, etc.)
  • Específicos de un software (Mesh, 3D CAD, modelo estadístico, etc.)
  • Específicos de una disciplina (FITS en astronomía, CIF en química, etc.)
  • Específicos de un instrumento (Olympus Confocal Microscope Data Format, Carl Zeiss Digital Microscopic Image Format)

Fuentes utilizadas