Uno los aspectos que será necesario considerar desde el momento en que se planifique la investigación, es la forma en la cual se almacenarán los datos que serán generados o recopilados.
Al hacer esto, es importante tener en cuenta que los medios de almacenamiento y respaldo podrán variar dependiendo de las necesidades de los investigadores, y que las opciones utilizadas a lo largo del desarrollo de la investigación no necesariamente serán apropiadas para almacenar y dar acceso a los datos una vez que ésta haya finalizado.
Los medios de almacenamiento que se pueden utilizar no son excluyentes, por lo que pueden complementarse entre sí. Algunos de los tipos de solución más comunes que se pueden utilizar durante y después de la investigación son:
Las alternativas incluidas dentro del primer punto de la lista son recomendadas solo para ser utilizadas en el curso de la investigación, ya que no cuentan con las características necesarias para garantizar el acceso y preservación de los datos en el largo plazo, ni tampoco para ponerlos a disposición de otras personas más allá del grupo de investigadores.
Los dispositivos de almacenamiento internos o externos, tales como laptops, discos USB, CDs o cintas magnéticas son de bajo costo, pero presentan desventajas, tales como su rápida degradación en el tiempo, la velocidad con la que pueden quedar obsoletos, tasas de error relativamente frecuentes, limitado tamaño o riesgos de seguridad a los que puedan estar sujetos debido a su portabilidad. Se recomienda que su uso esté limitado al almacenamiento de copias (nunca archivos de datos maestros) y deberán siempre contar con un respaldo en medios más seguros.
Por otra parte, las unidades de almacenamiento en red pueden ser de gran utilidad a lo largo de la investigación, pero el acceso a los mismos está limitado a las personas que trabajan en la investigación, y tanto el espacio disponible como los riesgos a los que se encuentren sujetos variarán de institución a institución.
Solución de almacenamiento | Apropiado para trabajo con los datos | Apropiado para datos de alto valor de y alta reutilización | Debilidades | Fortalezas |
Almacén de datos individual o del proyecto | Si | No | Puede no satisfacer requerimientos de acceso de agencias de financiamiento y editoriales; sustentabilidad frágil; no cuenta con DOIs | Económico, rápido, fácil, conveniente |
Repositorio institucional | No | Si | Puede no estar optimizado para datos | Fiable, buena curatoría, sostenible, compatible con bibliometría (por ejemplo DOIs) |
Almacén de datos institucional | Si | Si | En algunos casos no permite la localización de datos | Fiable, sostenible |
Almacenamiento en la nube | Si | Depende de suficiencia en la descripción de los datos | Plataformas comerciales: Pueden estar condicionadas por problemas de ancho de banda o de seguridad de los archivos; menor control sobre el hardware donde están almacenados los datos | Respaldo automatizado, posibilidad de compartir y acceso a recursos económicos para procesar los datos almacenados |
Almacén de datos nacional | Si | Si | Altamente confiable, compatible con conjuntos de datos | |
Repositorio disciplinar | La calidad del apoyo financiero en el largo plazo es altamente variable | Permite la recuperación por parte de investigadores |
Cada vez con más frecuencia, personas e instituciones están optando por utilizar servicios de respaldo en línea, utilizando servicios en la nube. Ante esta alternativa, es importante considerar sus ventajas y desventajas y estudiar de qué manera estas apoyan o difieren de las necesidades de la institución o grupo de investigadores.
Algunas de las ventajas son:
Algunas de las desventajas son:
Entrevistas a investigadoras de la CEPAL: Buenas prácticas de almacenamiento de datos (2017) (02:38)
Frente a una situación de pérdida o alteración de datos, el contar con un respaldo de los mismos permitirá reducir el impacto de este tipo de eventos sobre una investigación.
Algunas de las recomendaciones que se deben tener en cuenta al realizar respaldos son: