Generalmente, a lo largo de una investigación se recopilan conjuntos de datos de diverso tipo, que pueden llegar a tener grandes dimensiones. Aún cuando los costos de almacenamiento disminuyen cada día, existen motivos que hacen necesario decidir qué datos preservar en el largo plazo (más allá de los límites de la investigación) y qué datos eliminar.
Debemos considerar, por ejemplo, que existen otros costos asociados a la mantención de los datos como, por ejemplo, el costo de los respaldos, de la gestión y de las acciones de preservación que serán necesarias para que los datos se mantengan accesibles a lo largo del tiempo. Por otra parte, no todos los datos generados dentro de una investigación tienen necesariamente el mismo valor o el mismo potencial de ser reutilizado en el futuro. Por último, la constante expansión del universo digital significa que deberán hacerse esfuerzos cada vez mayores recuperar conjuntos de datos dentro de grandes volúmenes de información. Es así como llegamos a la conclusión de que es importante tomar decisiones sobre la selección de datos.
Esta es una decision compleja que debe ser evaluada cuidadosamente por el equipo de trabajo, teniendo en cuenta factores tales como las necesidades de investigación, los requerimientos de las instituciones involucradas o los marcos normativos y la factibilidad y viabilidad económica de la preservación en el largo plazo.
El Digital Curation Center (DCC) ha sugerido una metodología de 5 pasos para que investigadores puedan decidir qué datos preservar y qué datos eliminar.