Naciones Unidas

Gestión de datos de investigación

Control de versiones y nombres de archivos

Ejemplo de tabla de control de versiones

Control de versiones

El desarrollo de formas colaborativas de hacer investigación implica que, en muchas ocasiones, la información pueda ser manejada de forma simultánea por distintos investigadores y/o en diferentes locaciones. Es por este motivo que es importante mantener siempre un control de versiones que permita saber con certeza qué versión de un determinado archivo estamos utilizando y comunicar los cambios que hemos realizado dentro del mismo.

Para ello, debemos seguir buenas prácticas para el control de versiones. El UK Data Archive recomienda las siguientes:

  • Decidir cuántas versiones del archivo deben mantenerse, cuáles, durante cuánto tiempo y cómo serán organizadas.
  • Identificar las versiones más importantes que deben ser guardadas (hitos).
  • Identificar los archivos en una única forma, utilizando una convención para asignar nombres de forma sistemática.
  • Registrar las versiones y estado de un archivo, e.g. borrador, provisorio, final, interno, etc.
  • Registrar qué cambios se han hecho a un archivo cada vez que se crea una nueva versión.
  • Registrar las relaciones entre ítems cuando sea necesario, por ejemplo: las relaciones entre un código y el archivo de datos en el cual se ejecuta; entre datos y documentación asociada o metadatos; o entre múltiples archivos de datos.
  • Rastrear la ubicación de archivos, cuando estén almacenados en locaciones diferentes.
  • Sincronizar los archivos ubicados en diferentes locaciones de forma regular
  • Mantener un archivo maestro único en un formato apropiado para evitar problemas de control de versiones que puedan surgir cuando se trabaja en diferentes archivos de forma paralela
  • Identificar una única ubicación para el almacenamiento de los archivos que constituyen hitos y archivos maestros

Existen diferentes formas de registrar esta información, como por ejemplo registrando fechas, número de versión o estado del documento en el nombre del archivo, incluyendo tablas de control de cambios, o utilizando software especializados para ello.

Nombres de Archivos

Una convención para definir nombres es un conjunto de reglas que definen la forma en que se deben asignar identificadores a objetos digitales. El uso de prácticas consistentes a la hora de asignar nombres contribuirá a facilitar el acceso a los ficheros, al permitir que cada uno tenga un identificador único que lo diferencie de otros y que de señales de su contenido y estado.  

Aunque las convenciones deberán ser definidas por cada institución o grupo de trabajo, existen buenas prácticas que pueden utilizarse como base:

  • Fijar un número máximo de caracteres a utilizar, privilegiando los nombres breves cuando sea posible.
  • No utilizar signos especiales, tales como  ~ ! @ # $ % ^ & * ( ) ` ; < > ?. , [ ] { } ' ". Con frecuencia, estos son utilizados para fines específicos dentro de cada sistema operativo.
  • Utilizar solo caracteres alfanuméricos, a excepción de guiones (-) o barras bajas (_). No deben utilizarse puntos o dejarse espacios en blanco.  
  • Solo utilizar minúsculas. Esto ayuda a evitar conflictos cuando se migran objetos hacia un sistema operativo que sea sensible al uso de mayúsculas.
  • Procurar que el nombre sea autoexplicativo, conteniendo suficiente información descriptiva con independencia de su ubicación. Esto es importante ya que es probable que los archivos sean almacenados en nuevos espacios y no necesariamente se seguirá la estructura de carpetas utilizada originalmente. Esto permitirá, además, evitar duplicidad de nombres (lo que ocurre, por ejemplo, cuando el nombre de un archivo es solo un número -e.g. “001”)
  • Cuando se opta por incluir fechas, utilizar un formato consistente, como por ejemplo el propuesto por la norma ISO 8601 (AAAA_MM_DD o AAAAMMDD)
  • Al incluir números, anteponer ceros. Esto facilitará el ordenamiento de los archivos (por ejemplo, en vez de “1”, utilizar “001”)
  • Incluir un número de versión cuando sea necesario (por ejemplo V01, V02, etc.).  Cuando se trata de la versión definitiva, puede cambiarse el número por la palabra “final”.

Otro elemento que ayudará en facilitar el acceso a los conjuntos de datos y sus versiones será la adherencia a prácticas normalizadas para la estructuración de carpetas y ficheros. El USGS recomienda como buenas prácticas:

  • Organizar los datos por tipo y luego por actividad de investigación
  • Crear estructuras que no desciendan más allá de tres o cuatro niveles de carpetas
  • No almacenar más de 10 ítems dentro de cada carpeta

Fuentes utilizadas