¿Cómo crear un diccionario de datos?

Muchos profesionales de datos se sienten frustrados cuando crean algo nuevo pero el usuario no lo adopta. Una de las mejores maneras de hacer que la gente entienda tu proyecto y lo adopte es creando un diccionario de datos. Un diccionario de datos es un repositorio centralizado que ofrece información sobre el significado, formato, y origen de los datos. En esta publicación expandiré en por qué son importantes, cómo crearlos y compartiré recomendaciones sobre cómo usarlos a tu favor. 

¿Qué son los diccionarios de datos y por qué son importantes?

Los diccionarios de datos son un repositorios centralizados que contienen información sobre el significado, formato, y origen de los datos. Dependiendo del conjunto de datos, tu diccionario puede incluir:

  • nombres de los campos
  • tipo de campo
  • definiciones
  • restricciones
  • convenciones
  • relaciones entre los datos
  • fórmulas para calcular el campo
  • dónde se almacena
  • dato no inlcuidos
  • abreviaturas

Éstos nos ayudan principalmente en dos áreas 1) que el usuario entienda cómo utilizar nuestro producto de datos y 2) crear documentación que contribuya a la continuidad de nuestro proyecto si llegan personas nuevas el equipo.

¿Cómo crear un diccionario de datos?

1. Limpieza de datos:

Antes de crear el diccionario de datos, realiza una limpieza de datos. De esta manera, te puedes asegurar que los datos siguen formatos,convenciones y  estandares de calidad. Si te saltas este paso, el diccionario puede que no sea representativo de tus datos o no sea completamente útil.

2. Definir audiencia:

Puedes crear diccionarios para utilizarlo de manera interna en tu compañía o para compartirlo con usuarios externos. Dependiendo de tu audiencia tendrás que ocultar información confidencial o asegurar que el lenguaje sea adecuado para el usuario y sus conocimientos en el tema.

3. Seleccionar el tipo de diccionario:

Puedes crear diccionarios activos o diccionarios pasivos. La gran diferencia es que los diccionarios pasivos requieren mantenimiento. Por lo tanto, si es escoges un diccionario pasivo debes establecer procesos adicionales para el diseño y cómo o cuándo actualizarlo. Un ejemplo de un diccionario pasivo puede ser uno que se realiza en una hoja de cálculo y se actualiza manualmente.

4. Identificar términos:

Crea una lista de todos los términos que requieran una explicación. Pueden ser campos de datos, tipos de gráficas, fórmulas, entre otros.

5. Desarrollar definición para los términos: 

Algunas preguntas que te pueden ayudar a definir el término son:

  • ¿Cuándo se utiliza?
  • ¿Cuándo se actualiza?
  • ¿Quién es responsable?
  • ¿Cuáles son los valores aceptados?
  • ¿Qué incluye/no incluye?

6. Retroalimentación:

Antes de hacer público el diccionario de datos, identifica varias personas fuera de tu equipo para que te ofrezcan retroalimentación y sugerencias. Puedes hacerles las siguientes preguntas:

  • ¿Qué te gustó?
  • ¿Qué no te quedó claro?
  • ¿Qué te gustaría que esté mejor explicado?
  • ¿Tienes alguna idea sobre cómo mejorar este proyecto?

7. Publicación:

Una vez tu diccionario de datos está listo, debes asegurarte de que está accesible y de que comunicas al usuario sobre su existencia. Algunas opciones pueden ser: incluirlo como anejo en la descarga de un reporte, tenerlo vivo en una página web,  una pestaña en una hoja de cálculo, entre otros. Los diccionarios de datos son para compartirlos, así que toma un tiempo para planificar cómo diseminarlo.

8. Definir estrategia de mantenimiento

Escoge quién estará a cargo de actualizar el diccionario de datos. Esto incluye quién será responsable por atender cualquier solicitud de mejora o notificación sobre errores en el mismo. Una vez se identifique esa persona, define cada cuanto tiempo se debe revisar el diccionario para ver si requiere alguna actualización. 

Un consejo a la hora de crear un diccionario de datos

Puedes crear una plantilla de un diccionario de datos con todas las partes que usualmente incluyes. Luego, para cada proyecto, solo tienes que copiar la plantilla y eliminar lo que no sea pertinente para ese proyecto en particular. Eso te ayudará a ahorrar tiempo y mantener un estándar entre distintos productos de datos.

Conclusión

En conclusión, crear diccionarios de datos es una buena práctica que no solo ayuda a tu equipo de trabajo, si no que ayuda a que tu usuario final entienda y adopte tu proyecto. Además, convierte tu proyecto en un auto-servicio, lo cual significa que tu usuario puede consumir y utilizar los datos sin tener que consultarte. 

Accede a la plantilla

Sigue este enlace para acceder a una plantilla de un diccionario de datos.

Deja un comentario

Descubre más desde ¿Qué dicen los datos?

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo