Seguridad de los datos
Introducción
Este capítulo se centra en la gestión de datos. Examina las siete áreas que componen la gestión de datos, presenta una metodología para analizar la madurez de los datos dentro de una organización y ofrece una descripción de cada problema identificado. Por último, este capítulo propone una arquitectura robusta para asegurar cualquier tipo de datos producidos.
El DRAE define el térmido "dato" como:
dato
Del lat. datum 'lo que se da'.
1. m. Información sobre algo concreto que permite su conocimiento
exacto o sirve para deducir las consecuencias derivadas de un
hecho. A este problema le faltan datos numéricos.
2. m. Documento, testimonio, fundamento.
3. m. Inform. Información dispuesta de manera adecuada para
su tratamiento por una computadora.
Fuente : https://dle.rae.es/dato
Este capítulo se refiere a la representación convencional de la información para su tratamiento informático.
En general, es necesario formalizar la gestión de los datos en una empresa para poder -y éste es el objetivo último- añadirles valor. Los datos aislados, mal calificados, inexplicables y sin correlación no sirven para nada, salvo para contaminar el espacio de almacenamiento de las infraestructuras. Y si no aportan ningún valor añadido a la organización...
Gestión de datos
1. Gobernanza de datos
La gobernanza de datos (o gestión de datos o data management) es la definición de la organización encargada de los datos en el sentido más amplio; define claramente las funciones y responsabilidades de las partes interesadas y, por tanto, la estructura de comités asociada. Todos los datos deben pertenecer y ser útiles de forma coherente con la estrategia de la empresa.
Por ejemplo, en una empresa especializada en software de gestión de relaciones con los clientes, los datos de "Ventas mensuales de servicios" muestran un importe correspondiente a una categoría no identificada en el sistema de información. Tras analizarlo, parece que se trata de servicios de ciberseguridad (consultoría, pentests, etc.). Por tanto, es perfectamente legítimo preguntarse por qué los comerciales venden servicios que no forman parte de la estrategia de la empresa. Aunque estén obteniendo beneficios, están dedicando tiempo a seguir un rumbo diferente.
2. Arquitectura técnica del SI
La arquitectura técnica de los sistemas de información o, para ser más precisos, la arquitectura de datos de los sistemas de información, es el ámbito que permite cartografiar, identificar y modelizar los distintos componentes que intervienen en la utilización de los datos: recogida, transporte, almacenamiento, integración, acceso y puesta en común. Es todo el uso de los datos lo que hay que definir, su carné de identidad.
3. Conservación y archivo
El ámbito de la conservación y el archivo es esencial en el ciclo de vida de los datos: permite especificar...
El proyecto de datos
Al principio de todo proyecto, hay una historia, una visión, una estrategia, un objetivo... Y esto empieza con la definición de una simple nota marco, seguida del establecimiento de una carta de proyecto, que a menudo pretende ser de carácter general, aunque los objetivos deban quedar claros de inmediato.
1. Ejemplo de nota marco
"En un mercado competitivo, MiNubePerfecta ha optado por gestionar su actividad (comercial y técnica) mediante indicadores fiables y seguros, para poder tomar con eficacia todas las decisiones estratégicas y operativas necesarias, entendiendo que estas últimas se medirán a su vez varias veces al año para impulsar el progreso en todos los sectores de actividad.
Para ello, la Dirección General ha nombrado al Sr. X Vicepresidente de Datos con el fin de construir y ejecutar la política de gestión de datos a través de una valorización de 360 grados de los datos. De aquí a finales de 2023, un primer proyecto denominado "Data4Time" permitirá poner en marcha las primeras etapas de esta transformación de la gobernanza y la gestión de MiNubePerfecta. El Sr. X dependerá directamente del Director General".
Una política de este tipo es un documento estratégico de alto nivel que establece las principales directrices de gestión del área en cuestión: partes...
Organización del equipo de datos
Para cumplir los distintos requisitos que imponen los siete ámbitos de la gestión de datos, es preciso implantar una gestión organizativa con funciones claramente identificadas.
Generalmente, en las empresas privadas o públicas, existen divisiones de negocio responsables de la producción de los servicios empresariales prestados a los clientes/usuarios, según el sector de actividad, y una división de sistemas de información responsable de la función de recursos informáticos para todas las demás divisiones de negocio.
Centralizar la gestión de datos únicamente en el Departamento de TI es un error frecuente, ya que supone no implicar a los demás departamentos en el proyecto de datos, que por definición pretende ser global. El Departamento de TI encarna el dominio tecnológico de la gestión de datos y el mantenimiento de la plataforma de datos en condiciones operativas, pero en ningún caso es el propietario de los datos de negocio y, por tanto, de la calidad de esos datos.
Por eso parece esencial la organización de un "equipo de datos federado".
1. Comitología
El primer paso es crear un comité de dirección de datos (Comité responsable de Datos) responsable de patrocinar la gobernanza de datos dentro de la empresa. Trabaja a 360º para promover la cultura de datos y tomar las decisiones estratégicas definidas en la política de gestión de datos. Los miembros de este Comité responsable de Datos suelen ser el patrocinador, el vicepresidente de datos (Vice President), el director de datos (Chief Data Officer) y el director de información (CIO) como miembros permanentes, a los que se unen expertos (jefes de proyecto, analistas de datos, clientes, propietarios de productos, etc.) según sea necesario.
2. Los roles
a. División comercial
Se identifican tres funciones principales...
Metodología de gestión de proyectos de datos
Antes de lanzar cualquier proyecto de datos, conviene realizar una auditoría de las líneas de negocio para medir su nivel de madurez y elaborar un plan de acción adecuado. En efecto, de nada sirve lanzar un proyecto de repositorio de datos si el equipo no está aculturado en la materia o, peor aún, si los objetivos en términos de entregables no están claramente identificados. De hecho, es aconsejable subcontratar este servicio a empresas especializadas, para garantizar que la cartografía sea lo más neutral y objetiva posible. Un buen estudio consta de varias fases:
-
Fase 1: Entrevista con el CIO
-
Fase 2: Entrevistas con las unidades de negocio
-
Fase 3: definición de objetivos generales (indicadores, hitos, entregables)
-
Fase 4: Madurez de los equipos y plan de progreso
-
Fase 5: definición de objetivos tácticos por unidad de negocio (sensibilización, formación, organización, lista de datos, etc.)
-
Fase 6: recomendaciones tecnológicas
Un entregable siempre se formaliza en términos de coste, calidad y plazo.
Medir la madurez de los datos
Para cada área de actividad de gestión de datos, se propone proporcionar un nivel de madurez utilizando una escala de medición de 0 a 4:
-
0: informado | 1: reactivo | 2: proactivo | 3: gestionado | 4: eficaz
Por ejemplo, en la organización MiNubePerfecta...
Diagrama de arquitectura MDM
En términos generales, una plataforma de Master Data Management (MDM) se compone de varios elementos cuyo único objetivo es garantizar una gestión eficaz de los datos a lo largo de todo su ciclo de vida. MDM permite reunir los datos de referencia de la empresa en un único lugar dentro de un repositorio único en el que estos datos están cualificados. Los siguientes elementos son invariables:
-
Productores de datos
-
Canalización de datos
-
Fuentes de datos heterogéneas (base de datos Oracle, hoja de cálculo Excel, archivo CSV, base de datos MongoDB, etc.)
-
Recogida de datos (ingestión/integración en MDM)
-
Datawarehouse, Datalake
-
Consolidación / enriquecimiento
-
Limpieza
-
Distribución
-
Datamart (almacén de datos específicos de la empresa)
-
Informes de BI (BO, PowerBI, etc.)
-
Capa de servicios compartidos
-
Seguimiento y control
-
Gobernanza de datos
-
Metadatos
-
Normas empresariales
-
Repositorio de datos (Maestro)
-
Calidad de los datos
-
Servicios de seguridad
-
Archivo y conservación
-
Consumidores de datos
Varios actores ofrecen plataformas listas para usar: Blueway, Informatica, Tibco, Riversand, Pimcore, SAP, Ataccama...
Fuente: https://www.gartner.com/reviews/market/master-data-management-solutions