Este libro es un auténtico manual práctico, dirigido a cualquier persona que tenga que trabajar con datos (directores de proyectos, CDO, arquitectos, ingenieros de datos o incluso Data Scientists), que desee ampliar sus conocimientos sobre la gestión de datos o que satisfaga necesidades puntuales en las operaciones que se deban llevar a cabo. El objetivo es presentar todos los conceptos y nociones útiles cuando esté involucrado en un proyecto de integración de datos. Cada capítulo se puede leer...
Este libro es un auténtico manual práctico, dirigido a cualquier persona que tenga que trabajar con datos (directores de proyectos, CDO, arquitectos, ingenieros de datos o incluso Data Scientists), que desee ampliar sus conocimientos sobre la gestión de datos o que satisfaga necesidades puntuales en las operaciones que se deban llevar a cabo. El objetivo es presentar todos los conceptos y nociones útiles cuando esté involucrado en un proyecto de integración de datos. Cada capítulo se puede leer independientemente de los demás y los ejemplos apoyan las afirmaciones del autor.
El lector comienza con una aclaración esencial de los diferentes conceptos que giran en torno a los datos. Esta introducción nos permite demostrar que los datos son un concepto más complejo de lo que pensamos. Posteriormente, el libro aborda el almacenamiento de datos, lo que conduce de manera natural a la noción de integración de estos datos y a sus impactos en el Sistema de Información.
Debido a que los datos son cambiantes, el autor establece los medios que se deben implementar para una gestión de datos efectiva. Esto permite al lector entender mejor cómo definir un marco que será controlado y gestionado y explicar cómo las empresas que implementan Data Fabric o Data Mesh pueden ofrecer servicios de datos relevantes. Posteriormente, el libro detalla los métodos de análisis y de visualización de datos que permiten detectar problemas en la calidad de los datos que seguidamente se tendrán que limpiar y transformar para aumentar el valor de la información confiable.
En última instancia, se invitará al lector a echar un vistazo al mundo de la IA. Los principios y conceptos principales en torno al Machine Learning y al Deep Learning se explican de forma sencilla para que el lector pueda entender mejor cómo funcionan los algoritmos gracias a los datos. Finalmente, el autor explica cómo funcionan las grandes arquitecturas de datos (Data Warehouse, Data Lake, MDM, Data Hub y EDI) detallando sus principios y sus diferencias.
1. Principios generales de cargar de un Data Warehouse
2. Modelización
3. Data Marts
4. Los cubos/OLAP
Data Lake
1. El lago de datos
2. Base tecnológica
3. ¿Lago o almacén de datos?
El repositorio (MDM)
1. Introducción
2. Arquitecturas MDM
a. Soluciones analíticas o de consolidación
b. Arquitecturas de tipo Registro
c. Soluciones de coexistencia
d. Soluciones centralizadas
3. Principales funciones del MDM multidominio
a. Modelización
b. Alimentación
c. Comunicación con sistemas externos
d. Gestión
e. Trazabilidad de los datos de origen
f. Histórico de datos
El Data Hub
1. Tipos de Data Hub
2. Tipos de almacenamiento
3. Centralización y modelización dedatos
EDI
1. Principios de funcionamiento del EDI
2. EDI y las organizaciones
3. Ventajas e inconvenientes
4. Servicios EDI
Resumen
Glosario
Introducción
Benoit CAYLA
Benoit CAYLA es ingeniero informático con más de 20 años de experiencia en la gestión y el uso de datos. Ha utilizado su experiencia para ayudar e inpulsar a una gran variedad de proyectos como la integración, gestión, análisis, la IA, implementación de soluciones MDM o PIM para varias empresas especializadas en datos (incluidas IBM, Informatica y Tableau). Estas experiencias tan enriquecedoras le han llevado a intervenir en proyectos de mayor escala, en torno a la gestión y valorización de datos, principalmente en sectores de actividad como la industria, la gran distribución, los seguros y las finanzas. Apasionado por la IA (Machine Learning, NLP y Deep Learning), el autor se unió a Blue Prism en 2019 y hoy trabaja como experto en datos/IA y procesos. Su sentido educativo y su experiencia le llevaron también a dirigir un blog en francés (datacorner.fr), destinado a mostrar cómo entender, analizar y utilizar los datos de la forma más sencilla posible.