La idea principal de la gestión de datos moderna es mejorar la generación de conocimientos empresariales basados en datos a partir de dos impulsores principales:
- Aportar agilidad al proceso de análisis de datos, a menudo a través de iniciativas de autoservicio que reducen los cuellos de botella de TI.
- Poner cualquier dato a disposición de los procesos analíticos.
Sin embargo, las organizaciones cuentan con una larga lista de aplicaciones y sistemas centrados en diferentes aspectos del negocio, desde la gestión de la cadena de suministro hasta la automatización del marketing, y una variedad de sistemas de datos, como almacenes, mercados y lagos de datos.
Este panorama complejo de datos debe gestionarse de forma eficiente para alcanzar los objetivos mencionados. Temas como la integración ágil de datos, el descubrimiento de datos, la seguridad y la gobernanza están a la vanguardia de cualquier estrategia de datos moderna.
Para aplicar eficazmente estos requisitos, las empresas han recurrido a dos enfoques diferentes:
- Estrategias de datos centralizadas basadas en la consolidación de datos físicos y
- Estrategias lógicas de datos basadas en la visión consolidada de los datos a través de sistemas dispares.
La arquitectura y la gestión lógica de datos permite el acceso a múltiples y diversas fuentes de datos y, al mismo tiempo, aparecen como una fuente “lógica” de datos para los usuarios. Se trata de unificar datos que se almacenan y gestionan en múltiples sistemas de gestión de datos, incluidas fuentes de datos tradicionales como bases de datos, almacenes de datos empresariales, lagos de datos, etc., y otras fuentes de datos como aplicaciones, archivos de big data, servicios web y la nube para satisfacer todos los casos de uso de análisis.
La gestión lógica de datos permite que prácticas como el descubrimiento, el acceso, la seguridad, la integración y el intercambio de datos se realicen a través de una representación lógica (o virtual) en lugar de hacerlo directamente en cada sistema de origen físico. Las prácticas lógicas de gestión de datos permiten la implementación consistente de políticas y prácticas para gestionar, integrar y utilizar los datos de una organización, independientemente de la naturaleza, ubicación y capacidades de cada sistema fuente.
Aunque los enfoques lógicos tienen claras ventajas, las organizaciones a veces necesitan emplear un enfoque monolítico para satisfacer una necesidad empresarial particular; ambos enfoques se pueden implementar juntos como parte de una estrategia general de gestión ágil de datos.
Perspectiva empresarial
- Un lugar para encontrar todos tus datos: una capa de datos lógica centraliza tus datos, lo que permite el acceso en tiempo real a todos los datos, incluidos los datos almacenados en las instalaciones y en la nube, con coherencia semántica.
- Vistas adaptadas a la empresa:
- con una capa de datos lógica, las organizaciones pueden crear fácilmente vistas de sus datos de autoservicio y adaptadas a su negocio. Esto se logra eliminando tecnologías, formatos, protocolos y detalles de ubicación de integración de datos tradicionalmente complejos, lo que hace que los datos sean más accesibles y fáciles de usar.
- Uso de datos mejorado: permite a los usuarios menos técnicos encontrar, acceder, integrar y compartir datos rápidamente. Permite que los expertos en la materia del negocio formen parte del proceso de modelado de datos y se reduzca el ciclo necesario para crear datos listos para usar.
Perspectiva de TI
- Datos en tiempo real: una capa de datos lógica permite a las partes interesadas acceder a los datos más actuales bajo demanda, en cualquier momento, en los formatos preferidos para admitir una amplia variedad de casos de uso empresarial. Las empresas ya no necesitan esperar a que se ejecute un lote nocturno para actualizar sus conjuntos de datos.
- Reducción de la dispersión y duplicación de datos: al eliminar la replicación innecesaria de datos con una capa de datos lógica, las organizaciones pueden aumentar la agilidad, mitigar el riesgo y reducir los costes.
- Cumplimiento de datos más rápido: las capas de datos lógicas permiten el aprovisionamiento acelerado de nuevos conjuntos de datos, lo que permite a las organizaciones mantenerse al día con los requisitos de datos en constante cambio.
- Seguridad y gobernanza centralizadas:
- con una única capa que abarca el acceso a todos los datos empresariales, hacer cumplir la seguridad y gestionar los controles de datos para cada usuario en todos los conjuntos de datos se vuelve mucho más fácil.
Para implementar con éxito una arquitectura lógica de datos y un enfoque de gestión, las organizaciones solo necesitan una capacidad:
La virtualización de datos es una tecnología de integración y gestión de datos que aprovecha los metadatos para permitir que las organizaciones accedan a todos los datos empresariales en tiempo real y descubran, cataloguen, aprovisionen, combinen, compartan y gobiernen datos para satisfacer una amplia variedad de casos de uso.