A ideia central do gerenciamento de dados moderno é melhorar a geração de insights comerciais orientados por dados com base em dois fatores principais:
- Trazer agilidade ao processo de análise de dados, geralmente por meio de iniciativas de autoatendimento que reduzem os gargalos de TI
- Disponibilizar qualquer informação para os processos analíticos
No entanto, qualquer organização possui uma longa lista de aplicativos e sistemas focados em diferentes aspectos do negócio, desde o gerenciamento da cadeia de suprimentos até a automação de marketing e uma variedade de sistemas de dados, como data warehouses, data marts e data lakes.
Esse complexo cenário de dados deve ser gerenciado com eficiência para atingir os objetivos mencionados acima. Tópicos como agile data integration, data discovery, segurança e governança estão na vanguarda de qualquer estratégia moderna de dados.
Para implementar efetivamente esses requisitos, as empresas recorreram a duas abordagens diferentes:
- Estratégias de dados centralizadas com base na consolidação de dados físicos e
- Estratégias de dados lógicos baseadas na visão consolidada dos dados em sistemas diferentes.
A arquitetura de dados lógicos e o seu gerenciamento permitem o acesso a fontes de dados múltiplas e diversificadas e, ao mesmo tempo, aparecem como uma fonte de dados "lógica" para os usuários. Trata-se de unificar os dados que são armazenados e gerenciados em vários sistemas de gerenciamento de dados, incluindo fontes de dados tradicionais, como bancos de dados, data warehouses corporativos, data lakes etc., e outras fontes de dados, como aplicativos, arquivos de big data, serviços da Web e a nuvem, para atender a todos os casos de uso de análise.
O gerenciamento lógico de dados permite que práticas como data discovery, acesso, segurança, integração e compartilhamento de dados sejam realizadas por meio de uma representação lógica (ou virtual) em vez de diretamente em cada sistema de origem física. As práticas de gerenciamento de dados lógicos permitem a implementação consistente de políticas e práticas para gerenciar, integrar e usar os dados de uma organização, independentemente da natureza, do local e dos recursos de cada sistema de origem.
Embora haja vantagens claras nas abordagens lógicas, as organizações às vezes precisam empregar uma abordagem monolítica para atender a uma necessidade comercial específica. Ambas as abordagens podem ser implementadas juntas como parte de uma estratégia geral de gerenciamento de dados ágil.
Perspectiva de negócios
- Um lugar para encontrar todos os seus dados: Uma camada de dados lógica centraliza seus dados, permitindo o acesso em tempo real a todos os dados, inclusive os armazenados no local e na nuvem, com consistência semântica.
- Visualizações otimizadas para os negócios: Com uma camada de dados lógicos, as organizações podem criar facilmente visualizações de seus dados que sejam fáceis de usar e de autoatendimento. Isso é feito eliminando as tecnologias de integração de dados, os formatos, os protocolos e os detalhes de localização tradicionalmente complexos, tornando os dados mais acessíveis e fáceis de usar.
- Aprimoramento da utilização de dados: Permitir que usuários menos técnicos encontrem, acessem, integrem e compartilhem dados rapidamente. Permita que os especialistas no assunto da empresa façam parte do processo de modelagem de dados e reduza o tempo de ciclo necessário para criar dados prontos para uso.
Perspectiva de TI
- Dados em tempo real: Uma camada lógica de dados permite que as partes interessadas acessem os dados mais atuais sob demanda, a qualquer momento, nos formatos de preferência, para dar suporte a uma ampla variedade de casos de uso corporativos. As empresas não precisam mais esperar por uma execução noturna do sistema para atualizar seus conjuntos de dados.
- Redução da dispersão e da duplicação de dados: Ao eliminar a replicação desnecessária de dados com uma camada lógica de dados, as organizações podem aumentar a agilidade, mitigar os riscos e reduzir os custos.
- Processamento de dados mais rápido: As camada lógica de dados possibilitam o provisionamento acelerado de novos conjuntos de dados, permitindo que as organizações acompanhem o ritmo dos requisitos de dados em constante mudança.
- Segurança e governança centralizadas: Com uma única camada que abrange o acesso a todos os dados corporativos, a aplicação da segurança e o gerenciamento de controles de dados para cada usuário em todos os conjuntos de dados tornam-se muito mais fáceis.
Para implementar com sucesso uma arquitetura lógica de dados e uma abordagem de gerenciamento, as organizações precisam de apenas um recurso:
A virtualização de dados é uma tecnologia de integração e gerenciamento de dados que utiliza metadados para permitir que as organizações acessem todos os dados corporativos em tempo real e descubram, cataloguem, provisionem, combinem, compartilhem e controlem dados para atender a uma ampla variedade de casos de uso.