O Que é Data Quality e Por Que Isso é Importante?
Neste artigo vamos compreender o que é Data Quality e porque isso é importante.
Neste artigo vamos compreender o que é Data Quality e porque isso é importante.
No artigo anterior definimos o que é Linhagem de Dados. Agora trazemos para você algumas técnicas e exemplos.
A linhagem de dados é o processo de compreensão, registro e visualização de dados à medida que fluem das fontes de dados para o consumo. Isso inclui todas as transformações que os dados sofreram ao longo do caminho – como os dados foram transformados, o que mudou e por quê.
Compreenda o que é, a importância e os benefícios de um Catálogo de Dados.
Vamos compreender como cada elemento ajuda a formar o Data Blueprint – Estratégia de Lançamento de Produtos de Dados.
Este é o segundo de uma série de artigos no Blog da DSA sobre um dos melhores frameworks para processamento de dados de forma distribuída, o Apache Spark e sua utilização na nuvem com Databricks.
Este é o primeiro de uma série de artigos aqui no Blog da DSA sobre um dos melhores frameworks para processamento de dados de forma distribuída, o Apache Spark e sua utilização na nuvem com Databricks
Os dados são o ativo mais valioso de uma organização (mesmo que muitas ainda não vejam dessa forma), mas não podem ajudar, a menos que os tomadores de decisão os entenda e os controle.
O Apache NiFi é um sistema fácil de usar, poderoso e confiável para processar e distribuir dados, pois além da ingestão de dados, é capaz de transferir e gerenciar a transferência de dados entre fontes e sistemas heterogêneos.
Imagino que você já leu em várias fontes que uma das principais atribuições do Arquiteto de Dados é “criação de uma visão end-to-end do fluxo de dados / pipeline de dados”. Então chegou a hora de entender um pouco sobre esse tal de Pipeline de Dados.
O SAP HANA também fornece uma estrutura de desenvolvimento para criar aplicativos orientados a dados personalizados que usam, por exemplo, análise preditiva, anonimização de dados e serviços em tempo real, na nuvem e localmente.
Este é o sexto (e penúltimo) artigo da série Governança de Dados em Um Mundo Data-Driven: Desenvolvendo a Cultura Data-Driven Através da Governança de Dados.
Este é o quinto artigo da série Governança de Dados em Um Mundo Data-Driven. Como Deve Ser Um Sistema Ágil e Abrangente de Governança de Dados?
Se você combinar o armazenamento de objetos com um sistema de ingestão de dados “inteligente”, metadados valiosos poderão ser extraídos dos dados não estruturados. Este é o tema do quarto artigo da série Governança de Dados em Um Mundo Data-Driven.
Este é o terceiro artigo da série Governança de Dados em Um Mundo Data-Driven. Além de melhorar a segurança, a governança abrangente de dados facilita a conformidade (compliance), uma vantagem bem-vinda em tempos de regulamentações em expansão.