Curso Gratuito – Sistema Operacional Linux, Docker e Kubernetes
Seja bem-vindo(a) a mais um curso bônus, gratuito e exclusivo, para os alunos das Formações da DSA: Sistema Operacional Linux, Docker e Kubernetes.
Seja bem-vindo(a) a mais um curso bônus, gratuito e exclusivo, para os alunos das Formações da DSA: Sistema Operacional Linux, Docker e Kubernetes.
Evite esses erros comuns de modelagem de dados para manter a integridade dos dados e confiabilidade do processo de análise.
No artigo anterior definimos o que é Linhagem de Dados. Agora trazemos para você algumas técnicas e exemplos.
A linhagem de dados é o processo de compreensão, registro e visualização de dados à medida que fluem das fontes de dados para o consumo. Isso inclui todas as transformações que os dados sofreram ao longo do caminho – como os dados foram transformados, o que mudou e por quê.
Compreenda o que é, a importância e os benefícios de um Catálogo de Dados.
Vamos compreender como cada elemento ajuda a formar o Data Blueprint – Estratégia de Lançamento de Produtos de Dados.
Este é o segundo de uma série de artigos no Blog da DSA sobre um dos melhores frameworks para processamento de dados de forma distribuída, o Apache Spark e sua utilização na nuvem com Databricks.
Este é o primeiro de uma série de artigos aqui no Blog da DSA sobre um dos melhores frameworks para processamento de dados de forma distribuída, o Apache Spark e sua utilização na nuvem com Databricks
Os dados são o ativo mais valioso de uma organização (mesmo que muitas ainda não vejam dessa forma), mas não podem ajudar, a menos que os tomadores de decisão os entenda e os controle.
O Apache NiFi é um sistema fácil de usar, poderoso e confiável para processar e distribuir dados, pois além da ingestão de dados, é capaz de transferir e gerenciar a transferência de dados entre fontes e sistemas heterogêneos.
Imagino que você já leu em várias fontes que uma das principais atribuições do Arquiteto de Dados é “criação de uma visão end-to-end do fluxo de dados / pipeline de dados”. Então chegou a hora de entender um pouco sobre esse tal de Pipeline de Dados.
O SAP HANA também fornece uma estrutura de desenvolvimento para criar aplicativos orientados a dados personalizados que usam, por exemplo, análise preditiva, anonimização de dados e serviços em tempo real, na nuvem e localmente.
Este é o sexto (e penúltimo) artigo da série Governança de Dados em Um Mundo Data-Driven: Desenvolvendo a Cultura Data-Driven Através da Governança de Dados.
Este é o quinto artigo da série Governança de Dados em Um Mundo Data-Driven. Como Deve Ser Um Sistema Ágil e Abrangente de Governança de Dados?
Se você combinar o armazenamento de objetos com um sistema de ingestão de dados “inteligente”, metadados valiosos poderão ser extraídos dos dados não estruturados. Este é o tema do quarto artigo da série Governança de Dados em Um Mundo Data-Driven.