Ciência de Dados já é uma realidade em todo mundo. E a razão é simples. Usar dados para tomar decisões e prever comportamentos futuros traz uma séries de vantagens competitivas e as empresas estão percebendo isso, construindo cada vez mais uma cultura orientada a dados e montando equipes de Data Science.

E à medida a Ciência de Dados cresce, os desafios associados em construir uma arquitetura que permita extrair o melhor dos dados, cresce na mesma proporção.

  • – Analisar e modelar os dados é fundamental (papel do Cientista de Dados).
  • – Executar os pipelines de dados é fundamental (papel do Engenheiro de Dados).
  • – Construir um fluxo de aplicação de modelos preditivos é fundamental (papel do Engenheiro de Machine Learning).
  • – Desenvolver aplicações baseadas em Inteligência Artificial é fundamental (papel do Engenheiro de IA).
  • – Automatizar todo esse processo é fundamental (papel do Engenheiro Data Ops).

 

Mas quem vai olhar para tudo isso, planejando a integração com todos os demais sistemas da empresa e garantindo que os regulamentos de proteção aos dados estejam sendo seguidos? Entra em cena o Arquiteto de Dados.

E aí está uma das novidades em 2020 aqui na DSA: Formação Arquiteto de Dados

Um Arquiteto de Dados deve saber como:

  • – Projetar modelos de processamento de dados que implementem o modelo de negócios pretendido.
  • – Desenvolver diagramas representando as principais entidades de dados e seus relacionamentos.
  • – Gerar uma lista de componentes necessários para construir o sistema projetado.
  • – Analisar e Planejar a Governança de Dados.
  • – Analisar e Planejar a Gestão de Metadados.
  • – Projetar Pipelines de Dados.

 

Até recentemente, as organizações costumavam construir arquiteturas de formato bastante padrão e usando Data Warehouses. No entanto, as novas tecnologias alteraram drasticamente a maneira como as empresas coletam informações e atendem seus clientes. Em vez de reagir aos eventos após o fato, as empresas agora devem antecipar ou prever suas necessidades e as mudanças do mercado, como uma maneira de otimizar resultados e lucros. As empresas que não atualizarem seus repositórios de dados sofrerão uma redução gradual nos lucros devido à lentidão e ineficiência.

Mas já não temos o Engenheiro de Dados? Por que precisamos de um Arquiteto de Dados? Pela mesma razão que as empresas contratam Arquitetos de TI. Para planejar e projetar o sistema de forma ampla, e nesse caso relacionado a todo fluxo de utilização de dados na empresa. Engenheiro de Dados é um executor. Arquiteto de Dados é um planejador. É o Arquiteto de Dados quem vai projetar pipelines de dados, planejar a integração com todos os demais sistemas da empresa e garantir que os regulamentos de proteção aos dados estejam sendo seguidos.

Um Arquiteto de Dados é responsável pela estratégia de como resolver problemas de dados relacionados à integração e compliance. 

 

Na Formação Arquiteto de Dados serão 4 cursos e um projeto final:

Curso 1 – LGPD, Governança de Dados e Gestão de Metadados
Curso 2 – Modelagem de Bancos de Dados Relacionais, Não Relacionais e Data Stores
Curso 3 – Arquitetura e Integração de Processos ETL e ELT
Curso 4 – Design e Automação de Pipeline de Dados
Projeto Final

O curso 1 é voltado para um tema de extrema importante e ainda negligenciado: Governança. Neste curso o aluno aprenderá a construir um Plano Corporativo de Governança de Dados e um Plano de Gestão de Metadados, tudo alinhado com a LGPD, a Lei Geral de Proteção aos Dados no Brasil. Será um curso completo sobre o tema.

O curso 2 é sobre Modelagem de Dados para os 3 principais tipos de repositórios da atualidade: bancos relacionais, não relacionais e data stores (como Hadoop e Amazon S3). Usando ferramentas de modelagem, o aluno será colocado diante de diferentes cenários e então aprenderá como modelar os dados para cada cenário, escolhendo o tipo de armazenamento apropriado em cada situação.

O curso 3 é de ETL e ELT. Não se pode falar em arquitetura de dados sem falar em integração e os processos ETL são amplamente usados por quase todas as empresas. Usando ferramentas como Oracle Data Integrator, Pentaho e Apache NiFi, o aluno aprenderá como projetar processos ETL entre diferentes tipos de repositórios de dados.

O curso 4 é de Design e Automação de Pipelines de Dados. Usando ferramentas como Airflow, Dremio e Apache Kafka o aluno vai aprender a implementar estratégias de Enterprise Data Operations e Orchestration, um novo paradigma de gestão de dados, construindo fluxos de automação de coleta e consumos de dados, em lote e em tempo real.

No Projeto Final o aluno vai desenvolver um Plano de Enterprise Data Operations e Orchestration, detalhando cada etapa do processo e construindo fluxogramas para demonstrar os relacionamentos.

O lançamento acontecerá na primeira semana de Julho/2020 e será por turma fechada. Não há previsão de abertura de outra turma ainda este ano. Cadastre-se gratuitamente em nosso portal para ser avisado do lançamento em primeira mão.

Em todos os lançamentos na DSA, fazemos promoções incríveis e alunos de outros cursos pagos DSA recebem descontos especiais.


Acesse nosso catálogo, confira o material de capacitação que oferecemos, escolha seu curso ou formação e inicie seu treinamento agora mesmo, 100% online e 100% em português.

Cursos e Formações DSA