Você sabia que o “Engenheiro de Dados” é uma das funções que mais cresce em Ciência de Dados?

Atualmente, a maioria dos aspirantes a posições em Data Science ainda está focada em conseguir o cobiçado papel de Cientista de Dados. Mas o Engenheiro de Dados vem crescendo em popularidade (e necessidade) e para quem gosta mais de infraestrutura, esse pode ser um excelente caminho de carreira.

Em projetos de Ciência de Dados gasta-se cerca de 60 a 70% do tempo coletando, limpando e processando dados – trabalho que o Engenheiro de Dados pode ajudar com seu conhecimento em frameworks de armazenamento e processamento de Big Data, arquitetura e integração de dados. Rapidamente a Formação Engenheiro de Dados passou a ser uma das formações de maior sucesso aqui na DSA. 

E para ajudar você a iniciar sua caminhada, aqui está uma relação de 9 livros para quem está iniciando ou pensa em iniciar a carreira de Engenheiro de Dados. Confira.

1. Data Engineering Cookbook

CookbookCover

O e-book criado por Andreas Kertz tem estudos de caso elaborados, códigos, podcasts, entrevistas e muito mais. Consideramos que este é um pacote completo para quem está iniciando a caminhada como Engenheiro de Dados.

E o e-book é gratuito! Sim, você pode começar instantaneamente. Aprenda, pratique e prepare-se! Acesse aqui.

2. DW 2.0 – The Architecture for the Next Generation of Data Warehousing

dw2

Este livro descreve o futuro do data warehousing, tanto no nível arquitetural quanto no nível tecnológico.

O livro está bem estruturado e abrange a maioria dos tópicos relacionados à arquitetura de dados e seus desafios subjacentes, como você pode usar o sistema existente e construir um Data Warehouse em torno dele, e as melhores práticas para justificar os custos de uma maneira muito prática. Data Warehouse aliás é o primeiro curso da Formação Engenheiro de Dados, e os alunos aprendem a construir um DW localmente e em nuvem.

3. Agile Data Warehouse Design: Collaborative Dimensional Modeling, from Whiteboard to Star Schema

agile

Este é um ótimo livro. Lawrence Corr fornece um guia abrangente e passo a passo para capturar requisitos para um Data Warehouse e inteligência de negócios e convertê-los em modelos de alto desempenho usando uma técnica chamada model storming (model + brainstorming).

4. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling

dwkit

Que tal obter dados limpos e confiáveis? Com todo o valor comercial capturado e apresentado bem nos dados, você definitivamente desejaria modelos de dados precisos e robustos, alta agilidade de aplicativos e modelos bem projetados como resultado final.

Este livro é a terceira edição, é uma biblioteca completa de técnicas de modelagem dimensional atualizadas, a coleção mais abrangente de todos os tempos. Ele abrange novos e aprimorados padrões de modelagem dimensional de esquema em estrela, adiciona dois novos capítulos sobre técnicas de ETL, inclui matrizes de negócios novas e expandidas para 12 estudos de caso e muito mais.

5. Learning Spark

spark

Os dados estão sendo gerados em grandes volumes hoje, uma escala que só podemos imaginar. Muitos dados desempenham um papel vital no aumento da complexidade das operações e isso desencadeou novos desenvolvimentos no campo da engenharia de dados.

Este livro oferece um guia de referência valioso para todos os estudantes de graduação, pesquisadores e cientistas interessados em explorar o potencial dos aplicativos de Big Data. O objetivo final é obter os melhores dados para o o modelo de aprendizado de máquina. O Spark é o framework de processamento de dados mais eficaz para Big Data atualmente.

6. Spark: The Definitive Guide: Big Data Processing Made Simple

spark2

A Engenharia de dados é um campo multidisciplinar com aplicações em controle, teoria da decisão e a área quente emergente da bioinformática. Não existem livros no mercado que tornem o assunto acessível a não especialistas.

Portanto, se você está apenas começando e precisa de um bom livro para iniciar em engenharia de dados, o Spark, um framework de computação em cluster usado para processar, consultar e analisar Big Data, é a ferramenta que você deve aprender e este livro é um ótimo guia de referência. Toda a teoria e conceitos práticos são explicados de uma maneira amigável e fácil de entender.

Os cursos de Spark aqui na DSA estão entre os cursos de maior sucesso. Confira a lista completa aqui.

7. Big Data: Principles and best practices of scalable realtime data systems

Marz-BigData-HI.png

Este livro é para gerentes, consultores, especialistas, profissionais e qualquer pessoa interessada na avaliação de engenharia de dados.

8. Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable Systems

design

Os conceitos deste livro giram em torno da tarefa de coletar dados e destilar informações úteis. Cinco seções distintas abordadas neste livro são: Escalabilidade de dados, Consistência, Confiabilidade, Eficiência e Manutenção.

9. Big Data, Black Book: Covers Hadoop 2, MapReduce, Hive, YARN, Pig, R, and Data Visualization

bd

Se você deseja começar a aprender sobre ferramentas de engenharia de dados, este livro é uma leitura obrigatória. Ele abrange holisticamente todas as ferramentas que o ajudam a se envolver em estratégias de dados para obter uma vantagem competitiva.

Tornar-se um Engenheiro de Dados não é uma tarefa fácil. Requer uma compreensão profunda de ferramentas, processos e técnicas para poder extrair o melhor de qualquer dado estruturado / não estruturado. Por isso nosso programa de capacitação profissional, oferece 5 cursos práticos, onde o aluno monta os labs passo a passo, aprendendo a usar as ferramentas ao mesmo tempo que aprende os principais conceitos envolvidos em todo processo. É um programa de altíssimo nível, 100% online e 100% em português. Acesse e confira: Formação Engenheiro de Dados.

Referências:

9 Books Every Data Engineering Aspirant Must Read!

Popular 11 Data Engineer Books