Série Spark e Databricks Parte 6 – DataFrameReader Para Leitura de Dados
Este é o sexto de uma série de artigos aqui no Blog da DSA sobre um dos melhores frameworks para processamento de dados de forma distribuída, o Apache Spark e sua utilização na nuvem com Databricks. Se está chegando agora, acesse o primeiro artigo da série aqui.
Essa série de artigos foi produzida por um dos alunos da DSA, Engenheiro de Dados, certificado em Spark e Databricks e matriculado em mais de 50 cursos em nosso portal. As informações de contato você encontra ao final do artigo.
Os artigos são de nível técnico e recomendamos alguma familiaridade com ambiente de processamento de Big Data antes de fazer a leitura. Temos uma introdução geral ao Apache Spark no curso gratuito Big Data Fundamentos e material completo no curso Big Data Real-Time Analytics com Python e Spark e Machine Learning e IA em Ambientes Distribuídos.
E esse artigo é uma aula completa sobre o DataFrameReader. Clique no link abaixo e confira:
DataFrameReader Para Leitura de Dados
Continuaremos no próximo artigo da série.
Artigo Produzido por: Thomaz Antonio Rossito Neto
Databricks Engineer with Apache Spark™ 3.0
MBA em Ciência de Dados com Big Data
MCSE: Data Management and Analytics Microsoft
MCSA: Data Engineering with Azure Microsoft
Contatos:
Site Pessoal: www.thomazrossito.com.br