Descrevemos aqui para você a trilha de aprendizagem da Formação Cientista de Dados 4.0 (FCD 4.0). 

Essa Formação foi pioneira no Brasil e já capacitou milhares de alunos em todos os cantos do nosso país e ao redor do mundo. Agora na versão 4.0, o objetivo principal desta Formação é que o aluno desenvolva as habilidades em todo o processo de Ciência de Dados e Machine Learning, com foco na solução de problemas de negócio e com as ferramentas mais atuais do mercado.

Com tantas informações sobre a profissão de Cientista de Dados e seu crescimento exponencial nos últimos anos, é fácil se perder diante de tantos artigos e materiais com fórmulas mágicas sobre qual caminho seguir. Vamos fazer um alerta: não existe caminho fácil para se tornar um Cientista de Dados! É preciso estudar, aprender diferentes técnicas e adquirir conhecimento interdisciplinar. Por esse motivo, os Cientistas de Dados são bem remunerados e difíceis de encontrar no mercado.

As Formações da DSA são elaboradas de forma cuidadosa, com conteúdo orientado às necessidades do mercado de trabalho e com base em projetos.

A numeração dos cursos abaixo corresponde à sequência recomendada e você pode clicar no nome de cada curso para visualizar o programa de cada treinamento. O programa da Formação corresponde ao programa de todos os cursos que fazem parte da Formação.

Você recebe um certificado de conclusão para cada curso e ao concluir todos os cursos recebe o certificado de conclusão da Formação. Oferecemos a possibilidade de obter os certificados em português e inglês.

A Formação é composta de 6 cursos principais:

1. Matemática e Estatística Aplicada Para Data Science, Machine Learning e IA

Este curso proporciona aos alunos uma compreensão clara, direta e objetiva dos conceitos fundamentais que formam a espinha dorsal da Ciência de Dados, Machine Learning e Inteligência Artificial. Sua caminhada para uma carreira de sucesso como Cientista de Dados começa por aqui.

Começando com os fundamentos da Matemática, o curso mergulha em tópicos essenciais como vetores, matrizes, funções e derivadas, garantindo que os alunos tenham uma base sólida antes de avançar para conceitos mais complexos. A parte Estatística do curso explora desde a análise básica de dados categóricos e quantitativos até metodologias complexas de inferência estatística e testes de hipótese, abrangendo tanto técnicas paramétricas quanto não paramétricas.

Desenvolver habilidades em Matemática e Estatística é de suma importância no mundo da Ciência de Dados. O domínio dessas disciplinas permite que profissionais da área desenvolvam modelos mais precisos, façam previsões mais acuradas e entendam, de forma abrangente, as complexidades e nuances dos dados com os quais estão trabalhando. Além disso, ao compreender profundamente a teoria por trás dos algoritmos, os Cientistas de Dados podem otimizar soluções, personalizar abordagens e inovar em suas aplicações práticas.

Este curso é mais do que apenas uma jornada de aprendizagem; é um caminho para a excelência em Ciência de Dados, com teoria e prática aliados para proporcionar um aprendizado sólido.

2. Data Science Para Análise Multivariada de Dados

No cenário atual, onde os dados estão no centro das decisões em empresas de todos os setores, a habilidade de analisar conjuntos de dados complexos e multivariados não é mais do um diferencial, é uma necessidade básica. Este curso foi cuidadosamente projetado para fornecer uma compreensão profunda das técnicas essenciais de análise multivariada e, ao mesmo tempo, oferecer aplicação prática através de projetos incríveis.

Os projetos de análise multivariada sempre fizeram muito sucesso entre os alunos em diversos cursos aqui na DSA, pois a aplicação prática imediata é um fator que torna esse tipo de projeto especial.

Através de técnicas de Aprendizado Supervisionado, Não Supervisionado e Deep Learning, este curso é exclusivo sobre análise multivariada com 8 projetos realmente incríveis.

Este curso foi cuidadosamente projetado para fornecer uma compreensão profunda das técnicas essenciais de análise multivariada e, ao mesmo tempo, oferecer uma aplicação prática em diferentes áreas de negócio.

Começando com os fundamentos da análise multivariada, os alunos vão se aprofundar em métodos como regressão linear múltipla, análise de cluster, análise fatorial e PCA.

Mas o que realmente distingue este curso é sua abordagem prática. Cada capítulo é complementado por projetos de aplicação real em áreas de negócio como finanças, marketing, indústria e agronegócio. Esses projetos não só proporcionam uma oportunidade de aplicar o conhecimento adquirido, mas também de entender o impacto real e a relevância das técnicas em diferentes setores.

Ao final do curso, os alunos terão uma forte base teórica em análise multivariada e experiência prática em como aplicar esses conceitos para resolver problemas reais do mundo dos negócios.

3. Business Analytics e Machine Learning Para Projetos de Data Science

Este curso é uma verdadeira imersão de forma estruturada para equipar os alunos com habilidades profissionais em Análise de Negócios (Business Analytics) e Machine Learning, aplicados a projetos de Ciência de Dados. Confira abaixo o que preparamos para você!

Este curso é uma verdadeira imersão de forma estruturada para equipar os alunos com habilidades profissionais em Análise de Negócios (Business Analytics) e Machine Learning, aplicados a projetos de Ciência de Dados.

Através deste programa, os alunos desenvolverão uma compreensão profunda dos processos de modelagem de dados e da linguagem SQL, essenciais para a construção de uma fundação sólida em Data Science. Além disso, o curso fornece conhecimento prático sobre como analisar dados, descobrir insights e tomar decisões baseadas em evidências reais que impulsionam o sucesso dos negócios.

À medida que os alunos progridem, eles terão a oportunidade de aplicar os fundamentos de Business Analytics para estruturar estratégias e resolver problemas complexos do mundo real. Com uma abordagem hands-on, o curso cobre desde a compreensão do negócio até a entrega de resultados, utilizando algoritmos e modelos preditivos de Machine Learning para interpretar e prever tendências de dados. Os projetos práticos integrados ao curso foram cuidadosamente escolhidos para refletir desafios encontrados em várias áreas como marketing, varejo, recursos humanos, finanças, atendimento ao cliente, logística, agronegócio e indústria, garantindo que os alunos obtenham experiência relevante e aplicável em diversos setores.

O domínio de tecnologias e ferramentas para manipulação de Big Data Analytics, como Apache Hive e Apache Spark, bem como a criação de workflows automatizados com Airflow, são destacados para preparar os alunos para o manuseio e análise de dados em escala. Além disso, o curso enfatiza a importância da ética e da governança em Ciência de Dados, instruindo sobre como construir projetos responsáveis e alinhados com regulamentos de dados como a LGPD.

Ao final do curso, os alunos estarão aptos a criar dashboards de KPIs, estruturar projetos de Ciência de Dados, construir e avaliar modelos de Machine Learning, otimizar processos de negócios através de analytics e implementar soluções de Data Science que respeitam os princípios éticos e legais.

4. Modelagem de Séries Temporais e Real-Time Analytics com Apache Spark e Databricks

Neste curso você vai mergulhar no universo da análise de dados, explorando técnicas de modelagem de séries temporais e analytics em tempo real. Este curso foi desenhado para equipar os alunos com habilidades práticas e teóricas, permitindo-lhes aplicar Apache Spark e Databricks em uma variedade de contextos de negócios.

Desde a previsão de usuários ativos em websites até a otimização de cadeias de suprimentos e a análise de movimentações no mercado de ações, o curso cobre um amplo espectro de aplicações práticas. Os alunos aprenderão a manipular grandes volumes de dados, implementar modelos preditivos e realizar análises complexas com eficiência e precisão.

Através de uma abordagem hands-on, o curso guia os alunos através de projetos reais, como a análise e visualização de dados de vendas, previsão da demanda de energia elétrica em indústrias e monitoramento de tráfego de sites de e-commerce em tempo real.

Os alunos também serão desafiados a desenvolver soluções inovadoras para a detecção de anomalias em dados de sensores IoT e para modelar o crescimento de culturas agrícolas sob diferentes condições ambientais.

O projeto final envolve a criação de uma API para um web app de sistema de recomendação em tempo real, consolidando o aprendizado e demonstrando a aplicabilidade direta das habilidades adquiridas no curso.

Este curso é uma oportunidade única para aqueles que desejam avançar suas carreiras, dominando ferramentas de ponta em análise de dados e modelagem preditiva.

5. Cloud Computing Data Science (com Amazon SageMaker e Microsoft Fabric)

Vamos levar você para as nuvens! Cloud Computing Data Science é um curso projetado para que os alunos possam desenvolver habilidades profissionais na interseção entre a Ciência de Dados moderna e as soluções em nuvem fornecidas por gigantes da tecnologia como a Amazon Web Services (AWS) e Microsoft Azure.

A habilidade de manipular, analisar e extrair insights de grandes conjuntos de dados em ambientes de nuvem tornou-se um requisito indispensável para Cientistas de Dados que buscam a excelência no cenário atual de alta tecnologia.

Este curso levará você desde os fundamentos essenciais de cloud computing até o uso avançado de ferramentas como Amazon SageMaker e Microsoft Fabric, englobando a preparação, transformação e armazenamento de dados até o desenvolvimento, treinamento e deploy de modelos de Machine Learning, tudo mostrado passo a passo no já conhecido padrão de qualidade da Data Science Academy.

Você aplicará cada conceito em projetos práticos e labs desenhados para simular desafios do mundo real, equipando-se com o conhecimento para planejar, projetar e gerenciar infraestruturas de dados em nuvem eficientes e seguras.

O curso tem uma forte ênfase em “aprender fazendo”, onde você irá construir uma arquitetura de nuvem do zero, provisionar a infraestrutura necessária para treinar modelos de Machine Learning e desenvolver soluções reais como uma feature store para modelos de crédito bancário, um sistema de previsão de churn de clientes e uma API para reconhecimento de imagens de câmeras de segurança.

A experiência é completada com labs que incluem a criação de dashboards interativos usando o Power BI, a implementação de pipelines de dados com o Data Factory e a análise em tempo real de streams de dados para detecção de anomalias.

6. Storytelling, Dashboards e Técnicas de Apresentação Para Cientistas de Dados

Era uma vez um mundo de dados, onde números, estatísticas e algoritmos reinavam. No entanto, apesar de seu imenso poder, esses elementos muitas vezes se perdiam na tradução, não conseguindo transmitir suas histórias ricas e complexas para os tomadores de decisão.

Este curso foi criado para ser a ponte entre este reino de dados e o mundo real, capacitando os Cientistas de Dados a se tornarem contadores de histórias e comunicadores eficazes.

Ao longo deste curso, os alunos vão mergulhar nos fundamentos do storytelling, aprendendo como transformar informações brutas em narrativas envolventes e aperfeiçoarão suas habilidades em design gráfico e construção de dashboards, garantindo que suas histórias não apenas sejam ouvidas, mas também vistas e sentidas de forma impactante.

As sessões sobre princípios psicológicos e gatilhos mentais equiparão os alunos com ferramentas para fazer suas apresentações ressoar em nível emocional, enquanto o módulo sobre ferramentas No-Code irá capacitá-los a criar visualizações impressionantes sem a necessidade de programação.

Os projetos do curso garantem uma experiência prática, desde a criação de narrativas envolventes até a identificação e correção de erros em visualizações. Com a ajuda do ChatGPT, os alunos aprenderão a criar apresentações dinâmicas e aplicarão todo o seu aprendizado através de projetos incríveis.

Chegou a hora de elevar a capacitação de Cientistas de Dados a outro nível.


Os cursos acima são os cursos principais da Formação e obrigatórios para obter o certificado da Formação.

Como bônus oferecemos os cursos abaixo, que são opcionais e você pode fazer em qualquer ordem que desejar, quando quiser obter um conhecimento específico. Esses são os cursos de bônus:

  • Planejando sua Carreira para as Profissões do Futuro
  • Introdução à Lógica de Programação
  • Sistema Operacional Linux, Docker e Kubernetes
  • Governança de Dados
  • Soft Skills – Desenvolvendo Suas Habilidade Comportamentais
  • E-Gov Analytics
  • Machine Learning com JavaScript e Go
  • Data Science e Machine Learning com Linguagem Julia

Todos os cursos de bônus estão dentro de Cursos de Aperfeiçoamento Profissional – Bônus da Formação. Os cursos de bônus NÃO são obrigatórios para obter o certificado da Formação, mas cada curso de bônus também oferece certificado de conclusão em português ou inglês.

O que está esperando? Faça sua inscrição e comece agora mesmo:

Formação Cientista de Dados 4.0

Equipe DSA