Cientista de Dados – Por Onde Começar em 8 Passos
Ansioso por desbravar o universo da Ciência de Dados e não sabe por onde começar? Nós ajudaremos você. Preparamos um guia que vai ajudá-lo a compreender o que faz um Cientista de Dados e como iniciar sua preparação! Confira.
Vamos começar definindo o que é um Cientista de Dados:
Cientistas de Dados são uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos – e a curiosidade de explorar quais são os problemas que precisam ser resolvidos.
Eles também são um sinal dos tempos modernos. Cientistas de Dados não estavam no radar há uma década, mas sua popularidade nos anos recentes reflete como as empresas agora pensam sobre Big Data. Essa incrível massa de dados não estruturados já não pode mais ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar receitas – contanto que haja alguém que escave e desenterre insights empresariais que ninguém havia pensado em procurar. Entra em cena o Cientista de Dados.
Para a comunidade em geral, um Cientista de Dados é um desses “Magos de Dados”, que pode adquirir massas de dados de diversas fontes e então limpar, tratar, organizar e preparar os dados; e, em seguida, explorar as suas habilidades em Matemática, Estatística e Machine Learning para descobrir insights ocultos de negócios e gerar inteligência.
Os dados utilizados por um Cientista de Dados podem ser tanto estruturados (bancos de dados transacionais de sistemas ERP ou CRM, por exemplo) ou não estruturados (e-mails, imagens, vídeos ou dados de redes sociais). O Cientista de Dados cria algoritmos para extrair insights desses dados. Em seguida, cabe ao Cientista de Dados, apresentar estes dados, de forma que os tomadores de decisão possam utilizar o resultado da análise ao definir as estratégias empresariais ou mesmo para criar novos produtos ou serviços baseados em dados.
De acordo com Anjul Bhambhri, ex Vice Presidente de Big Data da IBM e atual Vice Presidente da Adobe, o Cientista de Dados é o profissional capaz de trazer a mudança para uma organização através da análise de diversas fontes de dados. Anjul Bhambhri escreve:
“Um Cientista de Dados representa uma evolução do papel de Analista de Negócios ou Analista de Dados. Estes profissionais possuem uma base sólida normalmente em ciência da computação, modelagem preditiva, estatísticas, matemática e análise de negócios. O que define o Cientista de Dados é a forte visão de negócios, juntamente com a capacidade de comunicar os resultados, tanto para os líderes de negócios quanto para seus pares, de uma forma que influencie como uma organização posiciona-se diante dos desafios do mercado”.
Com tantas informações sobre a profissão de Cientista de Dados e seu crescimento exponencial nos últimos anos, é fácil se perder diante de tantos artigos e materiais com fórmulas mágicas sobre qual caminho seguir. Vamos fazer um alerta: não existe caminho fácil para se tornar um Cientista de Dados! É preciso estudar, aprender diferentes técnicas e ter conhecimento interdisciplinar. Por esse motivo, os Cientistas de Dados são bem remunerados e difíceis de encontrar no mercado.
Abaixo, os 8 passos que consideramos fundamentais para a preparação de um Cientista de Dados:
Passo 1: Faça Uma Auto Avaliação
Este é o primeiro passo e acredite, é fundamental. Você, como profissional, precisa avaliar o momento atual da sua carreira e como pretende estar em 5 ou 10 anos. Se pretende seguir uma carreira em Analytics, seja como Cientista de Dados, Engenheiro de Dados ou Analista, precisa compreender quais são suas habilidades atuais, onde pretende chegar, avaliar os gaps e traçar um plano de ação.
O profissional pode vir de áreas como Estatística ou Ciência da Computação, sendo comum encontrar profissionais de outras áreas atuando como Cientistas de Dados (Marketing, Economia, Ciências Sociais, etc..). Mas independente da área de formação acadêmica, algumas características serão comuns a todos os profissionais que trabalham com Ciência de Dados:
Programação – Conhecimento de programação é necessário. Linguagens de programação como R, Python, Julia, Scala, Java, Rust, C++ são parte do arsenal de ferramentas utilizadas em Data Science. Mesmo outros pacotes de análise de dados, como SAS, Matlab, Octave, SPSS e até o IBM Watson Analytics, requerem conhecimento em programação, para se extrair o melhor de cada ferramenta. É a habilidade de programação, que permite ao Cientista de Dados colocar em prática sua criatividade e extrair dos dados respostas para perguntas que ainda não foram feitas. Se você já tiver conhecimento em programação, isso será uma vantagem. Caso não tenha experiência em programação, mas tenha uma boa noção dos conceitos envolvidos em programação de computadores, isso vai ajudar muito. Avalie de forma clara seu nível de conhecimento em programação. Nós oferecemos na DSA um curso gratuito para quem pretende começar em programação. Acesse e se inscreva hoje mesmo: Python Fundamentos Para Análise de Dados.
Pensamento Lógico – Cientistas de Dados usam o pensamento lógico para fazer análises. Programação requer lógica. Se você já possui esta habilidade, isso vai acelerar seu aprendizado em Data Science.
Habilidade com Números – Matemática é a base da Ciência de Dados. Programação de computadores, envolve habilidade com números. Os algoritmos de Machine Learning, são baseados em conceitos matemáticos. A Estatística, parte fundamental da Ciência de Dados, requer habilidade com números. Avalie suas características e na sua auto avaliação, verifique se esse item será um problema ou não.
Conhecimento em Banco de Dados – Em diversas fases do processo de análise de dados, interações com bancos de dados serão necessárias. Bancos de dados relacionais, Data Warehouses, bancos de dados NoSQL, Linguagem SQL. Todas estas tecnologias estão diretamente ligadas ao trabalho do Cientista de Dados e pelo menos sua compreensão será um ponto que poderá fazer diferença. Avalie se você compreende o conceito de banco de dados, entende as diferenças entre bancos de dados relacionais e NoSQL e como utilizar Linguagem SQL para consultas.
A esta altura, talvez você já esteja se perguntando: como você pretende que eu aprenda tudo isso? Aqui entra um dos conceitos mal interpretados sobre a profissão de Cientista de Dados. Acredita-se que este profissional precisa conhecer todas as ferramentas. Isso não é verdade e nem mesmo necessário. Escolha suas ferramentas e se especialize nelas. Por exemplo: conhecimento em Linguagem Python e banco de dados, permitirá fazer análises de grandes volumes de dados (Big Data). Você não precisa conhecer todas as linguagens de programação, bem como não tem que conhecer todos os bancos de dados. O mais importante é o pensamento lógico, esse sim indispensável (e esta habilidade talvez você já tenha). A tecnologia oferece ferramentas e nenhuma delas resolve sozinha 100% dos problemas, pois todas possuem suas limitações.
Ao fazer esta auto avaliação, será possível compreender seu nível atual de conhecimento e começar a pensar no plano de ação!
Passo 2: Prepare Seu Computador
Surpreso com este passo? Esta é a etapa onde você prepara seu ambiente de testes e não deve ser subestimada. Pode ser frustrante durante seu processo e aprendizagem, não ter o equipamento ideal para instalar softwares ou executar operações que requerem poder computacional.
A Ciência de Dados é computacionalmente intensa (isso não deve ser uma novidade para você!). Portanto, você precisa de um computador que permita processar seus scripts e aprender sobre análise de dados. Além disso, você vai precisar instalar ferramentas, interpretadores, pacotes office, etc…Para trabalhar com Ciência de Dados, um computador com 8GB de memória RAM, com um processador intel i5/i7/i9 ou equivalente é a nossa recomendação. Naturalmente, quanto maior a capacidade do seu computador, melhor! É possível também utilizar serviços como o Google Colab ou Amazon AWS e montar um ambiente virtual de trabalho.
Sistema Operacional – A decisão por qual sistema operacional utilizar é bastante pessoal e qualquer um dos 3 principais sistemas operacionais (Windows, MacOS e Linux) vai atender as suas necessidades. De qualquer forma, você poderá instalar máquinas virtuais com outro sistema operacional. Boa parte do framework de Data Science e Big Data, foi construída sobre plataforma Unix. Para um servidor Apache Spark (por exemplo), um servidor Linux é a melhor recomendação. Já para a parte de apresentação de dados, Microsoft Office e outras ferramentas de visualização podem depender de um sistema Windows. Não há uma regra aqui, mas para usuários mais avançados, um sistema Unix é recomendado. Para aqueles que se sentem mais confortáveis com o Windows, não há problema algum. Utilize o Windows como seu sistema operacional base e, se necessário, crie uma máquina virtual com Linux, se quiser processar arquivos com Apache Spark ou realizar outros testes.
Softwares – Independente da linguagem de programação que você escolher, você vai precisar instalar o interpretador e uma IDE (ambiente integrado de desenvolvimento). Se a sua escolha for pela Linguagem Python, por exemplo, além de instalar o interpretador, você poderá instalar o Visual Studio Code. O mesmo vale para outras linguagens de programação. É possível criar seus scripts de Data Science 100% online, via browser, usando o Jupyter Notebook. Mas nem sempre você pode estar online e ter suas ferramentas instaladas localmente vai trazer uma série de vantagens. Além disso, considere instalar:
- Editores de texto: Sublime, Atom, Notepad++
- Software para Máquinas Virtuais: VirtualBox, Parallels, Docker
- Git e Github: para criar seu portfólio de projetos em Data Science
- Suite Office: Microsoft Office, Libre Office
Com exceção do Microsoft Office, todas as demais ferramentas são gratuitas.
Passo 3: Estatística e Matemática
Conhecimentos de Estatística e Matemática fazem parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em regressão linear, regressão múltipla, clustering, Álgebra Linear, etc… Você precisa ser especialista em Estatística ou Matemática ou mesmo ter feito uma graduação nestas áreas? A resposta é não. Apesar dessas áreas permitirem uma compreensão mais abrangente, é possível aprender estes conceitos e aplicá-los, ao longo da sua jornada de aprendizagem em Data Science. Você não precisa aprender todos os tópicos relacionados à Estatística ou Matemática.
Existem muitas formas de aprender os conceitos de Estatística e Matemática aplicada e isso leva tempo. Para qualquer aspirante a Cientista de Dados a recomendação é aprender Estatísticas codificando, de preferência em Python, de forma que você possa aplicar imediatamente um conceito aprendido. Nada substitui uma graduação em Estatística ou Matemática claro, mas você pode aprender os conceitos que serão usados no seu dia a dia em Data Science, aplicando estes conceitos através de uma linguagem de programação. Data Science é uma área multi-disciplinar.
No fim deste artigo, você encontra alguns recursos indicados por nosso time de especialistas!
Passo 4: Cloud Computing
O aprendizado de Cloud Computing é essencial para um Cientista de Dados por várias razões:
Escalabilidade e Flexibilidade de Recursos: Cloud Computing oferece recursos computacionais escaláveis e flexíveis. Cientistas de Dados frequentemente trabalham com grandes volumes de dados e processos computacionalmente intensivos. A computação em nuvem permite ajustar facilmente a capacidade de processamento e armazenamento conforme necessário, sem a necessidade de infraestrutura física cara.
Acesso a Tecnologias Avançadas: Muitos provedores de serviços em nuvem oferecem tecnologias de ponta, incluindo aprendizado de máquina, analytics e bancos de dados otimizados para grandes conjuntos de dados. Isso permite que os Cientistas de Dados acessem ferramentas avançadas sem o custo ou a complexidade de configurá-las internamente.
Colaboração e Compartilhamento de Dados: A nuvem facilita a colaboração entre equipes, permitindo compartilhar conjuntos de dados, modelos e insights de maneira eficiente e segura. Isso é especialmente importante em ambientes onde as equipes estão distribuídas geograficamente.
Redução de Custos: A utilização de recursos de Cloud Computing pode ser mais econômica do que manter uma infraestrutura própria de TI. O modelo de pagamento conforme o uso permite que as organizações paguem apenas pelos recursos que utilizam, ajudando a reduzir os custos operacionais.
Acesso a Dados em Tempo Real e Análise em Grande Escala: A nuvem permite o processamento e análise de dados em tempo real, o que é fundamental para aplicações como detecção de fraude, monitoramento de redes sociais e análise de sentimentos. Além disso, ela suporta o processamento de grandes volumes de dados (Big Data), essencial para muitas aplicações em Data Science.
Segurança e Conformidade: Provedores de nuvem geralmente oferecem recursos robustos de segurança e conformidade, que são fundamentais para proteger dados sensíveis e cumprir regulamentações legais.
Aprendizado Contínuo e Atualização de Conhecimentos: O campo de Cloud Computing está em constante evolução. Aprender sobre as tecnologias e práticas atuais de cloud computing ajuda os cientistas de dados a se manterem atualizados com as tendências emergentes e melhores práticas na área.
Passo 5: Linguagem de Programação e Machine Learning
Existem diversas ferramentas de análise e o número de soluções não para de crescer. Mas a recomendação para quem está iniciando, é obter o conhecimento básico, antes de tentar usar ferramentas de análise ou pacotes comerciais, de forma a conseguir extrair o melhor destas ferramentas. Algumas linguagens de programação se tornaram ícones em Ciência de Dados, como Python e R, por diversas razões: são gratuitas, contam com uma comunidade ativa e crescente, já atravessaram o período de maturação, são amplamente utilizadas, tanto no meio acadêmico quanto no meio empresarial e se especializaram em Data Science.
Python – É uma linguagem de uso geral, que tem recebido nos últimos anos mais e mais módulos e pacotes para Data Science como Pandas, Matplotlib, Scikit-Learn, Stats Models e TensorFlow. Python é mais fácil de aprender em comparação a outras linguagens, tem uma comunidade ativa, muita documentação disponível (inclusive em português) e pode ser usada para outras atividades além de Data Science. Hoje é o padrão em Data Science, Machine Learning e IA.
Linguagem R – Linguagem estatística, que existe há mais de 30 anos. Sua capacidade de processar estatísticas de grandes volumes de dados e criar gráficos sofisticados é um diferencial. Mas a Linguagem R é mais complexa de aprender e recomendamos se dedicar a ela somente depois de estar proficiente em Linguagem Python.
Outras linguagens como Julia, Scala, Java e C++ também são muito utilizadas em Data Science, mas se estiver começando, opte pela Linguagem Python.
Se você já possui conhecimento em Matlab, Octave, Stata ou Minitab, saiba que seu conhecimento já pode ser utilizado em Data Science.
Uma dica importante: não tente aprender tudo! Selecione 2 ou 3 ferramentas e se dedique ao aprendizado delas de forma detalhada.
E claro, não dá para falar em Data Science, sem falar em Machine Learning.
Machine Learning (ou Aprendizado de Máquina) é uma das tecnologias atuais mais fascinantes. Você provavelmente usa algoritmos de aprendizado várias vezes por dia sem saber. Sempre que você usa um site de busca como “Google” ou “Bing“, uma das razões para funcionarem tão bem é um algoritmo de aprendizado. Um algoritmo implementado pelo “Google” aprendeu a classificar páginas web. Toda vez que você usa o aplicativo para “marcar” pessoas nas fotos do “Facebook” e ele reconhece as fotos de seus amigos, isto também é Machine Learning. Toda vez que o filtro de spam do seu email filtra toneladas de mensagens indesejadas, isto também é um algoritmo de aprendizado.
Algumas razões para o crescimento de Machine Learning são o crescimento da web e da automação. Isso significa que temos conjuntos de dados maiores do que nunca. Por exemplo, muitas empresas estão coletando dados de clicks na web, também chamados dados de “clickstream”, e estão criando algoritmos para minerar esses dados e gerar sistemas de recomendação, que “aprendem” sobre os usuários e oferecem produtos que muito provavelmente eles estão buscando. A Netflix é um dos exemplos mais bem sucedidos de aplicação de Machine Learning. Cada vez que você assiste um filme ou faz uma avaliação, o sistema “aprende” seu gosto e passa a oferecer filmes de forma personalizada para cada usuário.
Existem diversos algoritmos de aprendizagem de máquina, dependendo se a aprendizagem é supervisionada ou não supervisionada, tais como: Linear Regression, Ordinary Least Squares Regression (OLSR), Logistic Regression, Classification and Regression Tree (CART), Naive Bayes, Gaussian Naive Bayes, k-Nearest Neighbour (kNN), k-Means, Bootstrapped Aggregation (Bagging), Natural Language Processing (NLP), Principal Component Analysis (PCA), Principal Component Regression (PCR), BackPropagation e muito mais.
Cada algoritmo será ideal para determinado tipo de dado e de acordo com a análise pretendida. Não há necessidade de aprender todos os algoritmos. Mas é importante compreender os conceitos e como implementa-los. Daí a importância da Matemática e da Estatística.
Passo 6: Conhecimento de Negócios
Qual o objetivo da sua análise? Para que você vai coletar montanhas de dados e aplicar modelos de análise? Que problema você pretende resolver, analisando dados? O principal objetivo da Ciência de Dados é resolver problemas. As empresas não vão iniciar um projeto de Data Science, se isso não for relevante para o negócio. Portanto, o Cientista de Dados deve estar familiarizado com a área de negócio para a qual ele está iniciando um projeto, utilizando Data Science.
Normalmente o mercado interpreta de forma equivocada este requerimento para a profissão de Cientista de Dados, fazendo crer que o profissional precisa ser expert em determinado segmento de negócio. Mas aqui vale fazer algumas considerações importantes.
Primeiro, os profissionais de Business Intelligence sempre tiverem este requerimento, conhecer bem uma área de negócio, a fim de coletar os KPI’s (indicadores) e com isso prover soluções de BI que atendessem as necessidades do cliente. Isso não mudou, o que mudou foi a forma como a análise é feita, uma vez que o Big Data entrou na equação. Em segundo, dada a amplitude de projetos de Data Science e Big Data, dificilmente haverá um único profissional atuando e sim uma equipe de Data Science, normalmente liderada pelo Cientista de Dados. E no Data Science Team, diferentes perfis irão atuar, como por exemplo especialistas em segmentos de negócio.
A dica aqui é simples. Procure compreender a área de negócio na qual você pretende atuar como Cientista de Dados. Se vai trabalhar em uma mineradora por exemplo, quais são so principais indicadores? De onde vem os dados? Que problemas a empresa precisa resolver? Que tipos de dados devem ser analisados e correlacionados? Como técnicas de Machine Learning podem ser empregadas para melhorar o faturamento da empresa? Como a análise de dados permite oferecer um serviço melhor aos clientes? Cada área de negócio tem as suas particularidades e uma compreensão ampla disso, vai permitir um trabalho que realmente gere valor.
Passo 7: Storytelling, Técnicas de Apresentação e Visualização de Dados
Com a massiva quantidade de dados aumentando a cada dia, um grande desafio vem surgindo para aqueles responsáveis por analisar, sumarizar e apresentar os dados: fazer com que a informação gerada, possa ser facilmente compreendida.
E uma das tarefas mais importantes do trabalho do Cientista de Dados, é ser capaz de transmitir tudo aquilo que os dados querem dizer. E às vezes os dados querem dizer coisas diferentes, para públicos diferentes. Pode parecer fácil em princípio. Hoje temos à nossa disposição os mais variados recursos para apresentação e exatamente aí que está o desafio. Nunca foi tão fácil gerar tabelas e gráficos, com diferentes estruturas, formatos, tamanhos, cores e fontes. Os gráficos estão deixando de ser gráficos e se tornando infográficos. Ter um volume cada vez maior de dados à nossa disposição, não torna mais fácil a apresentação da informação gerada. Pelo contrário, torna a tarefa mais complicada. Quase uma arte.
Uma das tarefas do Cientista de Dados, é apresentar seus resultados. Ninguém melhor que o profissional que faz a análise, desde a coleta, limpeza e armazenamento dos dados, até a aplicação de modelos estatísticos, para explicar seus resultados. Uma visualização efetiva de dados, pode ser a diferença entre sucesso e falha nas decisões de negócio. Particularmente, eu acredito que em breve, a capacidade de comunicar e contar as histórias dos dados, será uma das características mais valorizadas e buscadas pelas empresas. Técnicas de apresentação é um dos skills que fará a diferença na hora de contratar um Cientista de Dados, à medida que o conhecimento técnico estiver difundido.
O Cientista de Dados deve ser um contador de histórias e deve ser capaz de contar a mesma história de maneiras diferentes. O profissional que for capaz de unir as habilidades técnicas necessárias para análise de dados, com a capacidade de contar histórias, será um profissional único. Este é o verdadeiro conceito de unicórnio, atribuído aos Cientistas de Dados.
Diversas ferramentas possuem funcionalidades avançadas para visualização de dados: Tableau, QlikView, Microsoft Excel, Microsoft Power BI, Microstrategy, Weka, NetworkX, Gephi, bibliotecas Java Script (D3.js, Chart.js, Dygraphs), além de visualizações alto nível que podem ser feitas em Python ou R.
É importante não apenas estar familiarizado com uma ou mais ferramentas para visualizar dados, mas também os princípios por trás da codificação visual de dados e comunicação de informações.
Passo 8: Pratique!!
Não há outra forma de aprender qualquer que seja o assunto. É preciso praticar, testar, experimentar, cometer erros, aprender com eles, testar novamente e compreender que você estará em modo permanente de aprendizado.
Ufa. Se você chegou até aqui, parabéns! Agora você compreende melhor porque o Cientista de Dados é uma profissão em ascensão e porque sua remuneração está entre as maiores em qualquer pesquisa que se faça? Mas ainda não terminamos, continue sua leitura!
Erros que devem ser evitados ao longo da caminhada:
1- Achar que o aprendizado é fácil e rápido – Em nenhuma profissão, o aprendizado é rápido e fácil. Adquirir conhecimento e experiência requer tempo, esforço, investimento e bastante dedicação. Não caia nesta armadilha de achar que é rápido e fácil. Comece sua preparação hoje mesmo, mas esteja ciente que adquirir conhecimento leva tempo.
2- Aprender muitos conceitos ao mesmo tempo – Este é o erro mais comum. Por se tratar de uma área interdisciplinar, há normalmente a tendência em querer aprender muita coisa ao mesmo tempo. Não foque em quantidade e sim qualidade. Aprenda um conceito, consolide, pratique e só então avance para outra área de estudo. O começo será mais difícil, mas à medida que aprende e adquire experiência, o aprendizado de novas ferramentas fica mais fácil.
3- Começar por problemas muito complexos – A solução de problemas mais complexos em Data Science, requer tempo e experiência. Não tente fazer isso no começo da sua jornada.
4- Focar apenas na programação – Data Science não é apenas programação. Outros conceitos são tão importantes quanto. Estatística é importante. Visualização de dados e apresentação são importantes. Tenha seu foco em outras áreas e não apenas programação.
E como estudar?
Ouvimos esta pergunta com frequência aqui na Data Science Academy. Antes de investir em formação analítica, tome essas medidas para ter certeza de obter o valor real do seu investimento.
1. Defina Suas Metas
Como diz o ditado: “Quem não sabe para onde vai, qualquer caminho serve!”. Você fez a auto avaliação sugerida lá no início do texto? Qual foi o resultado? Quais são as áreas que você precisa se dedicar? Como será sua disponibilidade? Qual seu objetivo? Sei que são muitas perguntas, mas elas precisam ser respondidas, antes de definir sua trilha de aprendizagem.
2. Experimente
Enquanto você não executar um algoritmo de aprendizado de máquina em um dataset com milhões de registros, não criar um algoritmo de limpeza e transformação de dados, não coletar streaming de dados de redes sociais, você não vai compreender como as coisas funcionam. Experimente! Aprenda, faça, erre, faça novamente e quando você menos esperar, você vai ser capaz de analisar dados e contribuir para a empresa onde trabalha ou para seu próprio negócio.
3. Crie Seu Portfólio de Projetos
Criar um portfólio de projetos é fundamental para um Cientista de Dados por várias razões:
Demonstração Prática de Habilidades: Um portfólio permite aos Cientistas de Dados mostrar suas habilidades práticas, não apenas teóricas. Isso inclui competências em programação, análise de dados, visualização de dados, machine learning, entre outras.
Mostra Experiência com Dados do Mundo Real: Trabalhar com conjuntos de dados reais e resolver problemas reais demonstra a capacidade de lidar com as nuances e desafios que os dados do mundo real apresentam.
Personalização e Criatividade: O portfólio oferece uma oportunidade para os Cientistas de Dados expressarem sua criatividade e abordagem única para solucionar problemas. Eles podem escolher projetos que refletem seus interesses e especialidades, diferenciando-se de outros profissionais.
Evidência de Aprendizado Contínuo: Um portfólio em constante atualização mostra comprometimento com o aprendizado contínuo e a adaptação às novas tendências e tecnologias no campo da Ciência de Dados.
Facilita a Discussão Durante Entrevistas: Durante entrevistas de emprego, o portfólio serve como uma ferramenta concreta para discutir experiências passadas e abordagens específicas para resolver problemas. Isso pode ajudar os entrevistadores a entender melhor as habilidades e o estilo de trabalho do candidato.
Construção de uma Marca Pessoal: Um portfólio bem desenvolvido ajuda na construção de uma marca pessoal forte, destacando as competências e interesses únicos do cientista de dados.
Networking e Colaboração: Ao compartilhar projetos online, Cientistas de Dados podem atrair a atenção de colegas de profissão, potenciais empregadores e colaboradores, ampliando suas redes profissionais.
Validação de Conhecimentos e Competências: Projetos bem documentados e executados validam o conhecimento teórico e prático do Cientista de Dados, oferecendo uma prova tangível de suas competências.
Use as informações que você recolheu para selecionar opções de treinamento que ajudam você a alcançar seus objetivos, sem perder tempo e dinheiro.
Conhecimento em Ciência de Dados requer tempo e dedicação. O treinamento que você escolher deve ser um mix de fundamentação teórica, com prática e experimentação.
Recursos
Existem muitos recursos disponíveis para aprender Data Science e tantos recursos acabam gerando sobrecarga nos iniciantes, que podem perder o foco. Separamos aqui uma lista com as que consideramos as melhores fontes de aprendizagem em Data Science.
Blogs:
Data Science Central: http://www.datasciencecentral.com
KDD Nuggets: http://www.kdnuggets.com
Artigos sobre R: http://www.r-bloggers.com
Python Brasil: http://python.org.br
Ciência e Dados: http://www.cienciaedados.com
Estatística:
Statistics: http://www.statistics.com
Simply Statistics: http://simplystatistics.org
Machine Learning:
Deep Learning Book: http://deeplearning.net/
Deep Learning Book Brasil: https://www.deeplearningbook.com.br
Vídeos, Competições e Tutoriais:
Data Science for Social Goods: http://dssg.uchicago.edu
Kaggle: https://www.kaggle.com
Towards Data Science: https://towardsdatascience.com
Capacitação:
Data Science Academy:
www.datascienceacademy.com.br
Data Science Academy é o maior portal da América Latina 100% online e 100% em português, dedicado a Data Science, Big Data, Inteligência Artificial e capacitação para Cientistas de Dados. A Formação Cientista de Dados oferece ao aluno 6 cursos intensivos, 100% online e 100% em português e ainda um conjunto de cursos de bônus (exclusivo aos alunos da Formação) com dicas sobre como montar seu portfólio, como buscar oportunidades, além de dicas de carreira e desenvolvimento pessoal. Clique no link abaixo e confira o programa completo.
Formação Cientista de Dados 4.0
Esperamos que este guia possa ajudar você a entender um pouco melhor como se preparar e se tornar um profissional de Ciência de Dados. Faça da sua jornada de aprendizagem uma experiência prazeirosa e divertida! De qualquer forma o resultado será recompensador.
Equipe DSA





Magnífico
Formidável
Excellent
Dicas valiosas.
Excelente.
Que post incrível. Obrigada.
Incrivel.
Que material magnífico. Obrigado.
Excelente guia.
Que artigo incrível. Obrigado.
Ótimo
Olá! Gostei demais! uma pergunta sou contador e estou iniciando estudo em análise de dados para unir a minha área, posso começar a carreira como cientista de dados ou tenho primeiro que fazer e terminar analista de dados?
Olá José. Sim, você pode começar como Cientista de Dados se desejar.
Chegando hoje aqui na DSA, buscando transição de carreira. Sou professora de Matemática e Robótica, decidida a me tornar uma cientista de dados. Sei que o caminho é longo, mas o primeiro passo dou hoje!
Cada dia um degrau. sou grato pelo rico conteúdo. tenho aprendido cada dia mais. abraço equipe DSA.
Agradeço o artigo, penso em uma transição de carreira e definitivamente as informações do artigo me indicam um norte.
OBRIGADO!
Excelente post!
Dando os primeiros passos com Formação Cientista de Dados 4.0da DSA.
Então, sou formada em ciências contábeis, tenho certa habilidade com números e tenho visto que essa área tem uma crescente demanda. Não sei nada de programação, nunca antes estudei sobre, mas a ideia de uma desenvolver habilidades que são e serão tendência me entusiasma muito. Pergunto: é possível começar do zero?
Sim Carol. A grande maioria começa do zero.
excelente!!
Excelente artigo, muito esclarecedor!
Sou da área de exatas, técnico em eletrônica, bacharel em aviação civil e estou terminando tecnólogo em automação industrial. Comecei me interessar por programação recentemente e acabei esbarrando com ciência de dados e estou adorando o assunto. Estas dicas foram muito úteis pois realmente estava bem perdido de por onde e como começar. Estou fazendo os cursos gratuitos para ver aonde me encaixo melhor na área e me aprofundar mais. Agradeço ao excelente trabalho da Data Science Academy!
https://linkedin.com/in/leandro-pg-técnico
Boa tarde,sou formado na Gestão Da Produção Industrial,gostaria de saber se e possível que eu faça uma especialização em ciências de dados.
Olá Andre. Sim, perfeitamente possível. Não há qualquer impedimento.
[…] Se quiser mais detalhes sobre o dia a dia da função, confira o artigo O Que Faz um Engenheiro de Dados?. E se o seu objetivo é se tornar um Cientista de Dados, então acesse este artigo: Cientista de Dados – Por Onde Começar em 8 Passos. […]
Que fera!!!!!!!!
Olá, pada iniciar na carreira de Dados do zero é interessante fazer uma pós graduação em BigData e ciência de Dados?
Olá Rosiane. Não e necessário. O ideal inclusive é só fazer uma Pós depois de adquirir conhecimento prático em Ciência de Dados.
Artigo super atual. Estou me guiando por ele constantemente!!!!
[…] essas fontes em informações valiosas para apoio à decisão, então a empresa deve recorrer a um Cientista de Dados. Ciência de dados centrada em negócio é multidisciplinar e integra os seguintes […]
Sou formado em licenciatura em matemática e estou fazendo cursos livres em ciências de dados. Eu deveria ter um bacharelado ou se eu estiver conhecimento na área de ciência de dados tbm consigo emprego?
Olá Jeremias. Para exercer a função não faz diferença, mas cada empresas pode solicitar formação diferente.
[…] Cientista de Dados – Por Onde Começar em 8 Passos […]
Excelente artigo, dicas preciosas para mim que estou começando neste novo universo.
[…] Cientista de Dados – Por Onde Começar em 8 Passos […]
Excelente posto !! Muito esclarecedor principalmente no meu caso onde busco migrar de área. Ótimo mesmo ter essa visão geral e os passos a seguir. Parabéns mais uma vez DSA
Achei o artigo muito interessante e super didático para quem quer inciar na carreira de cientista de dados. No meu caso, aprendi o básico de R e python, mas quero aprimorar as habilidades técnicas para seguir avançando na área de tecnologia e dominar de fato a linguagem em python que vem crescendo. Achei interessante também a explicação de alguns conceitos que não era tão claros e agora fez sentido ao ler de forma detalhada. Obrigada!!!!
Excelente post!!
Em um momento pós-pandemia, a cultura do Data_Driven vem sendo mais aceita, , já dá para perceber em alguns jornais a evolução na comunicação da notícia voltada a apresentação de dados.
O Cientista de Dados será uma peça chave na tomada de decisões. Agora a Simplicidade com Profundidade, ou seja, transmitir a informação de forma clara e democrática gerando conhecimento e resultados será o seu principal objetivo.
Ótimo post, estou querendo mudar de aérea, e comecei a fazer o curso de power BI, e estou cada vez mais me interessando no curso de formação cientista de dados. Vou fazer o de programação e depois fazer o curso de formação.
Muito obrigado pela dedicação de vocês estarem espalhando esses conhecimentos.
[…] Muito se tem discutido sobre como as empresas utilizam nossas informações, ou dados. Mas poucos sabem as tecnologias empregadas para lidar com elas. Esse é o papel do cientista de dados. […]
[…] geral para suas necessidades ou desenvolvem suas próprias aplicações analíticas com a ajuda de Cientistas de Dados. Vejamos alguns dos principais casos de uso de Machine […]
Top! Acredito que essa profissão só tem a crescer mais e mais e obrigado pela imensa colaboração que a DSA tem nos dados em nos mostrar o caminho das pedras para se alcançar sucesso nessa área!
[…] profissionais com habilidades analíticas e que saibam manipular Big Data, aplicar técnicas de Data Science, construir modelos de Machine Learning e desenvolver aplicações de Inteligência Artificial. Mas […]
[…] Cientista de Dados – Por Onde Começar em 8 Passos […]
Muito obrigado pelo texto, ajudou bastante! Agora, por favor, preciso muito de uma luz de vocês… Seguinte, sou advogado, tenho 24 anos e um ano de formado, e hoje vejo o quanto a área do direito está abarrotada e, além disso, o quanto é ATRASADA em diversos aspectos, devido a burocracia e a dificuldade em inovar… O resultado disso é que estou considerando uma segunda formação ou uma segunda opção na área de tecnologia. Após muita pesquisa, me admirei pela Ciência de Dados e já até me inscrevi em um curso de vocês (Microsoft Power BI Para Data Science, Versão… Leia mais »
Olá Iran. Seu primeiro passo já foi dado ao se inscrever no curso de Power BI em nosso portal. O curso vai mostrar claramente o que é esse universo da Ciência de Dados e vai ajudar a decidir o melhor caminho a seguir.
Prezados,
Bom dia!
No tópico Banco de dados noSQL – acredito que tenha que corrigir a palavra [são] na frase para [não], “Bancos de Dados tradicionais RDBMS (Relational Database Management Systems) [são] foram projetados para tratar grandes quantidades de dados (Big Data).”
atenciosamente
celso
Obrigado Celso. Vamos verificar.
[…] um incremento, no sentido de contar, além das funções citadas, com um engenheiro e um cientista de dados. Por meio dessa coordenação de esforços entre profissionais de diferentes áreas da tecnologia, […]
Ótimo post! Me interessei bastante por essa profissão e quero seguir nisso, mas há um obstáculo, matemática nunca foi o meu forte, sempre fui ruim com números, isso me deixa insegura, tenho dúvidas.
1 – Queria saber se isso vai interferir na minha aprendizagem e carreira profissional.
2 – É mais interpretação de dados gráficos ou também há equações envolvidas na resolução de problemas na área profissional?
3 – Há chances de uma pessoa que tem dificuldade com cálculos se dar bem nessa área?
Olá Beatriz. Se tem dificuldades com números, você pode tentar ficar em Arquitetura de Dados que não requer conhecimento avançado em análise.
Saudações académicas ‼️
Preciso aprender mais e obter material. Vocês podem me ajudar ❓
Sim. Nosso portal tem cursos gratuitos para começar: http://www.datascienceacademy.com.br
Ótimo post consegui aprender bastante
Olá, eu comecei um curso Tecnólogo em Análise e Desenvolvimento de Sistemas. Pretendo me formar nisso. Mas caso eu acabe querendo atuar como Cientista de Dados. Se eu fizer uma pós graduação na área já basta? ou é mais recomendado uma formação bacharelado mesmo ? Estou ciente de que vou precisar aprender muita matemática e estatística. Mas já não é possível aprender isso com um Mestrado, Doutorado ? Help please! 🙂
Sim Alexsandra, é possível. Mas você vai aprender a parte prática de todo o processo em Data Science.
Posso, posteriormente, ingressar na área de Ciência de Dados sendo bacharel em Matemática?
Sim Ismar. Perfeitamente.
Bem, fiz matemática por um tempo, depois mudei para ciência da computação, curso que me formei. Fiz pesquisa científica em processamento de sinais e imagens. Disciplina que requer saber muita álgebra linear e o básico de probabilidade e estatística. Estudei alguns métodos de clusterizacao e classificação. Trabalhei muito com Matlab, montei modelos matemáticos para aquisição de vídeos, e me esforcei muito pra dar uma boa visualização dos meus resultados. Dados pra mim são os valores dos milhões de pixels de uma imagem ou vídeo. Banco de dados é um conjunto de arquivos de vídeo. A pergunta é: data science é… Leia mais »
Olá Jonathan. Visão Computacional é uma das áreas mais quentes em Inteligência Artificial. Invista nessa área.
Olá Thiago! Muito bom o seu blog, oferece informações muito interessantes para quem pretende aprender mais sobre ciência de dados. Gostaria de fazer uma pergunta, talvez não se encaixe muito…. Eu sou da área de biológicas, mais especificamente veterinária que não tem nenhuma relação com matemática. Porém durante o mestrado, trabalhei na área de epidemiologia e microbiologia de alimentos, e por conta do meu projeto aprendi a usar o R para a realização de analises de regressão e análise de dados provenientes de revisão sistemática de literatura e meta-análise. Me interessei muito pela análise de dados após o mestrado, e… Leia mais »
Olá Mariana. Obrigado pelo feedback. Uma graduação tem um propósito de longo prazo. Recomendo que antes de optar por este caminho e todo investimento de tempo e dinheiro envolvido, você faça alguns cursos voltados para a parte prática da análise de dados. Oferecemos 5 cursos gratuitos que poderão ajudá-la a ter uma ideia sobre o melhor caminho a seguir. Confira em nosso site: http://www.datascienceacademy.com.br
Esse Blog é sem duvida , Fantástico, tem me ajudando bastante como entusiasta a gostar cada vez mais da área de’ “DADOS”, meu muito obrigado por compartilhar conteúdo enriquecedor para que esta tentando entrar na área.
Valeu Tiago. Muito obrigado!
Olá Tiago. Parabéns pelo artigo. Sou professor universitário, tenho 41 anos, sou formado em matemática (pura) e trabalho na universidade há 15 anos. Minha formação acadêmica inclui doutorado e pós doutorado em matemática. Gostaria de saber das possibilidades de me tornar um cientista de dados tanto para trabalhar no Brasil quanto para trabalhar fora do Brasil se necessário e interessante for. Tenho conhecimentos básicos de estatísticas e programação, mas posso considerar que esses conhecimentos são nulos, pois os aprendi na graduação e não os uso desde então. Retomá-los, relembrá-los e aprendê-los de fato acredito que não será o mais difícil.… Leia mais »
Olá Márcio. Obrigado pela mensagem. Respondemos todas essas perguntas em nosso Podcast. Confira aqui: https://blog.dsacademy.com.br/podcast-dsa/
Márcio, também estou na mesma situação que você, mesma idade, só que a minha formação é em Economia. Tiago, ouvi o podcast, muito esclarecedor.