O título deste artigo é a pergunta que mais recebemos aqui na Data Science Academy. Nossos milhares de alunos no Brasil e no mundo estão em busca de capacitação, atentos aos movimentos do mercado que cada vez mais requisita profissionais com habilidades analíticas e que saibam manipular Big Data, aplicar técnicas de Data Science, construir modelos de Machine Learning e desenvolver aplicações de Inteligência Artificial. Mas como entrar no mercado e comprovar suas habilidades para os empregadores? Este artigo vai ajudá-lo nesta tarefa.

 

Competições no Kaggle

Muitos aspirantes ao cargo de Cientista de Dados iniciam sua trajetória participando de competições na plataforma Kaggle como forma de construir seus portfólios de projetos. O Kaggle é um portal de competições em Data Science que reúne profissionais do mundo inteiro, sendo uma excelente maneira de praticar, mas que deve ser apenas uma das muitas opções que você deve usar para aprender a trabalhar com Ciência de Dados. Isso porque as competições do Kaggle se concentram em uma pequena parte do trabalho em Ciência de Dados. Para ser mais específico:

* O Kaggle trata principalmente de aprendizagem de máquina, que é apenas um aspecto da Ciência de Dados.
* Quando você trabalha com a plataforma Kaggle, você está lidando amplamente com dados pré-limpos, o que limita sua experiência no trabalho de limpeza e transformação dos dados, tarefa que ocupa cerca de 50-80% do tempo de um Cientista de Dados.
* Por causa do grande volume de pessoas que entram nas competições do Kaggle, chegar ao topo ou ganhar uma competição exige não só habilidade, mas muito tempo e alguma sorte também. Mas independentemente das competições, você pode se conectar com outros profissionais e acompanhar as principais tendências em Data Science.

Se ainda não tem uma conta no Kaggle, crie agora mesmo. É gratuito!

 

 Github

Para construir suas habilidades de forma mais holística, uma boa ideia é trabalhar em seus próprios projetos. É muito comum aos aspirantes compartilhar seus códigos (em linguagem R, Python, Scala ou Java) no Github pois eles podem interessar potenciais empregadores, mas é importante avaliar o propósito do seu código e como você o disponibiliza. O Github reúne desenvolvedores e profissionais de Data Science de todo o mundo, sendo uma boa forma de se conectar a especialistas na área. O Github é gratuito para a criação de repositórios públicos. Todos os cursos da Data Science Academy estão no Github, sendo que os cursos pagos estão em repositórios privados e os cursos gratuitos em repositórios públicos. Acesse nossa página no Github clicando aqui. O Github é ainda uma excelente ferramenta de colaboração.

Embora seja rápido colocar algum código no Github e esperar que alguém olhe para ele, é muito mais eficaz a longo prazo dedicar tempo e esforço em construir e apresentar o seu próprio portfólio, não só usando o Github, mas criando um blog e escrevendo artigos sobre seus projetos e o conhecimento que você já possui.

Nós defendemos a construção de um portfólio de projetos para ajudar nossos alunos a obter seus primeiros empregos em Ciência de Dados, e muitos alunos obtiveram sucesso construindo seus próprios portfólios. No curso “Preparação Para a Carreira de Cientista de Dados”, curso privado e exclusivo para os alunos que adquirem a Formação Cientista de Dados, os alunos aprendem como usar o Github e como construir um portfólio, além de muitas outras dicas de carreira.

Vejamos algumas estratégias, com base em nossa experiência aqui na DSA, sobre como construir um portfólio em Ciência em Dados que o ajudará a conseguir um emprego, mesmo que você não tenha experiência na área. E se você acha que isso não é possível, assista o webinar com um dos alunos da Formação Cientista de Dados que conseguiu seu primeiro emprego como Cientista de Dados usando exatamente esta estratégia. O webinar pode ser acessado ao final do capítulo 1 de qualquer um dos nossos quatro cursos gratuitos. Acesse: www.datascienceacademy.com.br.

Vamos começar examinando por que a primeira coisa mais efetiva a se fazer é criar um portfólio.

 

 Por que Criar um Portfólio?

A razão pela qual um portfólio em Ciência de Dados é útil é por que ele demonstra as coisas que você sabe fazer e isso facilitará a vida do empregador na hora de decidir sobre como contratá-lo. O portfólio será efetivamente um substituto para as experiências de trabalho que você ainda não possui.

Pense nisso sob a perspectiva dos empregadores – eles querem maximizar a chance de contratar um excelente candidato e minimizar a chance de contratar um candidato fraco. Como candidato, o seu “trabalho” é demonstrar a eles que você possui as habilidades e as qualidades que eles precisam para esse cargo.

Um forte portfólio em Ciência de Dados é composto por vários projetos em Ciência de Dados de tamanho médio, que visam demonstrar aos empregadores que você possui as habilidades-chave que eles estão procurando. Por esta razão que a Formação Cientista de Dados da Data Science Academy possui 26 projetos, com especificação, documentação e código comentado linha a linha, para que os alunos utilizem como ponto de partida.

 

Seu Portfólio Deve Ter Projetos Relevantes

Embora a maioria das pesquisas em Ciência de Dados se concentre em aprendizagem de máquina, é muito improvável que seu primeiro cargo como Cientista de Dados envolva muito trabalho de Machine Learning. Este é o seu primeiro trabalho na área de Ciência de Dados, então você deve esperar que seja indicado para cargos júnior, e então você pode trabalhar progressivamente a partir daí.

O cargo inicial pode não ser o de “Cientista de Dados”, mas algo como “Analista de Dados” ou “Analista de Negócios”. Seja humilde e esteja disposto a fazer o que for necessário para entrar na área.

Por esse motivo, preencher seu portfólio apenas com projetos de aprendizado de máquina pode não ser uma estratégia muito eficaz, embora devam existir projetos de Machine Learning em seu portfólio. Considere isso quando você pensar sobre os tipos de projetos a serem incluídos. Diferentes projetos podem demonstrar habilidades diferentes. Aqui estão alguns tipos diferentes de projetos que você pode construir:

Projeto de Limpeza de Dados – mostre que você pode tratar vários conjuntos de dados desordenados, limpá-los, combiná-los e usá-los para realizar análises.
Projeto de Storytelling – mostre que você pode extrair insights a partir dos dados e comunicar essas informações a partir dos dados apresentados.
Projeto de Visualização de Dados – mostre que você pode apresentar os dados visualmente usando plots e gráficos apropriados.
Projeto de Aprendizagem de Máquina – mostre que você pode efetivamente construir um modelo que faça previsões precisas com dados.
Projeto Completo – mostre que você pode criar um sistema autônomo a partir dos dados, processá-lo e produzir a saída em uma forma específica.
Post Explicativo – mostre que você pode se comunicar e explicar bem os dados, explicando conceitos estatísticos ou um algoritmo de aprendizagem de máquina.

Você deve pensar sobre o tipo de trabalho que deseja selecionar e quais projetos adicionar ao seu portfólio. Como mencionado acima, não precisa ser projeto apenas de aprendizado de máquina. Se você tem um interesse particular em Visualização de Dados, por exemplo, você pode fazer alguns projetos de Visualização de Dados e adicionar algumas visualizações interativas para demonstrar suas habilidades nessa área.

Você deve familiarizar-se com os anúncios de vagas para a posição que está procurando – fique atento as habilidades que os empregadores estão buscando, e use isso como uma dica para selecionar os projetos para seu portfólio.

 

Apresente Seus Projetos de Forma Eficaz

Um projeto eficaz não é simplesmente fazer algumas análises e enviá-lo ao Github. Você precisa dedicar tempo e esforço para tornar seu projeto fácil de entender. Isto significa inserir uma introdução ao seu projeto, explicando de forma efetiva qual o objetivo dele. Você precisa “vender” o seu projeto, mas, tenha em mente que é muito provável que a única coisa que algumas pessoas verão será somente a introdução. Trabalhe no seu projeto como se você tivesse sido contratado para fazê-lo – explique o objetivo do projeto, qual abordagem você adotou, os dados que você usou e o resultado alcançado.

Você também deve se certificar de que a introdução tenha instruções para instalar ou executar seu projeto, para que qualquer pessoa que queira reproduzir seu trabalho possa fazê-lo facilmente.

Por isso, você precisa incluir todos os arquivos e conjuntos de dados relevantes, além de fornecer uma lista de bibliotecas necessárias para executar seus projetos (por exemplo, um arquivo requirements.txt para um projeto Python).

Se o seu projeto é composto por scripts autônomos, você deve se certificar de que eles sejam fáceis de ler e esses comentários devem estar em seu código para explicar o que você está fazendo e porquê.

Se o seu projeto usa Jupyter Notebooks, adicione “marcas” ao seu projeto que explique o que você está fazendo e interprete os resultados à medida que você vai executando-os.

 

Satisfaça os Diferentes Tipos de Pessoas Que Verão Seu Portfólio

Tenha em mente que, durante o processo de contratação, diferentes tipos de pessoas irão olhar para o seu portfólio e eles terão diferentes níveis de habilidade e compreensão.

Um gerente de RH que olha para o seu portfólio no início do processo pode ter uma compreensão técnica limitada. Você deve se certificar de que exista muitas explicações para esse tipo de pessoa e talvez até considere colocar seus projetos em um blog, bem como no GitHub para que você possa escrever mais detalhes sobre seu projeto e explicar como funciona para alguém com menos conhecimento técnico.

Num segundo momento, durante o processo de contratação, seu portfólio pode ser analisado por outros gestores da empresa, e eles estarão interessados em saber como você pode oferecer valor à empresa e qual a sua habilidade em se comunicar. Você deve certificar-se de que todas as suas explicações sejam claras e que seu projeto realmente entrega aquilo que propõe.

Por fim, você deve esperar que alguém mais técnico avalie seu portfólio. Você deve certificar-se de que seu código esteja limpo, tratado e eficiente.

Para diferentes empresas, o processo de contratação será diferente e algumas dessas empresas poderão estar examinando seu portfólio. Você deve deliberadamente considerar e se preparar para cada uma.

 

Deixe os Empregadores Saberem Sobre Seu Portfólio

Um erro comum é colocar alguns projetos no Github e, em seguida, simplesmente adicionar a URL de perfil do Github ao topo do seu currículo. Lembre-se de que o processo de contratação é difícil, então você precisa facilitar o acesso às empresas/pessoas que irão olhar e avaliar seu portfólio.

Em vez de apenas “adicionar a URL” e esperar que alguém o encontre, mencione explicitamente seu portfólio e projetos específicos em sua carta de apresentação. Se você receber algum telefonema, mencione o seu portfólio e mostre como você pode fornecer valor ao negócio com os seus projetos. Aproveite todas as oportunidades que você tiver para apresentar o seu portfólio.

Vale lembrar que em geral, você encontrará menos pessoas técnicas no início do processo de contratação e mais pessoas técnicas à medida que avançar no processo seletivo.

 

E Você Ainda se Diverte

Um portfólio é uma maneira extremamente eficaz de atuar como um substituto para a sua experiência ao procurar o seu primeiro trabalho em Ciência de Dados. No entanto, para que seu portfólio seja eficaz, você deve se esforçar para construir e apresentar seu trabalho de forma eficiente.

Você deve construir vários projetos substanciais que demonstram habilidades específicas que serão relevantes para os trabalhos que deseja obter. Você deve dispor de tempo para apresentá-los bem e estar atento aos diferentes tipos de pessoas que verão seu portfólio no processo de contratação.

Mas se você realmente gosta de Ciência de Dados, a construção do seu portfólio será como diversão, aprendendo, errando, descobrindo e gerando resultado. Se você for apaixonado por análise de dados, todo o processo de construção do seu portfólio será um grande prazer.

Por último, você deve fazer um esforço para garantir que seu portfólio seja uma parte proeminente do seu currículo e considerar a apresentação de seus projetos de portfólio sempre que participar de um processo de seleção.

“Ah, mas criar um portfólio de projetos dá muito trabalho”! Sim, dá. É por isso que a grande maioria dos profissionais não se preocupa em fazer. Faça e seja um profissional diferenciado!

 

Equipe DSA

 

Referências:

Formação Cientista de Dados

Advice for New Data Scientists

Landing Your First Data Science Job

How to get your first job as a data scientist

How to land your first job as a data scientist