Pessoas começando na área de Ciência de Dados podem se sentir um pouco perdidas. Especialmente quando se trata de escolher qual função devem exercer. A explosão de funções que temos na Ciência de Dados pode ser esmagadora. 

Com tantos papéis a cumprir, há um grande número de habilidades que os profissionais precisam aprender. O problema é que as pessoas não sabem por onde começar.

Isso nos leva à discussão de qual estratégia deve-se usar para ter sucesso em uma carreira de Ciência de Dados. Deve-se tornar um generalista ou um especialista?

Esta é uma questão difícil de abordar, pois depende de muitas variáveis. O objetivo deste post não é resolver tal questão. O objetivo é compartilhar com você alguns dos benefícios que você pode encontrar sendo um generalista.

Vantagens em se tornar um generalista definitivamente existem: Você desenvolve um profundo senso de autonomia. Você faz as coisas andarem mais rápido. Você se torna alguém que fala várias línguas. A questão é se as vantagens em se tornar generalista superam as vantagens em se tornar especialista. Vamos conversar sobre isso neste artigo. Fique à vontade para deixar sua opinião nos comentários. Boa leitura.

Generalistas vs Especialistas

Generalistas são aquelas pessoas cujo conhecimento se expande entre várias áreas do conhecimento, com um grau maior ou menor de proficiência em cada área.

Especialistas dominam uma área de conhecimento específica. Eles podem ser muito poderosos, mas podem perder seu poder se operarem em outra área.

Você deve ter em mente que sempre há um certo grau de especialização em tudo. Não existe um generalista puro ou um especialista puro.

Por exemplo, se você é engenheiro, sua área de especialidade é a engenharia. Então seria normal se você não se saísse bem como advogado. Mas, para seu próprio bem, você deve saber um pouco sobre as leis. Você não pode ignorar a existência delas.

Você não precisa ser um especialista em tudo. A chave é encontrar um equilíbrio entre generalização e especialização.

Generalistas e Especialistas em Ciência de Dados

Em Data Science, você poderia dizer que cada função é algum tipo de especialização em si. Engenheiros de Dados fazem engenharia de dados. Analistas de Dados fazem análises de dados. Cientistas de Dados fazem ciência de dados.

Temos visto Cientistas de Dados incapazes de treinar seus próprios modelos porque não têm Engenheiros de Dados para obter os dados para eles.

Também vemos Engenheiros de Dados incapazes de derivar insights de negócios porque não entendem as necessidades de negócios.

Isso pode ser um problema se você estiver em uma organização que não tem recursos suficientes para contratar 4 ou 5 pessoas para concluir o ciclo de vida completo dos dados.

Este é um grau de especialização que nem todas as empresas podem pagar.

O maior problema aqui é que estamos acostumados a ter funções especializadas. É um modelo que seguimos há anos na sociedade e nas empresas. Estudamos, nos especializamos e queremos atuar em nossa área de atuação.

No entanto, empresas e profissionais de dados podem se beneficiar muito mais com uma abordagem generalista.

Não interprete mal, não estamos dizendo que não devemos ser especialistas. O ponto aqui é que devemos ser um pouco mais generalistas.

Na verdade, algumas pessoas como Eric Colson, ex-vice-presidente de ciência e engenharia de dados da Netflix, acham que devemos organizar nossas equipes de Data Science tendo generalistas e não especialistas (referência ao final do artigo).

Benefícios de Ser um Generalista

É comum profissionais começarem na área de dados como Analista de Dados e então fazer a transição para Cientista de Dados. 

Mas ao se tornar Cientista de Dados o CTO (Chief Technical Officer) pode deixar claro que você não é contratado apenas para treinar modelos. Se quiser ter sucesso na empresa, terá que fazer mais do que isso. Talvez seja necessário trabalhar em todo o ciclo de vida dados sozinho, ou seja, obter os dados, transformar os dados, treinar modelos e implantá-los sozinho.

E aí começamos a ver mais claramente os benefícios de ser um generalista, os quais listamos abaixo:

Você desenvolve um profundo senso de autonomia

Há muitos benefícios de ser uma espécie de “Cientista de Dados Full-Stack”. O principal é a autonomia.

Saber definir o problema de negócio, identificar fontes de dados, coletar e armazenar os dados, construir e treinar os modelos e ainda colocar em produção, é muito trabalho, mas perfeitamente possível para um único profissional.

Você faz as coisas andarem mais rápido

Às vezes, as empresas não precisam de coisas perfeitas. Eles só precisam saber se algo é viável. Se for algo que vale a pena perseguir, quanto mais rápido você souber, melhor.

É mais fácil explorar coisas novas se você precisar coordenar menos pessoas. É assim que você evita custos de coordenação.

Além disso, é muito mais fácil dar autonomia a uma pessoa da equipe do que a toda a equipe. Você não pode deixar coisas críticas sem supervisão porque toda a sua equipe está tentando uma nova ferramenta – ou algo parecido.

Você se torna alguém que fala várias línguas

É normal um “Cientista de Dados Full-Stack”, fazer a transição para a engenharia de dados (vemos isso com frequência entre os alunos da DSA). 

Uma das coisas que percebemos é que ser generalista permite falar várias “línguas”. Assim, o profissional é capaz de traduzir facilmente as diferentes necessidades entre as diferentes funções da equipe.

Quando é necessário falar com Engenheiros de Dados, podemos fazer isso facilmente. A mesma coisa com Analistas de Dados. Ou seja, o generalista desenvolver a habilidade de falar e compreender diferentes jargões e traduzir as necessidades técnicas e de negócios de forma muito mais fácil.

Isso é algo que consideramos útil. Pode ser difícil expressar suas necessidades se a outra parte não falar a “mesma língua”.

Por Que Ser Um Generalista Primeiro?

Afinal, ser um generalista significa compreender o quadro completo de todo o ciclo de vida do projeto de Ciência de Dados.

A questão é: por que entender o fluxo total do ciclo de vida do projeto de Ciência de Dados é importante em primeiro lugar?

Como Cientistas de Dados, não construímos um modelo de aprendizado de máquina apenas por criá-lo. Primeiro, entendemos o problema de negócios e o enquadramos em um problema que pode ser resolvido por meio da abordagem de Ciência de Dados. Em seguida, você precisa identificar fontes de dados e definir métricas de sucesso.

Dependendo do estágio de maturidade da sua empresa, você também pode precisar construir um pipeline para coletar dados (SIM, você pode nem ter dados localmente) …

Ainda podemos prosseguir indefinidamente, mas aqui está o ponto – todos os escopos de trabalho acima fazem parte de ser um generalista. O bom é que você conhecerá o quadro completo do problema da Ciência de Dados como um generalista – principalmente como um Cientista de Dados no início de carreira.

Em outras palavras, você aprenderá e crescerá tremendamente.

O que estamos defendendo aqui é o seguinte: se você é alguém que está começando na Ciência de Dados, a recomendação é ser um generalista primeiro. Junte-se a uma startup ou empresa iniciante em cultura data-driven e assuma vários papéis, pois provavelmente você será o único Cientista de Dados em sua empresa. Generalistas agregam mais valor do que especialistas nos primeiros dias de uma empresa, já que você está construindo a maior parte do seu produto do zero.

Seus modelos de aprendizado de máquina não precisam mudar o jogo, mas devem ser capazes de fornecer insights e resultados acionáveis.

Saiba como você pode ajudar a empresa a gerar mais receitas. Aprenda como você pode aproveitar os dados existentes ou construir algum pipeline para coletar dados e resolver alguns problemas.

Nem sempre é necessário optar pela IA se a empresa não estiver pronta para isso. Na verdade, a abordagem estatística normal é normalmente suficiente para resolver alguns problemas simples.

O Cientista de Dados ideal é um forte generalista que também traz especialidades únicas que complementam o resto da equipe.

Depois de ter experiência suficiente e encontrar seu interesse e paixão em uma área específica (digamos PLN), você pode mergulhar fundo nisso, o que nos leva ao próximo estágio.

Por Que Ser Um Especialista Mais Tarde?

Diga se você é um especialista em Processamento de Linguagem Natural. Seu foco pode ser exclusivamente na construção do melhor modelo de classificador de PLN com base nos dados. E é isso.

Todas as coisas já estão definidas para você. Os problemas de negócios são bem definidos (feitos por gerentes de produto). O pipeline está pronto e mantido 24 horas por dia, 7 dias por semana (feito por Engenheiros de Dados) e os dados estão lá para coleta. O que você precisa fazer é fazer o que você faz de melhor. Isso é crucial, pois você pode se concentrar em sua experiência e força para agregar os mais altos valores ao projeto.

É perfeitamente normal ser especialista em Ciência de Dados. Ser um especialista no seu nicho desempenha um papel importante em uma empresa, o que também o torna insubstituível e valioso.

Nesse estágio, você já tem experiência em diferentes áreas como especialista em Ciência de Dados. Sua experiência e conhecimento não são algo que pode ser facilmente substituído por outros.

Melhor ainda, você poderá se concentrar em sua especialização e trabalhar com outras pessoas como uma equipe com seu amplo conhecimento e compreensão de outras partes do fluxo de trabalho de Ciência de Dados.

Você não é mais alguém que sabe apenas uma coisa. Em vez disso, você é alguém que sabe muitas coisas com foco em algo particular que o torna especial.

Conclusão

Essa discussão sobre generalistas e especialistas pode ser difícil. Chegar a um consenso seria quase impossível e cada um vai ter uma opinião e visão diferentes. Você deve aproveitar todas as informações disponíveis e decidir por si mesmo o que deseja buscar. Existem benefícios nas duas opções, mas acreditamos que profissionais em início de carreira em Ciência de Dados devam ter um perfil generalista, compreender todo o processo e seu funcionamento e então depois decidir no que gostaria de se especializar. Esta é exatamente a abordagem que trazemos nas Formações da DSA.

Referências:

Mapa Completo das Funções em Ciência de Dados

Formações Data Science Academy

Why Data Science Teams Need Generalists, Not Specialists

How Being a Generalist Can Benefit Your Data Science Career

Why you should be a Generalist first, Specialist later as a Data Scientist?