O que diferencia os profissionais de alta performance do resto da multidão? O que faz um profissional ser realmente diferente e disputado no mercado? Quais são as 6 Habilidades Especiais de Cientistas de Dados de Alto Desempenho? É o que veremos neste post.

Este artigo é um presente para você e para sua carreira! Aproveite!


Embora as pessoas já façam estatística com programação há algum tempo, ainda estamos nos estágios iniciais das funções em Ciência de Dados e Machine Learning.

Já existe uma lista bem estabelecida de habilidades técnicas (“hard skills”) que se pode aprender para se tornar proficiente neste espaço, o que inclui: Python, R, SAS, SQL, Análise Estatística, Visualização de Dados, Engenharia de Recursos, Modelagem, Deploy de Modelos em Produção, etc. A maioria também está ciente de outras habilidades fundamentais e não técnicas: comunicação, gerenciamento de projetos, etc. Essas geralmente rotuladas simplesmente como “soft skills”.

A ideia é que, para ser um especialista, você só precisa executar todas essas hard & soft skills em alto nível por um tempo suficiente. Mas observando Cientistas de Dados de alto desempenho percebe-se que sua excelência vai muito além dessas habilidades. Ser capaz de escrever código limpo e eficiente em uma velocidade rápida ou ser um comunicador fenomenal o levará muito longe nesse campo, mas há um conjunto de padrões que distinguem dramaticamente os melhores da multidão.

Esses padrões são amplamente invisíveis na medida em que às vezes nem a própria pessoa consegue articular o que faz de maneira diferente de seus pares. Com o tempo, percebemos que aqueles que exibem a maioria ou todas essas habilidades acabam tendo uma quantidade surpreendente de sucesso. Desde a capacidade de projetar sistemas de aprendizado de máquina eficazes que realmente funcionam em escala até a construção de relacionamentos fortes com parceiros de negócios para que as pessoas confiem em sua palavra, os Cientistas de Dados que incorporam essas habilidades não têm concorrência.

Chamar esses conceitos de “habilidades” é quase um desserviço porque são mais estruturas de personalidade que levam muito mais tempo para serem dominadas do que as habilidades tradicionais. Aqui está a lista:

1- Ultra-Aprendiz

2- Antifrágil

3- Curioso Insaciável

4- Capacidade de Deixar o Ego de Lado

5- Storytelling

6- Generosidade Colaborativa

Um aviso importante: não estamos afirmando que você não está qualificado se não tiver todas essas “habilidades invisíveis” em abundância. A alta proficiência em Python, R, Estatística e comunicação ainda é, obviamente, incrivelmente valiosa. Estamos apenas afirmando que esse é o conjunto de características que vemos preenchendo a lacuna na excelência e diferenciando os melhores profissionais do mercado.

Ultra-Aprendiz

Há um perfil de pessoa que tipicamente se move em um ritmo rápido através de uma amplitude de conceitos e domínios em uma profundidade rasa. Embora não sejam especialistas inerentes em nenhum domínio, eles exibem uma grande variedade de conhecimento. Eles se sentem confortáveis ​​com nuances, pois vivem em um mundo de probabilidades. Esse é um perfil generalista.

Em contraste, há um perfil de profissional que é a personificação da profundidade. Eles são capazes de saber uma coisa incrivelmente bem e normalmente são mais específicos no que pretendem aprender. Combinando um conjunto de habilidades especializadas com o foco no quadro geral, eles são capazes de reduzir todos os problemas a um princípio de organização. Esse é um perfil especialista.

Cada tipo de personalidade tem momentos em que realmente brilha e os melhores Cientistas de Dados circulam efetivamente entre os dois, dependendo do que a empresa precisa. Enquanto muitos perdem tempo discutindo qual perfil é o ideal (generalista ou especialista), os profissionais de alto desempenho transitam entre os dois perfis de acordo com cada projeto e cada problema a ser resolvido.

No início dos projetos, quando poucas informações sobre os dados ou a estratégia são conhecidas, é melhor ter o perfil mais generalista. Você deve ser capaz de percorrer uma grande quantidade de informações rapidamente para identificar sinais em um mar de ruído. Se você se aprofundar muito em uma solução restrita, provavelmente perderá informações cruciais que podem matar completamente seu projeto mais tarde. Uma forte habilidade generalista é necessária para destilar um grande volume de informações incompreensíveis em sinais e ruídos concretos.

Depois que uma quantidade razoável de informações foi destilada, geralmente é mais útil ser um especialista. Você deve ter uma ideia de qual é o cenário, quais estratégias podem ser usadas e resolver os problemas, por que essas soluções funcionariam e como construir essas soluções. Isso requer uma profundidade que a maioria dos generalistas não tem (e não deveria, pois não é o propósito deles).

Equilibrar amplitude e profundidade (generalidade e especialidade) ao lidar com as restrições da realidade — custos, tempo, computação, pessoas, etc. — só é feito de forma eficaz por ultra-aprendizes, pessoas capazes de aprender em alta velocidade, aprender o que for necessário, deixar de lado o que aprendeu e aprender de novo, quantas vezes forem necessárias. O aprendizado contínuo é a chave do sucesso aqui.

Vivemos na era da informação e a capacidade de aprendizado contínuo, transitando entre generalidade e especialidade, é uma habilidade ainda pouco comum, exclusiva de ultra-aprendizes, e que diferencia profissionais de alto desempenho.

Antifrágil

A evolução da resiliência. Resiliência é a capacidade de se recuperar de falhas. A antifragilidade é a capacidade de crescer especificamente devido a falhas. Um sistema resiliente pode voltar a funcionar rapidamente após interrupções, mas um sistema antifrágil torna-se mais forte e melhor devido à interrupção.

Este é um conceito cunhado por um dos nossos autores favoritos, Nassim Taleb, em seu livro “Antifragile: Things That Gain From Disorder”. Depois de saber disso, você começa a reconhecê-lo em grandes quantidades em Cientistas de Dados de alto desempenho. Quando você pensa sobre isso, faz muito sentido: ter muita experiência trabalhando em projetos de aprendizado de máquina aplicado expõe você a inúmeras falhas, enquanto ainda exige que você tome decisões com base na teoria estatística.

Esse julgamento continua se aguçando ao longo do tempo até que você chegue a um ponto em que seja capaz de saber não apenas onde estão as armadilhas, mas também quais armadilhas fornecerão as informações corretas para avançar.

Essa é uma habilidade difícil de aprender se você não estiver exposto a falhas com frequência. Você precisa desenvolver um julgamento sobre o que provavelmente levará a um fracasso para poder controlar quais fracassos você está disposto a assumir pelo conhecimento e crescimento que ele retornará em consequência. Combine isso com ter que liderar um projeto e uma equipe para passar por isso juntos e se torna uma habilidade realmente difícil, mas imperativa de dominar.

Nos cursos aqui na DSA trabalhamos isso com os alunos. Provocamos falhas e erros nos processos durante as aulas, incentivamos a buscarem as soluções, aprenderem com os erros e depois acompanhar a solução empregada. Os alunos dão um salto no aprendizado incrível. E até por isso os cursos da DSA são um diferencial no currículo dos profissionais de dados. 

Curioso Insaciável

Em um mundo de abundância de informações e energia, a curiosidade intelectual é o que diferencia você (profissional de alto desempenho) dos demais. É fácil se sentir um especialista devido à abundância de informações gratuitas que temos por aí, mas quando você analisa os resultados, percebe a divergência entre quantidade e qualidade e o que é realmente relevante para o seu dia a dia.

Ter a curiosidade de saber por que certos modelos funcionam melhor do que outros para o seu caso de uso (em termos de velocidade, desempenho etc.) é algo que vemos em profissionais de alto desempenho. É preciso experiência para saber que você ainda pode ter overfit mesmo ao usar GridSearchCV, como aliviá-lo, por que certos modelos devem ser escolhidos ou não, se você ainda tem um problema de modelagem ou um problema de dados (dica: geralmente é um problema de dados) e muito mais. Curiosidade traz experiência, que traz mais curiosidade, que traz mais experiência, em um ciclo infinito.

A curiosidade intelectual é a melhoria de +1% que os especialistas fazem para si mesmos, o que se traduz em avanços incrivelmente grandes ao longo do tempo. Eles levam 5 minutos extras para ler um artigo que contradiz suas crenças, não seguem o caminho mais fácil para implementar coisas que não entendem ou não podem explicar e querem ser construtores antes de vendedores.

Essa habilidade também é a fonte dos “aprendizes ao longo da vida” e continua reabastecendo energia para continuar refinando o ofício ou nivelando suas habilidades. Este campo tem muitos conceitos e tecnologias que mudam mais rápido do que qualquer pessoa pode acompanhar, então para realmente ser um profissional de alto desempenho é preciso ter curiosidade intelectual que mantenha seus níveis de energia altos.

Capacidade de Deixar o Ego de Lado

Este pode ser um equilíbrio complicado, especialmente quando você conhece profundamente um conceito, mas é bastante imperativo porque geralmente o sucesso não se resume à teoria. Todos nós já vemos os efeitos de uma pessoa se apegar demais ao seu conhecimento e se recusar a ver um ponto de vista diferente. E isso inevitavelmente leva a soluções e relacionamentos ineficazes.

Mesmo com o vasto conhecimento que os Cientistas de Dados têm, os testemunhamos tentando se convencer do contrário. Eles não se esforçam para ser os mais inteligentes da sala, eles querem que o conhecimento seja compartilhado da maneira mais igual e aberta possível. Isso acontece por meio de um debate significativo e uma busca pela verdade. Na prática, isso pode significar que eles demoram a revelar o que sabem e qual é sua opinião, os especialistas querem ouvir os pensamentos dos outros antes de fornecerem os seus. É curioso ver praticantes inexperientes divulgarem suas crenças muito mais alto e orgulhosamente do que os experientes, mesmo quando suas crenças não são verdadeiras.

Teoria e metodologia são apenas uma pequena parte de um projeto bem-sucedido. O relacionamento com sua equipe e stakeholders é tão importante quanto acertar sua teoria. Trazer seu ego para as discussões nunca promove um relacionamento forte com os outros ao seu redor, mesmo se você estiver certo, mas especialmente se estiver errado.

Mais do que frequentemente, o sucesso também não é sobre teoria, é sobre aplicação. E a aplicação da teoria pode ter muitas respostas certas, enquanto a teoria geralmente só tem uma. A miríade de respostas certas significa que é a seu favor examinar uma variedade de opiniões e tomar decisões baseadas em evidências e bom senso. Isso não é compatível quando você está liderando com o ego.

Storytelling

Contar histórias é a arte de comunicar uma ideia complexa de forma clara e concisa para que as pessoas sejam significativamente influenciadas por ela. Ele pode ter visualizações de dados incorporadas, mas trata-se principalmente de influência e menos de habilidade técnica.

Assim como a comunicação se compõe de inflexão de voz, maneirismos, linguagem corporal, etc., mas é muito maior que a soma de suas partes, influenciar também é o mesmo. Para influenciar, você precisa construir um relacionamento de confiança primeiro. Isso não é nada fácil de fazer em um curto período de tempo, muito menos na reunião de 30 minutos em que você pode ter que fazer tudo.

Além disso, o humor é uma habilidade incrivelmente subestimada aqui também. O humor faz maravilhas ao aproximar as pessoas e provavelmente é mais necessário quando todos estão remotos. Ser capaz de fazer as pessoas rirem lembra-lhes que este é, em última análise, um ofício humano que começa e termina com as pessoas tomando decisões.

Um erro [muito] grande que vemos as pessoas cometerem aqui é dar muita informação. Raramente vemos pessoas dando muito pouca informação porque, se for esse o caso, elas geralmente não têm mais informações para dar. O problema maior é quando as pessoas sentem que são hábeis em se comunicar, mas inundam as pessoas com todas as informações relevantes para o projeto. Essa comunicação não é apenas ineficaz, mas também não é narrativa. Os especialistas sabem como analisar os sinais do ruído e comunicarão apenas os sinais que orientam os que estão no poder a tomar decisões.

Entendemos que é muito mais difícil regular isso, mas já vimos vários projetos de Ciência de Dados não serem lançados ou terem sucesso simplesmente porque a escolha de quem lidera a conversa foi ruim. Nem todo mundo tem essa habilidade, desconfie de quem fala muito e de quem realmente influencia.

Generosidade Colaborativa

Deveria ser avaliado em entrevistas como os Cientistas de Dados contribuem e enriquecem as comunidades. Ser parte ativa de uma comunidade é um forte indicador de excelência. Você não pode realmente aprender tudo sozinho e o processo se torna muito mais eficaz se você aprender com colegas dentro e fora de sua organização. Devemos questionar o conhecimento daqueles neste campo que não estão aprendendo ativamente com as pessoas ao seu redor. Os profissionais de alto desempenho sabem como alavancar sua rede em alto nível.

Independentemente da comunidade global, temos visto profissionais de alto desempenho serem incrivelmente generosos com seu tempo e conhecimento. Os profissionais de alto desempenho geralmente reservam tempo para ajudar imediatamente e passam alguns minutos extras para entender completamente o que você precisa de ajuda, enquanto indivíduos mais inexperientes evitam coisas como essa, pois “não está em suas descrições de trabalho”.

Esse tipo de mentalidade de “ajudar uns aos outros incansavelmente” contribui para as culturas de dados mais fortes e saudáveis. Não quer dizer que alguém será capaz de resolver todos os seus pedidos, mas que você sempre terá pessoas ao seu redor para ajudar a tentar. Quando você tem um campo que muda em ritmo vertiginoso, esse pode ser um dos ambientes mais reconfortantes para se estar.


E você, possui as habilidades listas acima? O que está fazendo para desenvolvê-las? Conhece algum Cientista de Dados que realmente possui todas essas características? Deixe sua mensagem nos comentários.

Equipe DSA

Referências:

Preparação Para Carreira de Cientista de Dados

Invisible Skills That Distinguish Expert Data Scientists