Você pode ser um bom Cientista de Dados sentado em seu computador. Afinal, a descrição do trabalho deste profissional envolve análise de enormes quantidades de dados a fim de encontrar diferentes insights que podem ser úteis em todos os aspectos de um negócio, incluindo marketing, logística e recursos humanos. O trabalho também inclui a limpeza de dados, pré-processamento, construção de modelos preditivos e apresentação dos resultados através de visualizações e dashboards.

Mas grandes Cientistas de Dados sabem que devem fazer mais. Eles reconhecem que há nuances e problemas de qualidade nos dados que eles não podem entender enquanto estão sentados em suas mesas. Eles reconhecem que o mundo está cheio de visões relevantes, sentimentos, sons, cheiros, gostos e texturas que ainda precisam ser digitalizados e, portanto, não estão disponíveis para aqueles que trabalham em seus computadores (por exemplo, pense nas incertezas durante uma manifestação política e o medo nos olhos de um executivo enfrentando uma ameaça inesperada). Os Cientistas de Dados sabem que devem entender o contexto, os problemas e oportunidades reais, e como suas previsões serão utilizadas.

Os grandes Cientistas de Dados sabem que a única maneira de adquirir esse conjunto de informações é ir buscá-lo. Assim, eles utilizam parte do seu tempo conversando com tomadores de decisão, andando pelo chão de fábrica, fingindo ser um cliente e solicitando atendimento, pedindo ajuda a especialistas em outras disciplinas e assim por diante. Eles aprofundam os processos de criação de dados e as complexidades dos equipamentos de medição. Eles conversam e se comunicam com as pessoas e procuram descobrir como suas recomendações serão usadas, quais são os resultados prováveis e o que pode dar errado.

Considere um exemplo na área de petróleo e gás. Onde o petróleo é espesso, é difícil bombear para a superfície. Para tornar esse processo mais fácil, as empresas aquecem o petróleo primeiro com vapor. O vapor é caro e deve ser usado de acordo com as diretrizes ecológicas estabelecidas e, portanto, a quantidade de vapor que será usada é crítica. Um bom Cientista de Dados pode levar em conta muitos fatores – a geologia, a temperatura atual do petróleo, a história de produção do poço – para otimizar a quantidade de vapor em suas análises e previsões.

Os grandes Cientistas de Dados estão profundamente curiosos sobre os dados e tudo o que os rodeia.

Mas um grande Cientista de Dados também passaria algum tempo no campo de petróleo se comunicando com outros profissionais. Lá, ele iria notar que a sonda usada para estimar a temperatura atual às vezes está bem limpa, enquanto em outros momentos está coberta com lama. A questão é: a lama é um grande isolador, levando a uma temperatura “muito baixa” e, por sua vez, muito vapor. Tendo verificado isso através de uma experiência simples, o grande Cientista de Dados vai abordar a raiz do problema, ou seja, a falta de uma instrução de trabalho aconselhando o técnico a inserir uma sonda limpa.

Os grandes Cientistas de Dados estão profundamente curiosos sobre os dados e tudo o que os rodeia. Neste caso, a otimização da quantidade de vapor é importante, mas erradicar a questão da qualidade dos dados (a sonda coberta de lama) é ainda mais fundamental e economiza milhões de dólares. Os modelos preditivos resultados serão muito mais eficazes.

Nem todos os Cientistas de Dados gastam tempo suficiente para entender a realidade mais profunda que estudam, principalmente em áreas de negócio que não dominam. Alguns concentram-se demais nos números. Por exemplo, ao prever a última eleição presidencial nos EUA, a grande maioria dos institutos de pesquisa não consideraram os eleitores potenciais e era na mente desses consumidores que estava o vencedor da eleição. Como não podemos ir diretamente para lá (para a mente dos eleitores), diversos veículos de comunicação, desde o New York Times à Comissão Eleitoral de Princeton, usaram pesquisas para prever quem venceria. Mas a maioria errou.

Os grandes Cientistas de Dados sabem que têm de compreender os pontos fortes e fracos nos dados em grande detalhe e se preocupam mais com o erro não-amostral do que com os modelos de agregação de pesquisas. Eles estudam a exatidão das pesquisas passadas, se perguntam o que aconteceria se as pessoas mentissem para os pesquisadores e refletem esses “preconceitos”, como se as pessoas que disseram que provavelmente votarão, realmente o façam. Muitas pessoas na mídia americana comentaram sobre como sentiram muito mais energia nos comícios do Trump do que nos comícios de Clinton, sugerindo mesmo que isso poderia traduzir uma maior participação de seus apoiadores. Grandes Cientistas de Dados conduzem tais análises para desenvolver uma perspectiva mais ampla. Como se diz em inglês, é preciso ficar atento ao “big picture”.

Além do mais, grandes Cientistas de Dados buscam traçar uma ampla rede na busca de dados relevantes. Os americanos podem desconfiar da dinastia política, diminuindo as chances de uma candidata à eleição após um presidente de dois mandatos de seu partido? Poderia o desempenho econômico ajudar – ou prejudicar – o partido atual? O vencedor do Super Bowl pode se correlacionar com o vencedor da eleição?

Grandes Cientistas de Dados sabem que o objetivo é resolver problemas do mundo real. Eles usam dados para fazer isso, mas eles não param por aí.

Naturalmente, uma dose saudável de ceticismo deve estar presente em cada uma dessas análises (é difícil ver qualquer relação entre um jogo de futebol e uma eleição presidencial), mas para grandes Cientistas de Dados, este negócio de explorar o mundo a partir de tantos ângulos quanto possível, sendo profundamente curioso sobre os dados, digitalizados ou não, e perguntando como as peças se encaixam, nunca para. Se você não está ativamente fazendo isso, tome medidas para ficar mais atento e incorporar essas atividades em seu trabalho diário. Aqui vão as 3 atividades essenciais de um grande Cientista de Dados:

1- Primeiro, veja como os dados são realmente coletados. Os instrumentos de medição ficam entupidos com areia, os pesquisadores não seguem seus scripts e os desenvolvedores de pesquisas, inadvertidamente, projetam seus instrumentos de maneira que prejudique os resultados. Você não pode assumir que seus dados são imparciais e corretos. Verifique por si mesmo.

2- Em segundo lugar, conheça o contexto completo em que você trabalha. Olhe para o negócio, os problemas críticos que você enfrenta e nuances aparentemente despercebidas. Leia, estude e vá para conferências. Construa e utilize uma extensa rede com foco especial em pessoas fora do campo da Ciência de Dados. Procure gerentes experientes que o ajudarão a compreender o negócio. Peça que alguns deles sejam seus mentores informais. Você pode ter que cutucá-los de vez em quando, mas você provavelmente vai encontrar muitas pessoas ansiosas para ajudar.

3- Em terceiro lugar, integre esses esforços em seu dia-a-dia de trabalho. Participe de análises importantes com aqueles que podem ajudá-lo a enquadrar e materializar o problema real e sugerir conjuntos de dados e teorias que você pode não ter considerado. Conecte-se com pessoas que têm perspectivas diferentes. Certifique-se de informar – de maneiras que os tomadores de decisão possam entender – suposições, incertezas nos seus resultados e preocupações.

Grandes Cientistas de Dados sabem que o objetivo é resolver problemas do mundo real. Eles usam dados para fazer isso, mas eles não param por aí. Eles fazem da sua missão, aprender tudo o que puder sobre seus dados, desde onde eles foram criados pela primeira vez. Em seguida, eles questionam e buscam relações aparentemente inexistentes. Essa é uma das razões pelas quais os Cientistas de Dados são os profissionais mais cobiçados em todo o mundo!

Já conhece a Formação Cientista de Dados da Data Science Academy? Ela é única e não existe nada igual em língua portuguesa. São 6 cursos + 1 curso exclusivo de preparação de carreira, mais de 290 horas, 26 projetos, alunos de alto nível para um networking de qualidade, tudo 100% online e 100% em português. Clique no botão abaixo, veja o programa completo, inscreva-se e comece hoje mesmo!

 Quero saber mais

Equipe DSA