Pouco mais de 10 anos atrás, em 2012, foi publicado o artigo “Data Scientist: Sexiest Job of the 21st Century” (Cientista de Dados: A Profissão Mais Sexy do Século XXI). E Ali nascia uma das profissões de maior sucesso da história da tecnologia, o Cientista de Dados.

Mas, em 2023, Cientista de Dados Ainda é a Profissão Mais Sexy do Século XXI? É o que vamos conferir agora neste artigo.

Boa leitura.


A maioria dos leitores casuais provavelmente se lembra apenas do termo “mais sexy” – um comentário sobre sua demanda no mercado. A função era relativamente nova naquela época em 2012, mas à medida que mais empresas tentavam entender o Big Data, elas perceberam que precisavam de pessoas que pudessem combinar habilidades de programação, análise e experimentação.

Na época, essa demanda era amplamente restrita à área da Baía de São Francisco nos EUA (Região do Vale do Silício) e a algumas outras cidades costeiras. Startups e empresas de tecnologia nessas áreas pareciam querer todos os Cientistas de Dados que pudessem contratar. Ficou claro que a necessidade se expandiria à medida que mais empresas adotassem a análise de dados e novas formas e volumes de dados.

O Cientista de Dados foi então definido como “um profissional de alto nível com formação e curiosidade para fazer descobertas no mundo do Big Data”. As empresas estavam começando a analisar grandes volumes de dados não estruturados, como fluxos de cliques online, mídias sociais, imagens e texto. Como ainda não havia uma carreira bem definida para pessoas que pudessem programar e analisar tais dados, os Cientistas de Dados tinham diversas formações educacionais, o que se tornou ainda mais diversificado ao longo dos anos.

Uma década depois, esse perfil profissional é mais procurado do que nunca por empregadores e recrutadores. A IA (Inteligência Artificial) é cada vez mais popular nos negócios e empresas de todos os tamanhos e localidades sentem que precisam de Cientistas de Dados para desenvolver modelos de IA.

Ao longo de uma década, as postagens de vagas para Cientistas de Dados no Indeed aumentaram 256%, e o Bureau of Labor Statistics dos EUA prevê que a Ciência de Dados terá mais crescimento do que qualquer outro campo até 2029. E profissionais de Ciência de Dados geralmente são muito bem pagos; o salário médio de um Cientista de Dados experiente nos EUA está se aproximando de US$ 200.000 (duzentos mil dólares, por ano).

Muitas das mesmas dores de cabeça também permanecem. Há 10 anos atrás os Cientistas de Dados gastavam muito tempo limpando e organizando dados e esse ainda é o caso, apesar de alguns avanços no uso da própria IA para melhorias no gerenciamento de dados. Além disso, muitas organizações não têm culturas orientadas a dados ainda e não aproveitam plenamente os insights fornecidos pelos Cientistas de Dados. Se isso é um problema, também é uma oportunidade, pois o trabalho do Cientista de Dados pode ter um impacto profundo no dia a dia da empresa trazendo visibilidade profissional.

Mesmo assim, o trabalho mudou – em grandes e pequenos aspectos. Tornou-se melhor institucionalizado, seu escopo foi redefinido, a tecnologia da qual depende deu grandes passos e a importância de conhecimentos não técnicos, como ética e gerenciamento de mudanças, cresceu. Os executivos que reconhecem que a ciência de dados é importante para seus negócios agora precisam criar e supervisionar equipes de Data Science.

Melhor Institucionalizado

Em 2012, a Ciência de Dados era uma área nascente, mesmo em startups orientadas para IA. Hoje está bem estabelecida, pelo menos em empresas com um grande compromisso com dados e IA. Bancos, seguradoras, varejistas, provedores de assistência médica e até agências governamentais, têm grupos substanciais de ciência de dados; grandes empresas de serviços financeiros podem empregar diversos Cientistas de Dados. A ciência de dados também tem sido eficaz em lidar com crises sociais, ajudando a prever casos e mortes de Covid-19, ajudando a lidar com desastres climáticos e até mesmo combatendo desinformação e hacks cibernéticos relacionados à invasão da Ucrânia.

Um fator importante que facilita a institucionalização tem sido o surgimento de ofertas educacionais orientadas para ciência de dados. Em 2012, efetivamente não havia programas de graduação em Ciência de Dados; Cientistas de Dados eram recrutados de outros campos orientados quantitativamente.

Agora, existem centenas de programas de graduação em Ciência de Dados ou áreas relacionadas de análise e IA. A maioria são programas de mestrado, mas também há programas de graduação e doutorado em ciência de dados. Há também um grande número de certificados, ofertas de cursos online e treinamento em campos relacionados à Ciência de Dados. Existem até cursos e currículos de Ciência de Dados do ensino médio.

É claro que qualquer pessoa que deseje ser treinada em ciência de dados terá muitas opções para fazê-lo. Saber reconhecer o programa ideal de capacitação pode ser desafiador e por isso é importante buscar empresas consolidadas no mercado e com experiência em capacitação prática orientada a projetos.

A Data Science Academy está no mercado desde 2016 e já superou a marca de 800 mil profissionais capacitados. Clique aqui para conhecer nossos cursos e Formações.

Cientistas de Dados em Relação a Outras Funções

A área de Ciência de Cados agora também é complementada com uma variedade de outras funções. A suposição em 2012 era que os Cientistas de Dados poderiam realizar todas as tarefas necessárias em um projeto de ciência de dados – desde a conceituação do caso de uso até a interface com as partes interessadas de negócios e tecnologia, para desenvolver o algoritmo e implantá-lo em produção.

Agora, no entanto, houve uma proliferação de funções relacionadas para lidar com muitas dessas tarefas, sendo Engenheiro de Machine Learning, Engenheiro de Dados, Engenheiro de IA, Analista de Dados, Arquiteto de Dados e Engenheiro Analítico as principais. O LinkedIn relatou que algumas dessas funções já são tão populares quanto os Cientistas de Dados em seus relatórios “Jobs on the Rise” de 2021 e 2022 nos EUA.

Como resultado dessa proliferação de habilidades, os executivos e gestores precisam identificar todas as diferentes funções necessárias para implantar efetivamente projetos de ciência de dados em seus negócios e garantir que estejam presentes e colaborando com as equipes.

Mudanças na Tecnologia

Uma razão pela qual o trabalho do Cientista de Dados continua mudando é porque as tecnologias que os Cientistas de Dados usam estão mudando. Algumas tendências tecnológicas são continuações de direções presentes em 2012, como o uso de ferramentas open-source e a mudança para processamento e armazenamento de dados baseados em nuvem.

Mas alguns afetam o núcleo do trabalho de ciência de dados. Por exemplo, alguns aspectos da ciência de dados são cada vez mais automatizados (usando aprendizado de máquina automatizado ou AutoML), o que pode melhorar a produtividade dos profissionais de ciência de dados e abrir a possibilidade para projetos desenvolvidos em menos tempo. Essas ferramentas automatizadas agilizam o trabalho de Cientistas de Dados.

Os Cientistas de Dados perceberam que seus modelos podem ser imprecisos em ambientes de negócios turbulentos como a pandemia de Covid-19. Portanto, há uma nova ênfase no monitoramento de sua precisão após a implantação. As ferramentas de operações de aprendizado de máquina, ou “MLOps”, fornecem monitoramento contínuo de modelos; o retreinamento automatizado de modelos está apenas começando a ser empregado. Algumas ferramentas AutoML e MLOps até testam o viés algorítmico.

Esses desenvolvimentos significam que a programação, que talvez fosse o requisito de trabalho mais comum uma década atrás, é um pouco menos essencial na ciência de dados hoje (no entanto, a limpeza de dados é uma exceção notável a essa tendência). O foco principal do trabalho continua a mudar para a modelagem preditiva e a capacidade de traduzir problemas e requisitos de negócios em modelos. São atividades colaborativas, mas infelizmente ainda não existem grandes ferramentas para estruturar e dar suporte a atividades colaborativas de ciência de dados.

A Ética da Ciência de Dados

Uma grande mudança na ciência de dados na última década é que a necessidade de uma dimensão ética para o campo agora é amplamente reconhecida, embora o tópico raramente tenha sido mencionado em 2012.

O ponto de virada para a ética em ciência de dados foi provavelmente a eleição presidencial de 2016 nos EUA, em que os Cientistas de Dados nas mídias sociais (Cambridge Analytica e Facebook em particular) tentaram influenciar os eleitores e polarizaram ainda mais a política eleitoral. Desde então, considerável atenção tem sido dedicada a questões de viés algorítmico, transparência e uso responsável de análises e IA.

Algumas empresas já estabeleceram grupos e processos de IA responsáveis. Uma função fundamental deles é educar os Cientistas de Dados sobre as questões éticas envolvidas na IA. E há uma maior regulamentação que está sendo instituída em resposta a lapsos éticos.

Cientista de Dados Ainda é a Profissão Mais Sexy do Século XXI?

Há continuidade e mudança no papel da Ciência de Dados, que tem sido notavelmente bem-sucedido de várias maneiras, e alguns de seus desafios – proliferação de funções relacionadas e a necessidade de uma perspectiva ética – resultam em parte da ampla adoção da Ciência de Dados. Parece improvável que a quantidade de dados, análises e IA nos negócios e na sociedade diminua, portanto, o trabalho do Cientista de Dados continuará a crescer em sua importância no cenário dos negócios.

No entanto, também continuará a mudar. Esperamos ver uma diferenciação contínua de responsabilidades e funções que antes se enquadravam na categoria de Cientista de Dados. As empresas precisarão de processos detalhados de classificação e certificação de habilidades para esses diversos trabalhos e devem garantir que todas as funções necessárias estejam presentes em projetos de Ciência de Dados em grande escala.

Os próprios Cientistas de Dados profissionais se concentrarão na inovação algorítmica, mas também precisarão ser responsáveis por conectar a área técnica com a área de negócios de uma empresa. Mais importante ainda, os Cientistas de Dados devem contribuir para a coleta apropriada de dados, análise responsável, modelos totalmente implantados e resultados de negócios bem-sucedidos.

Sim, o Cientista de Dados Ainda é a Profissão Mais Sexy do Século XXI.

Baseado no artigo original em inglês: Is Data Scientist Still the Sexiest Job of the 21st Century?

Equipe DSA