Mapa Completo das Funções em Ciência de Dados
Frequentemente publicamos na Timeline da Comunidade DSA em nosso portal artigos exclusivos para nossos alunos dos cursos pagos. Mas decidimos deixar este artigo publicamente disponível aqui em nosso Blog pois o artigo responde dúvidas comuns, especialmente de quem está começando.
Aproveite a leitura!
Gostaria de trazer neste post um resumo sobre as funções em Ciência de Dados. À medida que as empresas vão percebendo a importância da análise de dados e da modelagem preditiva, vemos a adoção cada vez maior da Ciência de Dados como parte da estratégia corporativa. E a área crescendo, naturalmente ocorre uma segmentação maior das funções, levando a muitas dúvidas.
Vou tentar ajudar aqui!
O fenômeno é muito semelhante ao que vem ocorrendo com a área de TI nos últimos 20 anos. Quanto mais as empresas foram adotando tecnologia, mais a área de TI foi crescendo e a segmentação foi surgindo com funções como: Administrador de Sistemas, Administrador de Banco de Dados, Administrador de Dados, Analista de Sistemas, Desenvolvedor, Analista de Segurança, Arquiteto de Soluções, Engenheiro de Sistemas, Engenheiro de Rede, Analista de BI, Analista de TI, Analista de Negócios, Engenheiro de Software, etc….
E a segmentação continua em andamento.
Com a Ciência de Dados a história vai se repetindo: Analista de Dados, Cientista de Dados, Engenheiro de Dados, Arquiteto de Dados, Engenheiro de Machine Learning, Engenheiro DataOps, Engenheiro de IA, Analista de Inteligência de Mercado, Engenheiro Blockchain, Engenheiro de Big Data, Analista de Big Data, DPO (Data Protection Officer), Desenvolvedor RPA, etc…
Em Ciência de Dados (assim como em vários casos em TI), o que temos não são profissões, mas sim funções. Ou seja, não são profissões regulamentadas e sendo assim não há requerimento de ter uma graduação específica, por exemplo. Como funções, na prática, podem ser exercidas por qualquer pessoa ou qualquer tipo de formação, desde que se tenha o conhecimento. Isso causa uma confusão generalizada em quem não dedica algum tempo a compreender os cenários e movimentos do mercado e principalmente em quem está começando.
Esperamos ver uma segmentação cada vez maior nos próximos anos, pois o volume de trabalho aumentando, as equipes de Data Science precisarão de profissionais para diferentes tarefas.
Aqui um resumo das principais funções atualmente:
Analista de Dados
Essa é uma função na qual o profissional é responsável pela parte inicial do processo em Ciência de Dados, como coleta de dados, limpeza, organização, transformação de pré-processamento de dados. Normalmente é o primeiro passo para trabalhar como Cientista de Dados Júnior.
Capacitação Profissional:
Cientista de Dados
Ainda é o profissional mais sexy do século XXI…rsrs (termo que ficou famoso no artigo da Harvard Business Review em 2012).
Esse é um perfil de análise. Não de programador. O Cientista de Dados analisa problemas e encontra soluções. Para isso emprega conhecimento em Estatística, Matemática, Machine Learning, Análise de Dados e conhecimento da área de negócio. Programação aqui é usada como linguagem de script para criar uma sequência de ações para resolver um problema. O Cientista de Dados não é um Engenheiro de Software e o medo que as pessoas tem de programação não se justifica, pois usamos uma linguagem de script (Python ou R, por exemplo) para criar uma sequência lógica de tarefas. O mesmo teria que ser feito com papel e caneta, mas usamos uma linguagem de programação. Uma ferramenta como qualquer outra!
À medida que a função evolui, o Cientista de Dados vai ter que focar cada vez mais em análise e problemas de negócio!
Capacitação Profissional:
Engenheiro de Dados
Esse é um perfil mais de infraestrutura, o profissional que cuida da extração, armazenamento e pipeline de dados. Alguns gostam de comparar essa função com a de DBA (Database Administrator), mas eu considero uma evolução natural da função de DBA, pois o foco do Engenheiro de Dados não é “apenas” no armazenamento de dados estruturados, mas no fluxo completo, desde a extração, passando pelo armazenamento, até servir os dados, em qualquer formato: estruturado, não-estruturado ou em tempo real.
Capacitação Profissional:
Formação Suporte e Infraestrutura de Big Data
Arquiteto de Dados
Essa é uma das funções que mais vem crescendo no mercado.
O Cientista de Dados faz as análises e previsões. O Engenheiro de Dados cria e mantém os pipelines de dados. Quem vai olhar para o design das soluções de dados, pensar em integração, governança de dados, compliance, etc…? O Arquiteto de Dados.
Existe uma certa sobreposição de conhecimentos entre o Arquiteto de Dados e o Engenheiro de Dados. A diferença está na forma. O Engenheiro de Dados é mais executor e o Arquiteto de Dados é mais planejador e designer.
Essa deve ser a função em Ciência de Dados que mais crescerá nos próximos anos.
Capacitação Profissional:
Engenheiro de IA
Engenheiro de IA é uma evolução natural do Cientista de Dados, cujo foco é em soluções avançadas de IA, especialmente Visão Computacional e Processamento de Linguagem Natural. O Engenheiro de IA deve ter os mesmos conhecimentos do Cientista de Dados, mas conhecer bem as arquiteturas de Deep Learning e as particularidades de hardware para treinar esses modelos, com o uso de GPUs e a criação de dados sintéticos, quando necessário.
Acabou a fase de deslumbramento com IA e agora é quando se separa os meninos dos profissionais. As empresas querem pessoas para implementar modelos que resolvam problemas e não para colocar vídeos no Youtube ou fazer post para o Instagram! Soluções de IA em Medicina, Direito, Supply Chain, Marketing, Finanças, Cyber Security e RH estão se tornando realidade.
Esse perfil requer conhecimento em Data Science e especialmente em Deep Learning. E na Formação Engenheiro de IA abordamos isso a partir do zero para capacitar os alunos e prepará-los para o mercado de trabalho.
Capacitação Profissional:
Engenheiro de Machine Learning
Essa função é a interseção entre Cientista de Dados e Engenheiro de Dados. Tem que conhecer bem sobre Machine Learning, da criação do modelo até o deploy, passando pelo pipeline de dados.
Esse é um perfil de produção, ou seja, de alguém com menos foco na análise e mais foco em fazer o processo de modelagem preditiva funcionar. Esse é um perfil híbrido e que deve conhecer muito bem soluções de Machine Learning em nuvem, cuja adoção vem crescendo no mercado.
Capacitação Profissional:
Formação Engenheiro de Machine Learning
Abaixo algumas outras funções relacionadas à área de dados.
Engenheiro DataOps
Esse é outro perfil que vem crescendo bastante, exatamente pela segmentação cada vez maior das funções de Ciência de Dados. E sua principal função tem sido automatizar o processo de Ciência de Dados, fazendo tudo funcionar como um workflow único em uma linha de produção (o que é um grande desafio).
Muitos achavam o Cientista de Dados um verdadeiro unicórnio. O Engenheiro DataOps é o unicórnio com armadura (como no post de um dos alunos na timeline da Comunidade DSA), pois é a interseção do Engenheiro de Machine Learning, Engenheiro de Dados e Arquiteto de Dados.
E quando encontrarem alguém dizendo: “Ain, mas não é possível aprender tudo isso”. Se afastem dessa pessoa para o mais longe que puderem!!! rsrs. Aliás, se afaste de qualquer um que tente reduzir a sua capacidade. Muitas pessoas não tem capacidade e acham que outros também não terão.
Capacitação Profissional:
Formação Engenheiro DataOps (em breve)
Analista de Inteligência de Mercado
Esse é o perfil do Cientista de Dados especialista, com foco em análise macro e microeconômica, empregando análise de dados e modelagem preditiva.
Na prática o Cientista de Dados pode atuar em qualquer mercado, desde que tenha dados disponíveis e algum conhecimento na área de negócio em que trabalha.
Entretanto, veremos cada vez mais esse tipo de perfil, com funções especializadas tais como: Analista de Inteligência em Agronegócio, Analista de Inteligência em Petróleo e Gás, Analista de Inteligência em Hotelaria, Analista de Inteligência Financeira. Todos aplicando Data Science em áreas específicas.
Capacitação Profissional:
Engenheiro Blockchain
Blockchain não tem relação direta com Data Science, mas em última instância é uma solução de dados e por isso incluí aqui.
Blockchain continua crescendo e agora está explodindo por conta das NFTs. Como eu sempre digo: quem dita os movimentos do mercado são as empresas e por isso devemos estar acompanhando seus movimentos e compreender que a velocidade de adoção não é tão rápida quanto muitos gostariam que fosse. A pandemia do Covid-19 deu uma acelerada e colocou CEOs para trabalhar na transformação digital e esperamos ver o crescimento de soluções de Blockchain nos próximos anos.
Esse perfil requer forte conhecimento em programação, sendo quase um Engenheiro de Software especializado em tecnologia Blockchain.
Capacitação Profissional:
Formação Engenheiro Blockchain
Analista e Engenheiro de Big Data
Tudo isso ainda é novo para muitas empresas, então não espere encontrar uma descrição clara das funções em vagas de emprego e nem mesmo uma descrição clara do título de uma vaga.
Analista de Big Data é um dos nomes dados a um Cientista de Dados e Engenheiro de Big Data é quase um sinônimo para Engenheiro de Dados. Mas outras denominações e títulos podem ser visto por aí. Avaliar a descrição da vaga ajuda a compreender que tipo de perfil a empresa está realmente buscando!
Capacitação Profissional:
Equivalente a Cientistas e Engenheiros de Dados
DPO (Data Protection Officer)
Paralelo a esse cenário, a chegada da Lei Geral da Proteção de Dados (LGPD) também tornou um outro perfil de profissional especializado que atua com proteção de dados, um dos mais cobiçados pelas empresas e companhias especializadas em Recrutamento e Seleção: o DPO (Data Protection Officer).
Além de conhecer bem o processo de Ciência de Dados, o DPO precisa conhecer as leis de proteção aos dados, suas implicações, regulamentação e segurança. Espere ver cada vez mais vagas para DPO no mercado.
Capacitação Profissional:
Desenvolvedor RPA
A automação já é uma realidade e cada vez mais empresas buscam formas de automatizar tarefas repetitivas, liberando os seres humanos para tarefas de mais alto valor. RPA (Automação Robótica de Processos) é um conjunto de ferramentas de automação de processos de negócio com grande impacto de redução de custos e aumento de produtividade nas empresas, palavras de ordem em tempos de pandemia global.
E quando associado à Inteligência Artificial, conseguimos automatizar tarefas que requerem maior capacidade cognitiva.
Capacitação Profissional:
E aqui uma dica: não se apaixone pela função, pelo cargo, pelo título e muito menos pela ferramenta. Se apaixone pela solução de problemas. E aí poderá trabalhar em qualquer função, qualquer cargo, com qualquer título e com qualquer ferramenta, aumentando de forma considerável sua empregabilidade.
Perfil Comercial / Gestor
Seja você um gestor interessado em aprender sobre Data Science e IA ou um profissional da área comercial responsável por vender/entregar soluções de IA, preparamos uma capacitação exclusiva para esse perfil, a Formação Inteligência Artificial Para Vendas.
Cursos Complementares
E para complementar o que é estudado em todas as formações temos os 2 cursos abaixo:
R Fundamentos Para Análise de Dados
Design e Administração de Cloud Computing AWS
Confira ainda catálogo completo de cursos:
Catálogo de Todos os Cursos e Formações da DSA
Confira também as Trilhas de Aprendizagem:
Trilhas de Aprendizagem
Equipe DSA
Olá adorei a matéria, mas e o Eng de Software poderia descrever ele na matéria também?
Olá Nataniel. A função de Engenheiro de Software não faz parte do universo da Ciência de Dados e por isso não incluímos no artigo.
Sou DBA, e estou estudando para mirar de carreira, mas ainda tenho dúvidas em qual função de dados escolher. De acordo com o post, a função que mais se aproxima seria a de engenheiro de dados, certo?
Alguma observação/sugestão?
Sim Mayara. Engenheiros de Dados é o que mais se aproxima de um DBA.