À medida que a Inteligência Artificial se prolifera e cada vez mais as empresas tentam fortalecer suas equipes de Cientistas de Dados, um novo conceito está surgindo – o “Full-Stack Data Scientist” ou “Cientista de Dados Full-Stack”. O que é esse novo papel? O que uma organização deve fazer sobre isso? Cientista de Dados Full-Stack – Mito, Unicórnio ou Novo Padrão? Vamos responder a estas perguntas agora.

O Que significa o termo Full-Stack?

O termo “Desenvolvedor Full-Stack” é uma maneira de descrever um desenvolvedor familiarizado com toda a pilha de desenvolvimento em suas respectivas áreas. Isso pode incluir as seguintes camadas: (1) ambientes de servidor, rede e hospedagem, (2) modelagem de dados, (3) lógica de negócios, (4) camada de API, (5) interface do usuário (6) experiência do usuário e (7) entendimento de negócios.

Especificamente no desenvolvimento web, o termo “Desenvolvedor Full-Stack” tornou-se popular e é a descrição principal para a maioria das vagas de emprego. Nessa área, inclui principalmente um desenvolvedor capaz de desenvolver soluções de front-end e back-end, por exemplo, alguém com habilidades em NodeJS, SQL, HTML, CSS e Javascript.

E o termo “Full-Stack” vem sendo usado para descrever um Cientista de Dados moderno. E, embora o termo venha sendo usado esporadicamente, ele ainda não foi totalmente estabelecido na comunidade.

O que é um Cientista de Dados Full Stack?

Ainda não existe uma definição padrão do FSDS (Full-Stack Data Scientist ou Cientista de Dados Full-Stack), mas existem dois pontos de vista emergentes:

1- Um Cientista de Dados capaz de entender e executar não apenas a análise de dados e o desenvolvimento do modelo de Machine Learning, mas também a implantação e a integração do modelo com as aplicações de negócios. Dois exemplos dessa linha de pensamento: (a) Os Cientistas de Dados devem aprender como desenvolver seus modelos nas APIs REST para consumo de aplicativos e (b) os Cientistas de Dados devem criar aplicações e/ou dashboards para apresentar seus resultados e previsões.

2- Um Cientista de Dados que pode entender as necessidades da empresa e explicar porque a nova abordagem de IA / Machine Learning gera melhor retorno do investimento (ROI) do que o que a empresa estava fazendo antes.

Contratar Cientistas de Dados regulares já é bastante difícil. Agora eu preciso contratar Cientistas de Dados Full-Stack?

Como as duas definições acima são de indivíduos que mesclam conhecimento técnico em Ciência de Dados com perspicácia nos negócios ou habilidades de desenvolvimento, é difícil argumentar que essas pessoas não seriam valiosas para as empresas. No entanto, muitas empresas estão lutando apenas para contratar e reter Cientistas de Dados “regulares” (que dominam o conhecimento técnico em Ciência de Dados) em equipes bem-sucedidas e produtivas.

A própria Ciência de Dados é uma disciplina multifacetada, na qual o Cientista de Dados precisa dominar conceitos fundamentais em Matemática e Estatística, domínio em Programação de computadores e Machine Learning, além de conhecimento de negócio. O Cientista de Dados Full-Stack precisa saber tudo isso e ainda ter conhecimento e experiência em desenvolvimento de aplicações e conhecimento e experiência em Engenharia de Dados, tornando-se assim um profissional completo, capaz de iniciar um projeto em uma das pontas com a definição do problema de negócio, passar por todo o processo de análise e modelagem preditiva, desenvolver uma aplicação para o deploy da solução e arquitetar e construir o pipeline de dados para manter a aplicação.

O Full-Stack Data Scientist adiciona ainda mais dimensões a um problema de contratação já complexo:

  • Como você avalia e define os requisitos para os Cientistas de Dados Full-Stack?
  • Quanto conhecimento de negócios e implantação em produção é esperado que eles tenham?
  • Quem deve entrevistar esses candidatos para avaliar essas dimensões? Gerentes de produto? Equipes de operações?
  • -Como esse papel funciona na organização – onde eles se encaixam e quem / o que eles precisam para ter sucesso?

Mestres da Integração

Uma complicação significativa da tendência do FSDS é que o nível de competência verdadeira nos aspectos do Full Stack não é claro. Essas pessoas são especialistas em Ciência de Dados que têm consciência e valorização do trabalho de negócios e deploy em produção que precisam ser realizados para tornar um modelo bem-sucedido para uma empresa? Ou eles devem executar e possuir essas etapas adicionais (ou seja, criar e executar código de produção ou gerar, avaliar e ser responsável pelos retornos dos negócios?). Eles são indivíduos que podem não ter profundidade em nenhuma área, mas são mestres em integração (fazendo tudo funcionar)?

Cientista de Dados Full-Stack é o profissional capaz de prover uma solução de Ciência de Dados de ponta a ponta!

Embora a conscientização seja claramente boa, a probabilidade de que um único indivíduo possa dominar todas as três áreas (ciência de dados, deploy em produção e visão de negócios) é baixa. Todas as três áreas levam anos para aprender, e o verdadeiro domínio de qualquer combinação leva anos de prática. Mas não é impossível.

Atualmente o conhecimento e o aprendizado estão amplamente disponíveis através de cursos online dinâmicos e orientados ao mercado de trabalho, ministrados por profissionais que compartilham suas experiências. Se alguém estiver motivado a aprender, se tornar um profissional “Full Stack” não é assim tão difícil. E para muitos empreendedores essa é a única opção.

Quanto ao domínio da integração, se o indivíduo tiver construído e implantado soluções de IA muitas vezes, provavelmente será o Mestre da Integração. No entanto, as soluções de IA de produção bem-sucedidas ainda são poucas e distantes, e até a experiência de fazê-lo em uma vertical (como serviços on-line onde a escala é crítica) não prepara totalmente um indivíduo para fazê-lo em uma vertical diferente (como finanças – onde os regulamentos abundam). Finalmente, mesmo os FSDSs que possuem conhecimento para o deploy em produção não podem operar sozinhos. A integração com a equipe de operações de uma empresa é frequentemente necessária para garantir que os requisitos de negócios, como conformidade e segurança, sejam atendidos e as diretrizes corporativas sejam seguidas. 

Então, o que uma empresa pode fazer?

A tendência para o Cientista de Dados Full-Stack é boa de várias maneiras. Por exemplo:

Ele destaca uma mudança de foco – a importância não apenas da criação de modelos, mas de todo o ciclo de vida (da necessidade dos negócios à integração de aplicações) necessário para que as empresas realmente tenham retorno de seus projetos com a IA.

Isso mostra que todos os indivíduos nesse ciclo de vida devem estar pelo menos cientes (e de preferência pelo menos parcialmente competentes) do ciclo de vida completo. Essa conscientização e competência beneficiam os negócios e o indivíduo – aumentando as chances de que os modelos de ciência de dados sejam usados e gerem um verdadeiro impacto nos negócios.

Há várias coisas que uma empresa pode fazer para que a tendência do FSDS funcione a seu favor:

Adoção do ciclo de vida completo da IA.

O ciclo de vida completo da IA, vai desde a definição de problemas de negócio, desenvolvimento de modelos, implantação, integração de aplicativos e, finalmente, retorno e otimização de negócios. Quanto mais a sua empresa adota o ciclo de vida completo, maior a probabilidade de um Cientista de Dados poder mostrar seu valor ou conhecimento de produção, independentemente do nível dessas habilidades que possui.

Criação de equipes de Ciência de Dados Full-Stack com foco no ciclo de vida dos projetos.

O ciclo de vida completo precisa de vários conjuntos de habilidades. Os projetos de IA devem ser planejados para garantir que todos os conjuntos de habilidades necessárias para a execução bem-sucedida (mapeamento de negócios, ciência de dados, produção, integração de aplicativos) estejam presentes na equipe, e não em um único indivíduo. Se os membros da equipe estiverem cientes (ainda que superficialmente) do que essas etapas realmente envolvem, maior a probabilidade de o projeto ser bem-sucedido. A experiência complementar da equipe garantirá que todas as etapas possam ser executadas sem tentar encontrar competência completa em um único indivíduo. Enquanto isso, os FSDSs encontrarão um lar favorável nessa equipe, tornando mais fácil tanto para o negócio alavancar suas habilidades quanto para que o FSDS gere um impacto na empresa.

Automação 

Trazer todas as competências necessárias para um ciclo de vida de IA é um desafio. Essa dificuldade é uma das principais razões pelas quais a maioria das empresas ainda luta para obter ROI de seus investimentos em IA. A automação pode ajudar a aliviar a carga e reduzir os riscos. Além de ferramentas como AutoML, que se concentram na construção de modelos, o aumento da automação de todo o ciclo de vida e as melhores práticas de produção, como a implantação de modelos baseados em REST, pode tornar mais fácil para sua equipe fornecer soluções robustas de IA e FSDSs iniciantes para agregar valor em colaboração com equipes de operações experientes.

Habilitar outras funções (como Desenvolvedores) a tornarem-se proficientes em Ciência de Dados.

Enquanto o FSDS se concentra nos Cientistas de Dados que se tornam proficientes no desenvolvimento de aplicações (com deploy em produção) e dos negócios, a direção oposta (funções de desenvolvedores com conhecimento em ciência de dados) também é valiosa. Em particular, as experiências de grandes empresas de IA bem-sucedidas mostram a importância da conscientização dos desenvolvedores sobre IA / ML. Os desenvolvedores também são considerados a próxima onda de implementadores de IA e usuários internos de IA. O sucesso final de qualquer projeto de IA depende dos benefícios dos aplicativos de negócios. Se os desenvolvedores de aplicativos tiverem um papel ativo na equipe de Ciência de Dados que está adicionando insights baseados em IA a seus aplicativos de negócios, maior será o sucesso.

Definir métricas de sucesso nos negócios.

Como todos os projetos, sua solução de IA será aprimorada em várias execuções repetidas do ciclo de vida. Você identificou métricas para avaliar se a IA está gerando ROI em relação à linha de base não-IA? Por exemplo, se a IA está recomendando novos produtos, os clientes compraram mais produtos ou clicaram em mais produtos após a recomendação da IA do que antes? Há muitas oportunidades para otimizar as iterações do ciclo de vida – de algoritmos mais avançados a menor latência de produção. Os índices quantitativos e mensuráveis de negócios que são ortogonais aos modelos e à abordagem de Ciência de Dados darão a todos da equipe de ciência de dados um foco exclusivo e uma metodologia orientada a dados para priorizar melhorias.

Para Reflexão

Estamos entrando em uma nova fase de crescimento da Inteligência Artificial. Empresas e países estão percebendo que é necessário um amplo treinamento da força de trabalho para realmente se beneficiar dessas tecnologias fundamentais. Há alguns anos, a tendência era a democratização da Ciência de Dados e o “Citizen Data Scientist” – um reconhecimento de que não havia Cientistas de Dados suficientes e mais pessoas necessárias para construir modelos.

Muitos chamaram os Cientistas de Dados de “Mitos” ou “Unicórnios” e hoje eles são o novo padrão. Acontecerá o mesmo com o Cientista de Dados Full-Stack?

O Cientista de Dados Full-Stack destaca a próxima onda – a constatação de que a construção de modelos não é suficiente e todos precisam apreciar e executar o ciclo de vida completo da IA. Isso é uma coisa boa. No entanto, como todas as tendências, se beneficiar disso exige trabalho. As práticas acima podem ajudar as empresas a se beneficiarem do Full Stack Data Scientist, tanto individualmente quanto em equipe, e capacitar suas organizações para a realidade de um futuro comercial orientado à IA.

E você, o que acha? Cientista de Dados Full-Stack é um Mito, Unicórnio ou o novo Padrão? Deixe sua mensagem abaixo! Mas tome cuidado: muitas pessoas não serão capazes de aprender tudo que puderem e acharão que ninguém é capaz. Não há limites para o aprendizado, exceto o que você impõe a si mesmo!

Seja como for, a demanda por Cientistas de Dados continua aumentando a cada ano e o profissional que for capaz de unir diferentes habilidades e conhecimentos pode não apenas garantir sua empregabilidade, mas salários bem acima da média.

Para 2020, o Cientista de Dados é apontado com uma das 5 carreiras mais promissoras. Pelo sexto ano consecutivo.

 

Equipe DSA

 

Referências:

The Full Stack Data Scientist: Myth, Unicorn, or New Normal?

What is a Full Stack Data Scientist?

New Series: The Full Stack Data Scientist

Next wave of AI implementers and internal AI users

What is a Full Stack developer?