Na Parte 1 vimos o que é o Ultralearning e na Parte 2 estudamos as principais técnicas para aprender mais rápido e melhor. Agora você está pronto para aprender a aprender e aplicar em Ciência de Dados tudo que vimos até aqui na série Como Aprender Data Science Mais Rápido.

Assim como é possível otimizar um modelo de aprendizado de máquina para torná-lo melhor, existem algumas maneiras de otimizar sua metodologia de aprendizado para construir um sistema eficaz de aprendizado.

A Parte 3 é exatamente sobre otimizar o seu processo de aprendizado em Ciência de Dados. Sao 5 princípios fundamentais: Direcionamento, Treino Focado, Recuperação, Feedback e Retenção.

“O crescimento intelectual deve começar no nascimento e cessar apenas na morte.” -Albert Einstein

Leitura imperdível.

1. Direcionamento

Data Science é um campo amplo que envolve muitas disciplinas. Aprender todas as habilidades necessárias apenas com a educação formal é implausível. Imagine que, depois de concluir um bacharelado, você procure um estágio ou mesmo um emprego e não tenha nenhuma experiência no mercado. Imagine que tudo o que você estudou na faculdade nos últimos quatro anos não o preparou para o mundo real. Essa é uma situação comum e é chamada de falha na transferência.

Transferência é o processo de aprender algo em um contexto (estatística e programação) e depois transferi-lo para outro (prever o aumento da temperatura da Terra nos próximos 20 anos). Apesar de sua importância, a educação formal geralmente falha em otimizar a transferência. Ironicamente, esse conceito de transferência de aprendizado também existe em Deep Learning.

O problema da educação formal é que ela estabelece um caminho indireto entre o contexto de aprendizagem e o ambiente-alvo – o contexto no qual as habilidades e os conhecimentos aprendidos são aplicados. Por exemplo, você aprende sobre álgebra linear na faculdade e passa horas praticando com exercícios. No entanto, quando se trata de aplicar os conceitos na Ciência de Dados, você não transfere esse conhecimento para a aplicação prática, pois não possui a compreensão sobre quais conceitos (como determinantes, matrizes, auto-vetores, processos de Gram-Schmidt, etc.) realmente são relevantes para cada problema. Em outras palavras, você não entendeu a essência da álgebra linear, apenas praticou o uso de fórmulas.

O estudo de Estatística e Probabilidade em uma sala de aula na faculdade está muito longe de como aplicamos no mundo real, para tomar a decisão certa diante da incerteza usando a metodologia estatística.

Os Ultralearners sabem manter o caminho entre o ambiente de aprendizado e o ambiente de destino o mais direto possível. Ao fazer isso, eles cultivam uma qualidade de ultralearning chamada Direcionamento.

A maneira mais direta de aprender algo é fazê-lo. A maneira mais eficaz de aprender a programar é escrever programas. A maneira mais eficaz de aprender Ciência de Dados é se engajar em projetos de Ciência de Dados e resolver problemas do mundo real. 

Percebemos aqui na Data Science Academy como os alunos ainda trazem da faculdade o método de aprendizagem que aprenderam por lá. Vivem pedindo exercícios nos cursos. Muitos não compreendem que fazer exercícios de forma isolada pode ser útil na faculdade, mas pouco efetivo para aprender um skill voltado ao mercado de trabalho. Seu chefe ou seu cliente não vão passar um exercício para você no dia a dia. Vão colocar você em projetos com recursos financeiros limitados e esperam que você entregue o melhor que puder. Por isso os cursos da DSA tem um foco grande em projetos e mini-projetos, tudo sempre mostrado do início ao fim, da definição do problema, à entrega do resultado.

“Para as coisas que precisamos aprender antes de poder fazê-las, aprendemos fazendo-as.” – Aristóteles

Essa abordagem de aprender fazendo é chamada de aprendizagem baseada em projeto. Situa a habilidade que você está aprendendo diretamente no seu ambiente de destino – não é necessário a transferência!

Um dos modos mais extremos, porém eficazes, de aprendizagem baseada em projetos é a aprendizagem imersiva: imersão total no ambiente de destino.

Aplicado à Ciência de Dados, isso pode significar três meses de estágio, competições de Data Science, 100 dias de programação, etc. Obviamente, nem todo mundo tem tempo para aprender via imersão. Além disso, algumas habilidades não se prestam a essa abordagem. Há uma razão para que os pilotos em treinamento não comecem voando em Boeings no primeiro dia de treinamento. Em vez disso, eles aprendem em simuladores de vôo.

Se o aprendizado imersivo não estiver ao seu alcance, use o método do simulador de voo replicando as condições e pressões do seu ambiente-alvo o mais próximo possível.

Se você não conseguir um estágio, participe de competições de Data Science ou inove em seus projetos de Ciência de Dados e resolva problemas pelos quais você é apaixonado, construindo assim um portfólio de projetos. Para replicar as condições e pressões da Ciência de Dados, você pode definir um limite de tempo para o seu projeto e até apresentá-los a seus amigos e familiares (verifique se eles entenderam).

O que quer que você esteja aprendendo, estabeleça um caminho direto entre o contexto de aprendizado e o ambiente de destino. Um bom exemplo: temos aqui na DSA um curso de Matemática Para Machine Learning, onde ensinamos Matemática de forma direcionada, com foco na Ciência de Dados e Machine Learning. Os alunos aprendem um conceito e onde e como ele será aplicado nos seus projetos em Ciência de Dados. Nossos cursos são preparados por Ultralearners para ajudar outros Ultralearners.

Depois de fazer isso, é hora de detalhar e aperfeiçoar sua técnica.

2- Treino Focado

O que atletas de elite, prodígios de piano e ultra-aprendizes de sucesso têm em comum? Todos eles aplicam o treinamento focado para aperfeiçoar suas técnicas e manter sua vantagem competitiva. Então, como você pode treinar estrategicamente para alcançar os melhores resultados?

Fundamentalmente, você nunca deve iniciar seu projeto treinando pesado. Em vez disso, use o Direcionamento primeiro. Para fazer isso, comece com a prática direta, esteja você escrevendo código ou resolvendo problemas de negócios. Use esta prática direta para identificar as áreas que você deseja treinar mais.

Por exemplo, você pode ter uma ótima compreensão dos conceitos de aprendizado de máquina, mas não possui o conhecimento de programação para colocá-los em prática. Nesse caso, é necessário criar um plano de treino focado para aprender Python.

Como você deve projetar seu treino focado? Isso depende da área. O treino focado pode ser facilmente isolado do resto do seu projeto? Nesse caso, tente otimizar o tempo, onde você isola uma etapa de um processo mais envolvente e repita a etapa até aperfeiçoá-la. Se você deseja aperfeiçoar suas habilidades na engenharia de atributos, por exemplo, pode otimizar o tempo detalhando seus recursos de aprendizagem em engenharia de atributos. Ou, separe sua habilidade desejada em diferentes componentes cognitivos e faça cada um separadamente. Por exemplo, na programação Python, você pode realizar treinos focados no Pandas, scikit-learn ou PyTorch.

Se você estiver trabalhando em um projeto mais criativo ou complexo, pode ser difícil analisar isoladamente – é difícil analisar a solução de problemas, por exemplo. Nesse caso, tente o método copycat. Escolha uma pessoa de sucesso que admira, seja o investidor bilionário Warren Buffet ou o empreendedor genial Bill Gates, e imite a maneira como eles resolvem os problemas o mais próximo possível.

Quiz: Por que a transferência de aprendizado é importante? O que é direcionamento? O que é treino focado? Se você teve problemas para responder a essas perguntas, pode precisar trabalhar na recuperação, que é o próximo tópico.

3- Recuperação (Recall)

Aprender estatísticas é uma ótima maneira de melhorar suas habilidades de resolução de problemas – mas apenas se o seu conhecimento adquirido com dificuldade não o abandonar quando você mais precisar dele. É inútil aprender novas habilidades, conceitos e procedimentos se você não conseguir recuperá-los de maneira rápida e eficiente. Como Cientista de Dados, você deve ter a capacidade de entender os dados – até o nível fundamental – e limpar, modelar e apresentar os dados da forma correta. Depois disso, você deve contar uma história sobre seus dados, convertendo sua análise engenhosa em termos leigos. Dito isso, para garantir que você esteja sempre pronto para mexer nos dados e articulá-los, existem dois métodos que você pode usar para melhorar sua taxa de recuperação.

A primeira é a revisão: voltando ao assunto dos materiais que você acabou de estudar.

O segundo é recordar: tentar recordar fatos e conceitos da memória.

Um estudo de 2011 da Universidade de Purdue mostra que o recall é significativamente mais eficaz para retenção de aprendizado a longo prazo, mas a maioria dos alunos opta por estratégias de revisão em vez de estratégias de recall ao tentar consolidar seu aprendizado.

A razão pela qual preferimos revisar a recordar tudo se resume a um conceito chamado julgamento da aprendizagem. Essencialmente, nós humanos acreditamos que aprendemos um conceito quando podemos processá-lo sem nenhuma dificuldade. Na faculdade, os alunos lêem suas anotações repetidas vezes, produzindo a impressão de que captaram as informações. É por isso que gravitamos em direção a estratégias de revisão passiva: elas confirmam nossa percepção de que estamos aprendendo com sucesso.

Mas a percepção não é tudo. Tentar se lembrar de algo a curto prazo significa que você provavelmente se lembrará disso a longo prazo. Os especialistas chamam essa dificuldade de desejável – a dificuldade apresentada pelo recall é, no final das contas, desejável, pois maximiza nossas chances de reter o que aprendemos.

Para aplicar uma estratégia de recall ativo no seu aprendizado, aqui estão três maneiras de fazer isso.

I) Fazer Perguntas

Durante sua sessão de estudo em redes neurais, por exemplo, faça perguntas que forçam você a se lembrar da resposta. Escreva: “Como as redes neurais são aplicadas na vida real?” em vez de “Redes neurais são usadas para classificação de imagens, detecção de objetos, …” Toda vez que você repassar suas anotações, você será forçado a lembrar o que aprendeu.

“É muito importante que os jovens mantenham seu senso de admiração e perguntem o porquê.” – Stephen Hawking

II) Recall Gratuito

Após a sessão de estudo, sente-se com um pedaço de papel em branco e anote tudo o que se lembrar do que aprendeu, com o máximo de detalhes possível.

III) Teste Tudo o Que Você Aprendeu

Por fim, para um desafio mais concreto baseado em recall, defina uma tarefa que testará tudo o que você aprendeu em seu projeto de Ciência de Dados até agora. A vantagem dessa abordagem é que você não precisa perder tempo lembrando aspectos gerais do seu assunto que não se aplicam diretamente ao projeto pretendido; em vez disso, lembre-se de habilidades e conceitos específicos de maneira direcionada, conforme necessário.

Sabe por que o recall às vezes pode ser difícil? Porque temos que assumir que aprender é nossa responsabilidade. Com o recall não podemos transferir a culpa de não aprender para o curso, o professor, a plataforma, o vídeo, o livro ou qualquer outro recurso. O recall é a prova de que somos os grandes responsáveis pelo nosso próprio aprendizado e os recursos de aprendizagem são material de apoio. Aprender é, portanto, uma escolha!

Recuperação dominada? É hora de ser cordial com o feedback.

4. Feedback

Não importa em que nível de especialização você esteja, você precisa buscar feedback sobre seu progresso, se quiser melhorar. Além disso, você precisa aprender a distinguir entre diferentes níveis de feedback e adquirir estratégias para obter feedback.

Quase todo feedback é útil, mas nem todo feedback é criado da mesma forma. É útil dividir o feedback em três categorias diferentes.

Feedback dos Resultados

Esse feedback valida que você alcançou o resultado desejado. Imagine que você está apresentando seus dados e seus clientes compreendem totalmente o resultado e o aplaudem por seu trabalho. Esse é o feedback do resultado. Pode ser encorajador, mas é difícil obter mais informações desse tipo de feedback.

Feedback Informativo

Esse feedback fornece mais detalhes para você trabalhar, pois alerta sobre seus erros. Imagine se você cometeu um erro e seus dados estão totalmente errados. O Gerente da área de Ciência de Dados pode tirar o projeto de você e entregá-lo a outro Cientista de Dados mais experiente. Esse tipo de feedback é útil para destacar áreas problemáticas e isolar seus erros.

Feedback Corretivo

Esse é o melhor feedback, pois indica o que você está fazendo de errado e como corrigi-lo. É aqui que o Cientista de Dados faz anotações sobre o que funcionou bem, o que não deu certo e como você pode melhorar. Nesse cenário, você recebe um feedback corretivo que é construtivo e ajuda a desenvolver e crescer.

“Aceitarei todas as críticas construtivas, irei aprender com o meu erro e seguir adiante” – Julie Payette

Ao classificar seus comentários, concentre-se no feedback corretivo sobre o feedback informativo e no feedback informativo sobre o resultado.

Como você garante que esteja recebendo feedback suficiente em primeiro lugar? Comece lembrando o que falhou no feedback. Se você não está se estendendo ao ponto em que falha, evita receber feedback informativo ou corretivo útil. Se você for além dos seus limites, obterá feedback útil. Atuar com esse feedback, por sua vez, estenderá seus limites.

Também não se esqueça de buscar meta-feedback. É importante buscar feedback sobre o desempenho de seus métodos de aprendizado. Uma maneira simples de testar seus métodos de aprendizado é rastrear sua taxa de aprendizado – tente cronometrar quanto tempo leva para você limpar seus dados, por exemplo. Se a sua taxa de aprendizado não estiver subindo, aja com base nesse feedback negativo revisando seus métodos de aprendizado.

Mas tome cuidado com um tipo de feedback perigoso, a “crítica construtiva de quem nunca construiu nada”. Fique atento de onde está vindo o feedback. Pedir feedback em grupos do Facebook ou fóruns não especializados, com pessoas que sabem menos que você, pode ser mais destrutivo do que se imagina e desviar você do seu foco.

Aqui na DSA oferecemos os Projetos com Feedback. São projetos de conclusão de curso onde o aluno recebe um tema, um problema a ser resolvido e o dataset. O aluno então desenvolve a solução sozinho e envia para receber o feedback da nossa equipe, que aponta os erros e acertos, onde o aluno podia ter aplicado uma técnica melhor, porque uma técnica aplicada foi a escolha certa, etc… Os alunos adoram esse recurso de aprendizagem disponível em quase todos os nossos cursos.

Ao obter feedback e priorizar o feedback corretivo e informativo, você pode ajustar e melhorar constantemente seu desempenho.

5. Retenção

Sua jornada de ultralearning para ser um Cientista de Dados pode não exigir muita memorização, pois tudo pode ser pesquisado nos dias de hoje, mas você precisará memorizar alguns fatos, fórmulas ou procedimentos apenas para acelerar seu processo de trabalho e torná-lo mais eficaz.

Portanto, para aprender as coisas para que elas permaneçam no seu cérebro, a estratégia mais produtiva que você pode empregar é instalar um sistema de memorização e incorporá-lo em estágios regulares e bem espaçados ao longo de sua jornada. A chave é usar um sistema de memorização que seja fácil de integrar ao seu projeto e adequado ao tipo de projeto. Por exemplo, é melhor ter um sistema de rede semântica de sistema de memorização para Ciência de Dados, pois é um campo muito diversificado, com muitos conceitos para se lembrar de diferentes assuntos e estabelece os fundamentos de cada tópico complicado e permite acrescentar novas informações a ele à medida que você aprende. Isso confirma sua capacidade de retenção, pois a base está lá.

Plano de Ação

  • – Acelere da teoria à prática fazendo e mergulhando no processo de aprendizagem.
  • – Use o treinamento focado para aprimorar suas habilidades com perfeição ou o método copycat para aprender com os melhores.
  • – Use as estratégias de recall para recuperar as informações que você aprendeu, fazendo perguntas perpetuamente e testando a si mesmo durante toda a jornada de ultralearning.
  • – Concentre-se no feedback corretivo que ajuda a identificar pontos fracos e melhorar seu desempenho.
  • – Aplique sessões inteligentes de memorização espaçadas estrategicamente usando uma rede semântica de memória que garanta o que você aprende.

 

Na próxima parte, veremos como levar o aprendizado para o próximo nível, cultivar a intuição e experimentar intensamente.

Obrigado pela leitura.

Equipe DSA

Referências:

Ultralearning

How To “Ultralearn” Data Science

This Ultralearner Explains How To Acquire Hard Skills Fast

4 passos para aprender tudo que você quiser, segundo um Nobel da Física