Esta é a penúltima parte da série Como Aprender Data Science Mais Rápido. E o tema não poderia estar mais relacionado com a Ciência de Dados: compreensão profunda e experimentação.

Com as habilidades para otimizar ao máximo o aprendizado, é hora de adotar estratégias para cultivar compreensão profunda e estar aberto a experimentações que gerem inovação.

Em cada caso, usaremos Richard Feynman e Vincent van Gogh, respectivamente, como exemplos.

Cultivando o Entendimento Profundo

O físico Richard Feynman era conhecido por sua estranha intuição; ele tinha o jeito de olhar para um problema complexo e aparentemente arrancar a solução do nada.

O termo técnico para essa habilidade é conhecimento intuitivo e pode parecer bastante misterioso para observadores externos.

Mas há uma explicação perfeitamente racional para os flashes de brilho de Feynman: sua profunda compreensão da física permitiu que ele intuísse conexões e padrões inesperados.

“Aprendi muito cedo a diferença entre saber o nome de algo e saber algo”. – Richard P. Feynman

Para ser um Cientista de Dados de sucesso, é preciso tempo e paciência para aumentar o nível de entendimento profundo sobre o qual a experiência intuitiva é construída.

Mas, ao empregar essas quatro estratégias, você pode acelerar a taxa na qual a adquire.

1. Domine o Básico

Comece voltando ao básico. Feynman era famoso por fazer “perguntas estúpidas” e frustrava seus alunos bombardeando-os com perguntas sobre conceitos básicos.

No entanto, Feynman sabia algo que seus alunos ainda tinham que aprender: é impossível avançar para conceitos complexos quando você tem apenas uma vaga compreensão dos conceitos fundamentais. Antes de aprender a correr é preciso aprender a andar.

Por outro lado, é impossível se tornar um especialista intuitivo até que você conheça de dentro para fora os conceitos fundamentais de seu campo.

A Ciência de Dados requer conhecimento em matemática e aprendizado de máquina.

No entanto, isso não significa que você precise memorizar cada teoria e fato. Na realidade, existem inúmeras bibliotecas e pacotes que permitem aplicar matemática e Machine Learning aos seus projetos.

Tudo que você precisa é de um entendimento básico dos conceitos e uma visão de como e onde eles são aplicados. Portanto, certifique-se de dominar os conceitos fundamentais e está pronto para seguir adiante.

2. Siga o Caminho Mais Longo e Difícil

Uma experiência desafiadora de aprendizado pode levar a uma compreensão mais profunda do assunto.

É por isso que você deve tentar abraçar a luta. Resista a tomar atalhos no seu aprendizado; se houver duas maneiras de chegar a uma solução, escolha a mais longa e que requer mais envolvimento, pelo menos enquanto estiver aprendendo.

Em vez de usar dados limpos e bem estruturados para seus projetos, use dados não estruturados e comece a limpá-los.

Isso o preparará para lidar com qualquer tipo de dados que você receber no futuro. No seu próximo projeto de Ciência de Dados, tente usar dados brutos e limpá-lo você mesmo. Você aprenderá muito.

3. Perseverar em Obstáculos Difíceis

Tente não desistir imediatamente quando as coisas ficarem difíceis. Em vez disso, implemente um cronômetro de esforço. Force-se a se sentar com todos os desafios ou obstáculos por pelo menos 10 minutos antes de procurar uma solução mais simples.

Fazer as perguntas certas pode ser imensamente difícil, pois isso exige criatividade, análise, muita pesquisa, etc. Basicamente, resolver um problema exige que você se sente e comece a fazer um brainstorming com caneta e papel. O exercício de refletir sobre uma mensagem de erro ao executar um comando, por exemplo, é um aprendizado por si próprio.

Em vez de tirar conclusões precipitadas e se apressar na solução, contemple-as e avalie todos os fatores envolvidos. Reduza sua ansiedade pela chegada e aprecie a jornada.

4. Replicar Conceitos Para Você Mesmo

Por fim, aprofundar sua compreensão dos principais conceitos, replicando-os para si mesmo. Observe as ideias e processos formulados por especialistas em sua área e tente prová-los ou replicá-los por si mesmo.

Em outras palavras, você está entendendo o procedimento e os padrões de pensamento por trás dele. Isso oferece a você a oportunidade de obter conhecimento profundo e experiência intuitiva.

Como Cientista de Dados, você pode ler artigos, trabalhos ou blogs que oferecem uma visão geral de como são os processos e o fluxo de trabalho.

Por exemplo, você assiste a um vídeo no curso gratuito de Python Fundamentos na DSA sobre como usar o TensorFlow para realizar a classificação de imagens. Depois de assistir atentamente, você replica todo o processo e aplica o TensorFlow ao seu modelo com sua própria funcionalidade personalizada e caso de uso.

Experimentação

Como Vincent Van Gogh passou de um abandono da escola de arte, onde os colegas de classe o consideravam como um pintor “não digno de nota”, para o artista inovador que pintou obras de arte como Sunflowers e Starry Night?

Através de experimentação contínua e implacável. Olhe para toda a obra de van Gogh e verá que ele não acertou sua estética distinta imediatamente.

Em vez disso, ele tentou incansavelmente diferentes estilos e técnicas até dominar seu ofício. Então, ele experimentou ainda mais, finalmente chegando a um estilo único.

A experimentação é o ingrediente secreto do ultralearning – a técnica pode levar você de um profissional experiente a um verdadeiro inovador. Mas, a experimentação pode parecer um pouco desafiadora no começo. Apenas vença a inércia e comece.

Importância da Experimentação em Ciência de Dados

As experiências são projetadas para identificar relações causais entre variáveis e este é um conceito realmente importante em muitos campos e particularmente relevante para os Cientistas de Dados atualmente.

A natureza da Ciência de Dados é experimental. Você não sabe a resposta para a pergunta feita a você – ou mesmo se existe uma resposta. Você não sabe quanto tempo levará para produzir um resultado ou quantos dados você precisa. A abordagem mais fácil é apenas ter uma ideia e trabalhar nela até que você tenha alguma coisa.

Um Cientista de Dados profissional sabe quais caminhos ele pode explorar que são mais propensos a realmente impactar o desempenho do modelo. Eles são capazes de fazer hipóteses e realizar experimentos com a maior probabilidade de realmente melhorar o desempenho do modelo.

Esse “sentido” do que é a coisa “certa” a fazer provém da experiência primeiro, em segundo da compreensão do conjunto de dados e finalmente do conhecimento técnico.

Ser um bom “artista” significa ser um bom trabalhador: você gasta menos tempo tentando becos sem saída e mais tempo fazendo melhorias valiosas em seus modelos.

Com isso, é evidente que a noção principal de Ciência de Dados é sobre experimentação.

Um cientista usa o método científico para coletar evidências empíricas em muitos experimentos relacionados a uma hipótese, para apoiar ou contradizer uma teoria.

Um Cientista de Dados, fundamentalmente, é um cientista que experimenta dados continuamente até que o modelo (teoria) seja preciso (válido).

Três etapas para experimentação:

1. Referências

Se você está se perguntando por onde começar, uma técnica que você pode usar é utilizar outros profissionais como referência. Pesquise por papers e veja o que os principais Cientistas de Dados do mundo estão estudando e fazendo.

2. Restrições

Outra coisa que você pode fazer para iniciar sua experimentação é impor algumas restrições a ela.

Isso pode parecer contra-intuitivo, mas limitar sua criatividade pode ajudá-la a florescer. Isso porque trabalhar dentro de limites rígidos pode ajudá-lo a abandonar seus hábitos de trabalho e forçá-lo a tentar algo novo.

3. Ambiente Híbrido

Finalmente, mire no inesperado, criando um ambiente híbrido dos seus materiais, técnicas ou habilidades para encontrar sua superpotência oculta. A combinação de dois elementos aparentemente díspares pode levar a ótimos resultados.

Por exemplo, se você tem formação em astrofísica e é apaixonado por arte e música, pode usar o aprendizado de máquina para visualizar um buraco negro, criar simulações e até prever como são os planetas e estrelas a bilhões de anos-luz de distância .

Usando pacotes como astroML e Deep Learning, o céu é o limite. Com experimentação e criatividade vigorosas, e criando um ambiente híbrido do seu conjunto de habilidades, você pode criar um trabalho inovador e alcançar o impossível.

Plano de Ação

Para realmente se tornar um Cientista de Dados, é preciso desenvolver um entendimento profundo dos dados e ser ousado ao experimentar diferentes modelos. Essas duas qualidades garantirão o sucesso de extrair informações ocultas dos dados e gerar informações valiosas.

Quatro etapas que você deve seguir hoje:

  • – Domine o básico.
  • – Pegue a rota mais longa e persista na dificuldade.
  • – Busque especialistas coo referência.
  • – Experimente diferentes ferramentas e conjuntos de habilidades.

 

Obrigado pela leitura! Esperamos que esta série esteja sendo útil para você. 

Equipe DSA

Referências:

Ultralearning

How To “Ultralearn” Data Science

This Ultralearner Explains How To Acquire Hard Skills Fast

4 passos para aprender tudo que você quiser, segundo um Nobel da Física