Você decidiu fazer um upgrade na sua carreira e aumentar sua empregabilidade. Já percebeu que as profissões ligadas a Data Science são as mais promissoras para os próximos anos, oferecendo salários cada vez mais altos. Já sabe que Cientistas de Dados e Engenheiros de Dados estão entre os profissionais mais cobiçados pelas empresas em todo mundo. E já sabe que para aprender a trabalhar com Ciência de Dados você precisa de um bom equipamento.

Mas aí começam as dúvidas: Qual o Melhor Computador Pessoal Para Aprender Data Science? Posso usar minha máquina atual ou devo investir em um novo computador? Laptop ou Desktop? Quais os requisitos? Preciso de mais memória RAM ou mais CPU? Preciso de uma GPU?

Ufa! São tantas as dúvidas que recebemos dos nossos alunos que decidimos criar este artigo, ou melhor, este guia, para ajudar você a aprender Data Science de forma efetiva. Não iremos focar aqui em fabricantes de hardware, mas sim sobre especificação técnica dos equipamentos. Portanto, este artigo não tem vínculo com qualquer fornecedor de hardware, sendo exclusivamente a visão da DSA sobre o tema.

Fique à vontade para deixar seus comentários ao final do artigo.

Vamos começar!

Ambiente em Nuvem ou Computador Pessoal?

Sim, sabemos o que muitos vão dizer: por que investir em um computador se eu posso usar ambiente em nuvem sem custo? Esta é uma boa pergunta e as opções em nuvem são muitas, desde AWS, Azure e Google Cloud com seus planos e serviços gratuitos, até mesmo provedores que oferecem ambiente dedicado em nuvem com baixo custo. Se você acredita que pode usar apenas ambiente em nuvem e não quer investir em um computador, ok. Estamos de acordo e, portanto, este artigo não é para você.

Mas a grande maioria dos alunos nem mesmo sabe o que é Cloud Computing, muitos vem das mais diversas áreas e estão iniciando a caminhada em Ciência de Dados e ter um bom equipamento é a oportunidade de aprender Data Science antes de pensar em Cloud Computing. E mesmo a computação em nuvem, com todas as suas vantagens, tem limitações, o que pode gerar custo se não for bem dimensionado. Nada impede que o aluno tenha um equipamento um pouco mais modesto e utilize ambiente em nuvem quando for necessário processamento mais intenso, o que aliás pode trazer uma boa relação custo/benefício

E para aqueles que acreditam que tudo se resolve usando apenas o Google Colab (uma espécie de Jupyter Notebook em nuvem), a pergunta: e quando você tiver que ajustar o sistema operacional, instalar ferramentas adicionais ou realizar outras operações além de apenas escrever código? Um computador pessoal, poderia ajudar, não?

Devo Investir em um Novo Computador?

Embora nossa central de suporte e nossos instrutores recebam esta pergunta quase todos os dias, quem deve responder esta pergunta é você, caro leitor! Se quer realmente trabalhar com tecnologia, ter um bom computador é um investimento necessário, ou você acha que os softwares atuais ainda rodam em um Pentium 233? A tecnologia evolui, os softwares evoluem e seu computador, se for usado para mais do que navegar na internet ou assistir vídeos no Youtube, também deve ser atualizado. Se bem planejado, esse investimento pode trazer dividendos rapidamente, com um aprendizado mais rápido ou mesmo com atividades de consultoria que você pode realizar com a sua máquina. Pense sobre isso!

Qual a Especificação Ideal?

Você não trabalha com grandes volumes de dados no seu sistema local. Sua máquina é usada em “experimentos controlados”, o que significa que você pega alguns dados e constrói sua lógica/design/modelo, realizando os testes conforme necessário. Portanto, sua máquina não precisa ser um ultra-super-mega-computador-das-galáxias, mas deve ter uma performance razoável para que você possa conduzir seus experimentos e chegar a um resultado em tempo satisfatório. Se necessário, sempre é possível usar um ambiente em nuvem mais robusto para processar volumes de dados muito grandes. A especificação ideal pode variar dependendo dos seus objetivos de carreira e estudo.

Na sequência do artigo vamos detalhar a especificação pelos componentes principais do computador e você pode usar as dicas como ponto de partida. Essas especificações tomam como base nossa interação com milhares de alunos da DSA e assim podemos recomendar a configuração ideal para seu computador com base em dados reais e não suposições. 🙂

CPU – O Coração do Computador

A CPU (ou apenas processador) é um dos itens principais de qualquer computador. Aqui recomendamos um Intel Core i5 ou i7 (ou processador equivalente de outro fabricante). Com um processador Core i3 você consegue realizar muitas tarefas, porém com menor performance. Se a tarefa de análise for um pouco mais pesada, o Core i3 pode não dar conta do recado.

É relativamente simples ajustar seus modelos de Machine Learning para que usem mais ou menos memória RAM, mas ajustar seu código para seja executado em paralelo na CPU é bem mais complexo e muitas bibliotecas nem mesmo estão preparadas para isso. Portanto, escolha seu processador com cuidado.

Processadores AMD Ryzen versões 7 e 9 também apresentam ótima performance.

Recomendação (Ideal): Intel Core i7.

Recomendação (Mínima): Intel Core i5.

Nota: Se você optou por migrar para um computador com um dos novos processadores M1 e M2 da Apple, vai ganhar consideravelmente em performance, mas poderá ter problemas de compatibilidade com alguns softwares.

Memória – Lembre-se Dela

O mínimo de RAM que você precisaria na sua máquina seria de 8 GB. No entanto, 16 GB de RAM são recomendados para processamento mais rápido de redes neurais e outros algoritmos de aprendizado de máquina mais pesados, já que isso aceleraria significativamente o tempo de computação. Pessoalmente, 8 GB de RAM funcionam muito bem se você construir seus algoritmos de forma muito eficiente. Com 4 GB de RAM você consegue executar tarefas mais simples de processamento, mas quando for necessário trabalho mais intenso ou mesmo uso de máquinas virtuais, dificilmente 4 GB de RAM darão conta do recado. Com 2 GB de RAM você provavelmente mal consegue acessar páginas na web, que dirá processar modelos de Machine Learning.

Recomendação (Ideal): 16 GB de RAM.

Recomendação (Mínima): 8 GB de RAM.

Armazenamento – Precisamos de Espaço

Os discos SSDs tornam sua máquina incrivelmente rápida. No entanto, obter uma máquina com uma boa quantidade de armazenamento SSD pode ter um custo bem alto. Tendo isso em mente, você pode ter na sua máquina um disco SSD de 128 a 512 GB para instalar o SO e os principais softwares de análise e um disco HDD de 1 TB para armazenar seus datasets ou outros arquivos.

Recomendação (Ideal): Um disco SSD de 1 TB e um disco HDD de 1 TB.

Recomendação (Mínima): Um disco SSD de 256 GB e um disco HDD de 512 GB.

Preciso de GPU? Depende

As GPUs (Graphical Processing Units) são processadores projetados para gerar gráficos de computador. Nos últimos anos, dada a sofisticação e necessidade de realismo dos recentes jogos de computador e motores gráficos, as GPUs acumularam grandes poderes de processamento. A NVIDIA lidera o jogo, produzindo processadores com vários milhares de núcleos projetados para computação com quase 100% de eficiência. Acontece que esses processadores também são adequados para realizar o cálculo de redes neurais, a multiplicações de matrizes. 

A briga entre os processadores Intel e as GPUs NVIDIA favoreceu a rápida evolução das GPUs devido à grande quantidade de núcleos das GPUs, compensando a velocidade dos clocks de CPU. Os núcleos das GPUs são uma versão simplificada dos núcleos de CPU, e ter muitos deles permite maior nível de paralelismo e, portanto, maior desempenho.

Neste momento, as GPUs são a norma na construção de sistemas de Deep Learning e podemos, por exemplo, treinar um modelo em grandes lotes de 128 ou 256 imagens de uma vez em apenas alguns milissegundos. Mas as GPUs consomem aproximadamente 250 W de energia e requerem um PC completo para suportá-las, com 150 W adicionais de energia. Não menos do que 400 W pode entrar em um sistema de GPU de alto desempenho. Ou seja, usar uma GPU requer consequentemente usar um computador com maior capacidade de prover energia, o que acarreta maior custo total.

Mas só precisamos realmente de GPU se trabalhamos com grandes modelos de Deep Learning. Por exemplo, na Formação Cientista de Dados aqui na DSA trabalhamos amplamente com Machine Learning, construindo grandes modelos e sem usar GPU. Já na Formação Engenheiro de Inteligência Artificial usamos GPU em diversos cursos, mas sempre entregamos os projetos de forma que os alunos possam usar ou não GPU. Trabalhamos principalmente com a GPU RTX 3080 da Nvidia.

Recomendação (Ideal, caso use Deep Learning): RTX (para desktop ou laptop) ou Nvidia Quadro (para servidor).

Recomendação (Mínima, caso use Deep Learning): GTX 1050.

Nota: Embora seja possível usar GPUs de outros fornecedores para treinar modelos de Deep Learning, aqui na DSA trabalhamos somente com GPUs da Nvidia devido a maior oferta de possibilidades, drivers, softwares e suporte.

E o Sistema Operacional?

Agora entramos em terreno espinhoso, onde a polêmica e o fanatismo descabido costumam reinar. Mas sem perder tempo com isso, vamos direto ao ponto: Para Data Science o melhor sistema operacional é o Linux. Você pode não gostar do Pinguim, mas coloque seus gostos pessoais de lado por um instante. Quase tudo que existe em Data Science (linguagens de programação, frameworks, soluções de armazenamento e processamento de dados, etc…) foi feito em Linux.

Logo, usar esse SO acaba sendo a opção mais lógica e que traz maior produtividade. “Mas eu não sei trabalhar com Linux!”. Então, aprenda. Incluímos em todas as nossas formações um curso de Linux como bônus, o qual os alunos adoram e logo acabam levando Linux para suas máquinas pessoais. Não precisa abandonar seu SO atual e você sempre pode começar usando máquinas virtuais ou o docker.

Em geral a distribuição Ubuntu é a ideal para quem está começando no universo Linux. Aqui você encontra o ranking das distribuições Linux mais usadas no mundo: DistroWatch.

Nossa recomendação: Linux Ubuntu.

Laptop ou Desktop?

Embora um Desktop possa ter um custo total menor, a mobilidade de um Laptop compensa seu preço. Poder trabalhar ou estudar na sua máquina de onde quiser aumenta a produtividade e acelera o aprendizado. Essa pode ser uma decisão bem pessoal, sendo possível comprar um bom Desktop com uma excelente configuração, por um valor menor que um Laptop com uma configuração mediana. Aí você terá que fazer um trade-off, uma escolha! E essa escolha é exclusivamente sua!

Nossa recomendação: Laptop.

E Quais São os Computadores dos Instrutores da DSA?

Aqui na DSA compreendemos a importância de ter um bom hardware e todas as aulas são preparadas e gravadas em equipamentos de ponta. Quase todos os instrutores usam Laptop MacBook Pro Core i7 com 16 GB de RAM e SSD de pelo menos 1 TB. Recentemente começamos a migração dos Laptops para o novo MacBook Pro com processador M2 e 32 GB de RAM.

Temos máquinas Windows e Linux com processadores Core Intel i5, i7 e i9, além de uma máquina com processador AMD Ryzen 9. Em todos os casos 16 a 64 GB de RAM, pois em todos os nossos cursos fornecemos suporte para Windows, Mac e Linux e por isso temos diferentes máquinas para testar cada projeto.

Qual o Melhor Computador Pessoal Para Aprender Data Science?

De acordo com a nossa recomendação, o ideal seria um Laptop com processador Core i7, 16 GB de RAM, 1 TB SSD/1 TB HDD e GPU Nvidia, com sistema operacional Linux Ubuntu. Você vai encontrar esse tipo de configuração em praticamente qualquer um dos principais fornecedores de computadores pessoais do mercado. Ajuste a configuração de acordo com o seu orçamento e as nossas recomendações mínimas ao longo deste artigo.

Esperamos que esse guia ajude você a escolher o melhor hardware para seu aprendizado em Data Science.

Equipe DSA