Deep Learning, IA e Realidade Virtual no Nvidia GPU Tech Conf

Entre os dias 08 e 11 de Maio de 2017 em San Jose, California, no coração do Vale do Silício, aconteceu o Nvidia GPU Tech Conf, evento que reuniu as empresas mais inovadoras do planeta e gigantes de tecnologia. Neste ano, o evento tinha como tema principal Deep Learning, Inteligência Artificial e Realidade Virtual. E parte da equipe da Data Science Academy participou do evento, que agora trazemos para você em mais detalhes!
A Nvidia é a líder mundial em tecnologia e hardware para processamento paralelo. O Nvidia GPU Tech Conf é um evento que reúne profissionais, empresas e universidades trabalhando com o que há de mais avançado nessas soluções e muito do que estava no evento, vai transformar o mundo nos próximos anos. A Nvidia reconheceu cedo o potencial da IA e se posicionou como líder indiscutível não apenas no fornecimento de hardware, como também na criação de sistemas baseados em IA. As GPUs (Unidades de Processamento Gráfico) permitem executar modelos de Deep Learning de 10 a 20 vezes mais rápido que usando apenas CPUs. Ano passado, a empresa dobrou seu faturamento! O GTC tem se tornando a cada ano o ponto de encontro de especialistas em Inteligência Artificial.
O Evento
O GTC é um evento técnico de utilização de GPUs (Unidades de Processamento Gráfico) para aplicações de Deep Learning, Inteligência Artificial e Realidade Virtual. Os Labs são bem técnicos e espera-se que os participantes tenham fortes conhecimentos em Machine Learning (o que foi informado pelos palestrantes no início de cada sessão). Todas as discussões foram em alto nível. Deep Learning é uma área de aprendizagem de máquina e uma evolução natural para Cientistas de Dados. Aliás, o evento estava cheio de Cientistas de Dados. Centenas deles. Só no Brasil, que alguns poucos desinformados acham que Cientistas de Dados são unicórnios, mas lá fora o mundo inteiro já reconheceu a importância desse profissional para o sucesso de qualquer área de negócio. Precisamos mudar essa realidade no Brasil e aumentar o número de Cientistas de Dados. Esses profissionais trabalham com o novo petróleo: dados.
O evento de 2017 reuniu 7 mil participantes, segundo a Nvidia, sendo que 2 mil participaram também dos labs, sessões altamente técnicas com especialistas do Deep Learning Institute, Amazon, Facebook, Microsoft, entre outras empresas e Startups. A equipe da DSA participou de 9 desses Labs. Os palestrantes deixavam claro que esperavam algum background em aprendizagem de máquina, classificação, regressão, linguagens Python e/ou R e armazenamento e processamento de dados com Hadoop e Spark.
O evento teve mais de 400 sessões/labs e cada participante montava sua agenda de acordo com os assuntos de maior interesse. Aqui a lista de sessões/labs das quais participamos:
S7578 – Accelerating your VR Applications with VRWorks
S7842 – How Triage is Detecting Skin Cancer from Smartphones with Deep Learning: Presented by Triage
S7667 – DeepAD: Alzheimer’s Disease Classification via Deep Convolutional Neural Networks Using MRI and fMRI
S7737 – Deep Learning Frameworks with Spark and GPUs
S7467 – Multi-Dimensional Deep Learning for Medical Images
S7691 – Facial Expression and Emotion Detection for Mobile
L7104 – Deep Learning Using Microsoft Cognitive Toolkit
S7634 – Build a Neural Translation System from Scratch with PyTorch
S7433 – How to Achieve Real-Time Analytics on a Data Lake Using GPUs
L7142 – Medical Image Segmentation using DIGITS (Presented by NVIDIA Deep Learning Institute)
S7553 – Exploring Sparsity in Recurrent Neural Networks
L7135 – Deep Learning for Medical Image Analysis using R and MXNet (Presented by NVIDIA Deep Learning Institute)
S7853 – Computer Vision and Natural Language Processing with Apache MXNet: Presented by Amazon
S7820 – Keynote
L7126 – Deep Learning for Image and Video Captioning (Presented by NVIDIA Deep Learning Institute)
L7144 – Image Classification and Object Detection using NVIDIA Jetson TX2 (Presented by NVIDIA Deep Learning Institute)
S7222 – Deep Learning in the Connected Kitchen
L7128 – DIY Deep Learning: a Hands-On Lab with Caffe2
S7823 – Crowdsourcing 3D Semantic Maps for Vehicle Cognition
L7113 – Train Deep Learning Models using H2O DeepWater
Mas todos os participantes tem acesso às gravações de todas as mais de 400 sessões/labs e vamos nos revezar e assistir a cada uma delas! Agora um resumo de cada um dos 4 dias do evento:
Day 1
O primeiro dia do evento começou com uma série de sessões apresentadas por Startups lançando produtos baseados em Inteligência Artificial e usando modelos de Deep Learning. E duas coisas chamaram atenção: a massiva utilização de modelos de Redes Neurais Convolucionais para reconhecimento automático de imagens e diversas soluções na área de saúde, desde deteção de câncer de pele usando app no celular, até a interpretação automática de Raios-X para identificar pacientes com Mal de Alzheimer. Essas são soluções inovadoras, construídas com Redes Neurais Convolucionais (um tipo de rede neural profunda), cujos modelos foram processados usando GPUs.
O Apache Spark, um dos principais frameworks para processamento de Big Data, também entrou na era do processamento paralelo em GPUs. Soluções para detecção de sentimentos em imagens, usando apps para celular também foram destaque no primeiro dia do evento. Quase todas as soluções apresentadas estavam disponíveis em apps para celular.
Na parte da tarde, 2 labs. O primeiro uma sessão totalmente “Hands-on” (com 2 horas de duração), do Microsoft CNTK, o framework de Deep Learning da Microsoft. O CNTK é o tema de um dos capítulos do curso de Deep Learning Frameworks, da Formação IA aqui na DSA. Foram apresentadas as Redes Neurais Convolucionais para reconhecimento automático de imagens e as Redes Neurais Recorrentes para reconhecimento automático da fala. Tudo em linguagem Python, exatamente o que os alunos estudam nos cursos da Formação IA. Aliás, não demonstraram no evento o Dropout (apenas falaram sobre ele). Aqui nos cursos da DSA, usamos o Dropout, para reduzir o overfitting das redes neurais profundas (Dropout é uma técnica avançada de regularização criada em 2012). O Baidu apresentou uma solução técnica para aumentar a eficiência de RNNs para tradução de idiomas. Ficamos surpreendidos em eles divulgarem a solução, pois isso torna a tradução de idiomas, algo quase automático! Vamos demonstrar a solução nas aulas dos cursos de Deep Learning, da Formação IA.
Day 2
Na terça, dia 09/05, os labs foram sobre o Nvidia DIGITS e o MXNET, também temas do curso Deep Learning Frameworks aqui na DSA. Foram usados Python com o DIGITS, e R e Python com o MXNET. O reconhecimento de imagens médicas para prever possíveis doenças do coração tem avançado significativamente com o uso de Redes Neurais Convolucionais. Um Radiologista fez a apresentação de introdução explicando sobre soluções usando Deep Learning em vários hospitais nos EUA. A sessão sobre o MXNET foi conduzida pela equipe de Engenheiros da Amazon, uma vez que a empresa adotou este framework como padrão em suas soluções baseadas em Deep Learning.
Tivemos ainda uma sessão sobre a utilização de Data Lakes em GPUs, para processamento analítico em tempo real.
Day 3
Na quarta (dia 10/05) pela manhã, tivemos o keynote do CEO da Nvidia que apresentou diversos lançamentos da empresa, incluindo a nova plataforma de GPUs, a Tesla Volta, parceria com a Toyota para carros autônomos, plataforma de IA da SAP e o ISAAC, plataforma de treinamento de software para robôs. Aliás, se falou muito no evento sobre Transfer Learning, treinar o modelo e depois transferir o modelo treinado para outros dispositivos.
Na quarta à tarde foram 2 Labs. O primeiro com duração de 4 horas, com a equipe do Nvidia Deep Learning Institute. O objetivo era criar modelos de Deep Learning com TensorFlow. Recebemos datasets com imagens e vídeos e o objetivo era construir um modelo que automaticamente gerasse legenda para a imagem e para o vídeo. Foram usadas redes neurais recorrentes para isso. Foi um dos melhores labs. Foi utilizado um dataset público e vamos reproduzir algo similar a este lab com os alunos da Formação IA.
Na sequência foi o Lab com a Nvidia Jetson TX2. Essa pequena placa vem com uma GPU e câmera embutida. Criamos um modelo de Rede Neural Convolucional, fizemos o deployment na placa e automaticamente detectamos objetos e movimentos, tudo isso usando linguagem Python. Essa placa é usada em pequenos robôs, drones, máquinas industriais e até mesmo carros autônomos. Foi um dos Labs mais concorridos e tinha até fila de espera.
Clique aqui para acessar o link do keynote completo, com mais de 2 horas de duração.
Day 4
No último dia do evento, dia 11/05, tivemos o Lab com a equipe do Facebook, que apresentou as novidades do Caffe2, lançado recentemente e que tem suporte do Facebook. O Caffe é um dos mais antigos frameworks de Deep Learning e o Lab estava lotado. Mais uma vez, criamos Redes Neurais Convolucionais para reconhecimento automático de imagens usando Python e Caffe2. O último Lab foi com a equipe da Startup H20. Eles criaram uma interface visual em Java que permite criar modelos de Deep Learning de forma automatizada. A plataforma se chama H20 Deep Water e permite criar modelos em R, Python, Scala e Julia e depois fazer o deployment em produção.
Esse não era um evento para iniciantes em Machine Learning e a cada sessão isso ficava evidente. Os palestrantes sempre deixavam claro que esperavam dos participantes conhecimentos em Machine Learning, Estatística e processamento de Big Data. As discussões foram em alto nível.
Os Labs usaram Jupyter Notebook, Python, R, Azure, TensorFow, Caffe, Theano, Keras, CNTK, Hadoop e Spark. Já ouviram falar nestas tecnologias? Alunos da Formação Cientista de Dados e da Formação Inteligência Artificial aqui na DSA nós temos certeza que sim. Aliás, TODOS os Labs foram em Jupyter Notebook, incluindo o de R. Para processar os modelos de Deep Learning, foram usadas GPUs e clusters de GPUs. A Cisco e a Dell estão oferecendo soluções inteiras de processamento em GPUs. E sabe qual é a principal GPU usada para desenvolvimento? A Titan X, a mesma que os alunos encontram no super computador da DSA, na Formação IA. Lembrando que o acesso ao nosso super computador é gratuito aos alunos da Formação.
Havia ainda uma área com poster de pesquisas em Deep Learning, Inteligência Artificial e Realidade Virtual em diversas universidades do mundo. Embora estejam no site do evento, fotografamos tudo para análise posterior destas pesquisas. Destaque para os posters da PUC-RJ com a Rede Globo e da UFF – Universidade Federal Fluminense.
Algumas conclusões e curiosidades:
1- A maioria esmagadora dos participantes estava usando Mac, da Apple, como notebook. Quem estava usando notebook de outro fabricante estava usando massivamente o Linux Ubuntu. Uma minoria estava usando Windows 10. E mesmo quem estava com Windows, percebemos o uso de máquinas virtuais com Linux Ubuntu. Sistemas Unix (Linux/MacOSX) são o padrão para trabalhar com Deep Learning.
2- Ficou claro que está havendo uma polarização entre os frameworks de Deep Learning, com TensorFlow (Google), CNTK (Microsoft), MXNet (adotado pela Amazon) e Caffe (usado pelo Facebook) a frente dos demais. Keras e Torch foram citados com frequência. Todos são estudados no curso Deep Learning Frameworks, aqui na DSA.
3- Chamou atenção como um novo universo de processamento computacional baseado em GPU está florescendo. No Exhibition Hall, eram muitos fornecedores oferecendo hardware baseado em GPUs. Tinha até um mini Datacenter no evento, totalmente baseado em GPUs. Confira nas fotos do evento, no link abaixo.
4- Esse é um evento bem avançado e lamentamos muito não ter visto mais brasileiros por lá. O evento vai percorrer outras cidades americanas e também Europa e Ásia. Infelizmente, não tem previsão para visitar a América do Sul.
5- Todo mundo altamente conectado!!!! Boa parte das informações do evento estava disponível na app do evento para smartphone. Tudo é por app para smartphone. Não pense em construir uma solução ou aplicativo que não tenha versão para smartphone. Se não considerar app para smartphone, sua aplicação já vai nascer obsoleta!
6- Ainda há muito a evoluir em Deep Learning e soluções baseadas em redes neurais. Isso traz um oceano de oportunidades.
7- Quando idealizamos a Formação IA, tínhamos como objetivo fazer uma continuação para a Formação Cientista de Dados e participar do evento mostrou que nossa percepção está totalmente correta. Cientistas de Dados que aprendem e trabalham com Machine Learning, vão sentir a necessidade de trabalhar com modelos mais avançados e Deep Learning e IA são o que existe de mais avançado atualmente. Nossa Formação IA cobre exatamente esses temas.
8- Todos os labs foram em Linux Ubuntu e/ou Amazon AWS. A Ubuntu aliás tinha um stand de destaque no Exhibition Hall e se posicionou para ser o sistema operacional padrão de quem trabalha com Deep Learning e IA. Na Formação IA usamos apenas Ubuntu e mostramos como usar o AWS.
9- Python é a linguagem padrão em Deep Learning e IA. Tivemos alguns labs em R, Scala e Java. Mas Python é o padrão para construção de modelos de redes neurais profundas. Todos os frameworks suportam C++ ou foram construídos em C++.
10- Ao ver o que foi feito nos Labs, usando Ubuntu, AWS, Python e principalmente GPUs, ficamos com a certeza que estamos alinhados com o que há de mais avançado em treinamento de Deep Learning, pois é exatamente isso que oferecemos aos alunos aqui na DSA. Nosso super servidor com a GPU Nvidia Titan X, está no mesmo nível do que a Nvidia está usando para treinar os profissionais. Os alunos da Formação IA tem acesso remoto gratuito ao nosso super servidor.
11- Foram muitas soluções de IA (usando Deep Learning), apresentadas no evento. Muitas soluções baseadas em reconhecimento de imagens e processamento de voz. Tratamento médico, odontológico, reconhecimento de alimentos, veículos autônomos, tradução simultânea, geração automática de gráficos a partir de análise de dados, etc…. Tudo baseado em Deep Learning.
12- Ninguém no evento falava sobre procurar emprego e sim sobre montar sua própria Startup, conseguir investimento e criar soluções e serviços para resolver problemas dos clientes!!!
O evento comprovou o que já tínhamos bem claro aqui na DSA. Big Data, Data Science, Machine Learning e Inteligência Artificial são o presente e o futuro. E como o Brasil ainda está em uma fase inicial, serão muitas oportunidades nos próximos anos. Leva-se tempo para aprender essas tecnologias, e quanto antes começar, melhor!!! Quem perceber isso e souber se posicionar, terá uma grande vantagem nos próximos anos!! Como afirmou o CEO da Intel: “Os próximos 5 anos serão frenéticos em IA”. Não temos qualquer dúvida.
Em Março de 2018 acontece a próxima edição do evento e estaremos lá com certeza. O evento vale cada centavo investido e permite conectar com o que há de mais avançado em tecnologias de Inteligência Artificial. Mas antes disso, em Setembro de 2017, a DSA vai marcar presença no evento O’Reilly Artificial Intelligence em San Francisco, California. E claro, traremos tudo em primeira mão para nossos alunos.
Clique no link abaixo para acessar as fotos e vídeos do evento:
Album DSA de Fotos e Vídeos do GPU Tech Conf 2017
Equipe DSA
Links oficiais:
[…] da imagem, variações, fadiga do perito e diferenças de interpretação. Após o sucesso do Deep Learning em outras aplicações do mundo real, as redes neurais profundas agora estão fornecendo soluções […]