O Que a IA Pode e (ainda) Não Pode Fazer Pelo Seu Negócio
A Inteligência Artificial (IA) parece estar em todo lugar. Nós experimentamos a IA em casa e em nossos telefones. Mais rápido do que imaginamos, a IA estará em praticamente todos os produtos e serviços que compramos e usamos. Além disso, sua aplicação à solução de problemas de negócios está crescendo e, ao mesmo tempo, as preocupações com as implicações da IA estão aumentando, levando a discussões sobre o impacto da automação habilitada pela IA no local de trabalho, no lazer e na sociedade.
A consultoria McKinsey realizou um grande estudo para ajudar executivos e gestores a compreenderem O Que a IA Pode e (ainda) Não Pode Fazer Pelo Seu Negócio, estudo este que trazemos agora para você. Leia com atenção, fuja do hype e compreenda claramente o impacto atual e futuro da IA.
Relatório McKinsey
Uma realidade às vezes perdida entre os medos e os triunfos das manchetes, como Alexa, Siri e AlphaGo, é que as próprias tecnologias de IA – ou seja, aprendizado de máquina e seu subconjunto – aprendizado profundo (Deep Learning) – têm muitas limitações que ainda exigirão um esforço considerável para superar. Este é um artigo sobre essas limitações, cujo objetivo é ajudar os executivos a entender melhor o que pode estar atrapalhando seus esforços de IA. Ao longo do caminho, também destacaremos os avanços promissores que estão preparados para abordar algumas das limitações e criar uma nova onda de oportunidades.
Nossas perspectivas se baseiam em uma combinação de trabalho nas linhas de frente – pesquisando, analisando e avaliando centenas de casos de uso do mundo real – e em nossas colaborações com alguns líderes de pensamento, cientistas pioneiros e engenheiros que trabalham nas fronteiras da IA. Procuramos destilar essa experiência para ajudar os executivos que, em nossa experiência, estão expostos apenas a suas próprias iniciativas e não estão bem calibrados sobre onde está a fronteira ou o que os determinantes do ritmo já estão fazendo com a IA.
Simplificando, os desafios e as limitações da IA estão criando um problema de “alvo em movimento” para os líderes: é difícil alcançar uma vantagem significativa com uma tecnologia que esteja sempre avançando. Também é decepcionante quando os esforços da IA se deparam com barreiras do mundo real, o que pode diminuir o apetite por mais investimentos ou encorajar uma atitude de esperar para ver, enquanto outros avançam. Como indica a pesquisa recente do McKinsey Global Institute, há uma grande diferença entre os líderes e os retardatários na aplicação da IA nos mais variados setores.
Os executivos que desejam diminuir a distância devem ser capazes de abordar a IA de maneira informada. Em outras palavras, eles precisam entender não apenas onde a IA pode impulsionar a inovação, a percepção e a tomada de decisões, levar ao crescimento da receita e aumentar a eficiência, mas também onde a IA ainda não pode fornecer valor. Além disso, devem apreciar o relacionamento e as distinções entre restrições técnicas e organizacionais, como barreiras culturais, uma escassez de pessoal capaz de criar aplicativos prontos para uso e com inteligência artificial e o desafio da “última milha” de incorporar a IA em produtos e processos. Se você quiser se tornar um líder que entenda alguns dos desafios técnicos críticos que estão retardando o avanço da IA e esteja preparado para explorar desenvolvimentos promissores que possam superar essas limitações e potencialmente dobrar a trajetória da IA – continue a ler.
Desafios, Limitações e Oportunidades
Um ponto de partida útil é entender os avanços recentes nas técnicas de aprendizagem profunda. Indiscutivelmente os desenvolvimentos mais empolgantes da IA, esses avanços estão gerando saltos na precisão da classificação e previsão, e estão sendo feitos sem a usual “engenharia de recursos” (Feature Engineering) associada ao aprendizado supervisionado tradicional. O aprendizado profundo usa redes neurais de grande escala que podem conter milhões de “neurônios” simulados estruturados em camadas. As redes mais comuns são chamadas Redes Neurais Convolucionais (CNNs) e Redes Neurais Recorrentes (RNNs). Essas redes neurais aprendem através do uso de dados de treinamento e algoritmos de backpropagation.
Embora muito progresso tenha sido feito, mais ainda precisa acontecer. Um passo crítico é adequar a abordagem da IA ao problema e à disponibilidade de dados. Como esses sistemas são “treinados” em vez de programados, os vários processos geralmente exigem grandes quantidades de dados rotulados para executar tarefas complexas com precisão. Obter grandes conjuntos de dados pode ser difícil. Em alguns domínios, eles podem simplesmente não estar disponíveis, mas, mesmo quando disponíveis, os esforços de rotulagem podem exigir enormes recursos humanos.
Além disso, pode ser difícil discernir como um modelo matemático treinado por aprendizado profundo chega a uma previsão, recomendação ou decisão específica. Uma caixa preta, mesmo aquela que faz o que deveria, pode ter utilidade limitada, especialmente quando as previsões ou decisões afetam a sociedade e mantêm ramificações que podem afetar o bem-estar individual. Nesses casos, os usuários às vezes precisam conhecer os “porquês” por trás do funcionamento, por exemplo, porque um algoritmo alcançou suas recomendações – desde descobertas factuais com repercussões legais até decisões de negócios, como empréstimos, que tenham repercussões regulatórias – e porquê – certos fatores (e não outros) eram tão críticos em um dado momento.
Vamos explorar cinco formas interconectadas em que essas limitações e as soluções que surgem para resolvê-las estão começando a acontecer.
Limitação 1: Rotulagem de Dados
A maioria dos modelos atuais de IA é treinada por meio de “aprendizado supervisionado”. Isso significa que os humanos devem rotular e categorizar os dados, o que pode ser uma tarefa considerável e propensa a erros. Por exemplo, as empresas que desenvolvem tecnologias de veículos autônomos estão contratando centenas de pessoas para anotar manualmente horas de vídeo de protótipos de veículos para ajudar a treinar esses sistemas. Ao mesmo tempo, novas técnicas promissoras estão surgindo, como a supervisão in-stream (demonstrada por Eric Horvitz e seus colegas da Microsoft Research), na qual os dados podem ser rotulados no curso do uso natural. Abordagens não supervisionadas ou semi-supervisionadas reduzem a necessidade de grandes conjuntos de dados rotulados. Duas técnicas promissoras são o Aprendizado por Reforço e as Generative Adversarial Networks (GANs).
Vamos discutir primeiro o Aprendizado por Reforço. Esta técnica não supervisionada permite que os algoritmos aprendam tarefas simplesmente por tentativa e erro. A metodologia se refere a uma abordagem de “carrot and stick”: para cada tentativa de um algoritmo em realizar uma tarefa, ele recebe uma “recompensa” (como uma pontuação mais alta) se o comportamento for bem-sucedido ou uma “punição” se não for. Com a repetição, o desempenho melhora, em muitos casos, superando as capacidades humanas – desde que o ambiente de aprendizado seja representativo do mundo real.
Aprendizado por Reforço tem sido usado para treinar computadores para jogar – mais recentemente, em conjunto com técnicas de aprendizagem profunda (Deep Learning). Em maio de 2017, por exemplo, ajudou o sistema AlphaGo a derrotar o campeão mundial Ke Jie no jogo Go. Em outro exemplo, a Microsoft colocou em campo serviços de decisão que se baseiam no aprendizado por reforço e se adaptam às preferências do usuário. A aplicação potencial da aprendizagem de reforço atravessa muitas áreas de negócios. As possibilidades incluem uma carteira de negociação acionada por Inteligência Artificial que adquire ou perde pontos por ganhos ou perdas de valor, respectivamente; um mecanismo de recomendação de produtos que recebe pontos para cada venda orientada por recomendação; e software de roteamento de caminhões que recebe uma recompensa por entregas no prazo ou redução do consumo de combustível.
O aprendizado por reforço também pode ajudar a IA a transcender as limitações naturais e sociais da rotulagem humana, desenvolvendo soluções e estratégias previamente inimagináveis que até mesmo profissionais experientes poderiam nunca ter considerado. Recentemente, por exemplo, o sistema AlphaGo Zero, usando uma nova forma de aprendizado por reforço, derrotou seu predecessor AlphaGo depois de aprender a jogar Go do zero. Isso significava começar com um jogo completamente aleatório em vez de treinar em jogos de Go jogados por e com humanos.
Generative Adversarial Networks (GANs). Neste método de aprendizado semi-supervisionado, duas redes competem entre si para melhorar e aperfeiçoar sua compreensão de um conceito. Para reconhecer como as aves se parecem, por exemplo, uma rede tenta distinguir entre imagens genuínas e falsas de aves, e sua rede oposta tenta enganá-la produzindo imagens que se parecem muito com imagens de pássaros, mas não são. À medida que as duas redes se aproximam, a representação de cada modelo de um pássaro se torna mais precisa.
A capacidade das GANs de gerar exemplos cada vez mais confiáveis de dados pode reduzir significativamente a necessidade de conjuntos de dados rotulados por seres humanos. Treinar um algoritmo para identificar diferentes tipos de tumores a partir de imagens médicas, por exemplo, normalmente exigiria milhões de imagens marcadas com humanos com o tipo ou estágio de um dado tumor. Usando um GAN treinado para gerar imagens cada vez mais realistas de diferentes tipos de tumores, os pesquisadores poderiam treinar um algoritmo de detecção de tumor que combina um conjunto de dados muito menor, com identificação humana, com a saída da GAN.
Embora a aplicação de GANs em diagnósticos precisos de doenças ainda esteja distante, os pesquisadores começaram a usar as GANs em contextos cada vez mais sofisticados. Estes incluem a compreensão e produção de obras de arte no estilo de um artista em particular e o uso de imagens de satélite, juntamente com uma compreensão das características geográficas, para criar mapas atualizados de áreas em rápido desenvolvimento.
Limitação 2: Obtendo Conjuntos de Dados Massivos Para Treinamento
Já foi demonstrado que técnicas simples de IA usando modelos lineares podem, em alguns casos, aproximar o poder de especialistas em medicina e outros campos. A onda atual de aprendizado de máquina, no entanto, requer conjuntos de dados de treinamento que não são apenas rotulados, mas também suficientemente grandes e abrangentes. Os métodos de aprendizagem profunda exigem milhares de registros de dados para que os modelos se tornem relativamente bons em tarefas de classificação e, em alguns casos, milhões para que eles desempenhem no nível de humanos.
A complicação é que conjuntos de dados massivos podem ser difíceis de obter ou criar para muitos casos de uso de negócios (pense: dados limitados de ensaios clínicos para prever os resultados do tratamento com mais precisão). E cada pequena variação em uma tarefa atribuída poderia exigir outro grande conjunto de dados para conduzir ainda mais treinamento. Por exemplo, ensinar um veículo autônomo a navegar em um local de mineração, onde o clima muda continuamente, exigirá um conjunto de dados que englobe as diferentes condições ambientais que o veículo possa encontrar.
O aprendizado de uma única vez é uma técnica que pode reduzir a necessidade de grandes conjuntos de dados, permitindo que um modelo de IA aprenda sobre um assunto quando recebe um pequeno número de demonstrações ou exemplos reais (até mesmo um, em alguns casos). Os recursos da IA se aproximarão dos recursos humanos, que podem reconhecer várias instâncias de uma categoria com relativa precisão depois de terem sido mostradas apenas uma única amostra – por exemplo, de uma caminhonete. Nesta metodologia ainda em desenvolvimento, os Cientistas de Dados primeiro pré-treinariam um modelo em um ambiente virtual simulado que apresentasse variantes de uma tarefa ou, no caso de reconhecimento de imagem, do aspecto de um objeto. Então, depois de mostrar apenas algumas variações do mundo real que o modelo de IA não viu no treinamento virtual, o modelo utilizaria seu conhecimento para alcançar a solução correta.
Esse tipo de aprendizado de uma única vez pode ajudar a alimentar um sistema para digitalizar textos por violações de direitos autorais ou para identificar um logotipo corporativo em um vídeo depois de mostrar apenas um exemplo rotulado. Hoje, esses aplicativos estão apenas em seus estágios iniciais, mas sua utilidade e eficiência podem expandir rapidamente o uso da Inteligência Artificial em vários setores.
Limitação 3: O Problema da Explicabilidade
A explicabilidade não é uma questão nova para os sistemas de IA, mas ela cresceu junto com o sucesso e a adoção do aprendizado profundo, o que deu origem tanto a aplicações mais diversas e avançadas quanto a mais opacidade. Modelos maiores e mais complexos tornam difícil explicar, em termos humanos, por que uma determinada decisão foi tomada (e ainda mais difícil quando foi alcançada em tempo real). Esse é um dos motivos pelos quais a adoção de algumas ferramentas de Inteligência Artificial permanece baixa nas áreas de aplicação, nas quais a capacidade de explicação é útil ou necessária. Além disso, à medida que a aplicação da IA se expande, os requisitos regulatórios também podem impulsionar a necessidade de modelos de IA mais explicáveis.
Duas abordagens nascentes que prometem aumentar a transparência do modelo são as técnicas explícitas local-interpretável-modelo-agnóstico (LIME) e técnicas de atenção. O LIME tenta identificar em quais partes dos dados de entrada um modelo treinado mais depende para fazer previsões no desenvolvimento de um modelo interpretável de proxy. Essa técnica considera certos segmentos de dados de cada vez e observa as mudanças resultantes na previsão para ajustar o modelo de proxy e desenvolver uma interpretação mais refinada (por exemplo, excluindo olhos em vez de, digamos, narizes para testar quais são mais importantes para reconhecimento facial). As técnicas de atenção visualizam as partes de dados de entrada que um modelo considera mais quando toma uma decisão em particular (como se concentrar em uma boca para determinar se uma imagem representa um ser humano).
Outra técnica que tem sido usada há algum tempo é a aplicação de modelos aditivos generalizados (GAMs). Ao usar modelos de recurso único, os GAMs limitam as interações entre os recursos, tornando cada um deles mais facilmente interpretável pelos usuários. Espera-se que o emprego dessas técnicas, entre outras, para desmistificar as decisões de IA, aumente a adoção da IA.
Limitação 4: Generalização da Aprendizagem
Ao contrário da maneira como os humanos aprendem, os modelos de IA têm dificuldade em levar suas experiências de um conjunto de circunstâncias para outro. Na verdade, o que quer que um modelo tenha alcançado para um dado caso de uso permanece aplicável somente àquele caso de uso. Como resultado, as empresas devem comprometer repetidamente recursos para treinar ainda outro modelo, mesmo quando os casos de uso são muito semelhantes.
Uma resposta promissora para esse desafio é a transferência de aprendizagem. Nessa abordagem, um modelo de IA é treinado para realizar uma determinada tarefa e, em seguida, aplica rapidamente esse aprendizado a uma atividade semelhante, porém distinta. Os pesquisadores da DeepMind também mostraram resultados promissores com transferência de aprendizagem em experimentos em que o treinamento feito em simulação é então transferido para braços robóticos reais.
À medida que a transferência de aprendizagem e outras abordagens generalizadas amadurecem, elas podem ajudar as organizações a criar novos aplicativos mais rapidamente e imbuir os aplicativos existentes com funcionalidades mais diversificadas. Ao criar um assistente pessoal virtual, por exemplo, a transferência de aprendizagem pode generalizar as preferências do usuário em uma área (como música) para outras pessoas (livros). A transferência de aprendizagem pode permitir que um produtor de óleo e gás, por exemplo, expanda seu uso de algoritmos de IA treinados para fornecer manutenção preditiva para poços a outros equipamentos, como tubulações e plataformas de perfuração. A transferência de aprendizagem tem o potencial de revolucionar a inteligência de negócios: considere uma ferramenta de análise de dados que compreenda como otimizar as receitas das companhias aéreas e, em seguida, adapte seu modelo às mudanças no clima ou na economia local.
Outra abordagem é o uso de algo que se aproxima de uma estrutura generalizada que pode ser aplicada em vários problemas. O AlphaZero da DeepMind, por exemplo, fez uso da mesma estrutura para três jogos diferentes: foi possível treinar um novo modelo com essa estrutura generalizada para aprender xadrez em um único dia, e então bateu um programa de xadrez campeão mundial.
Finalmente, considere as possibilidades em técnicas emergentes de meta-aprendizagem que tentam automatizar o design de modelos de aprendizado de máquina. A equipe do Google Brain, por exemplo, usa o AutoML para automatizar o design de redes neurais para classificar imagens em conjuntos de dados de grande escala. Essas técnicas agora funcionam tão bem quanto as projetadas por humanos. Esse é um desenvolvimento promissor, especialmente porque o talento continua a ser escasso para muitas organizações. Também é possível que as abordagens de meta-aprendizagem ultrapassem as capacidades humanas e produzam resultados ainda melhores. Importante, no entanto, essas técnicas ainda estão em seus primeiros dias e muitas oportunidades surgirão.
Limitação 5: Viés em Dados e Algoritmos
Até agora, nos concentramos em limitações que podem ser superadas por meio de soluções técnicas já em andamento, algumas das quais descrevemos. O viés é um tipo diferente de desafio. As repercussões sociais potencialmente devastadoras podem surgir quando as predileções humanas (conscientes ou inconscientes) são utilizadas na escolha de quais dados apontam para o uso e quais devem ser desconsiderados. Além disso, quando o processo e a frequência da coleta de dados são desiguais entre grupos e comportamentos observados, é fácil que surjam problemas na forma como os algoritmos analisam esses dados, aprendem e fazem previsões. Consequências negativas podem incluir decisões de recrutamento mal informadas, dados científicos ou prognósticos médicos, modelos financeiros distorcidos e decisões de justiça criminal mal aplicados nas escalas legais. Em muitos casos, esses vieses passam despercebidos ou são desconsiderados sob o véu das “ciências de dados avançadas”, “dados e algoritmos proprietários” ou “análise objetiva”.
À medida que implantamos o aprendizado de máquina e os algoritmos de IA em novas áreas, provavelmente haverá mais instâncias em que essas questões de potencial viés sejam incorporadas em conjuntos de dados e algoritmos. Esses vieses tendem a permanecer incorporados porque reconhecê-los e tomar medidas para resolvê-los exige um profundo domínio das técnicas de ciência de dados, bem como uma meta-compreensão das forças sociais existentes, incluindo a coleta de dados. Ao todo, a desmembramento está provando estar entre os obstáculos mais intimidantes e, certamente, os mais preocupantes socialmente até hoje.
Existem agora vários esforços de pesquisa em andamento, bem como esforços para capturar as melhores práticas, que abordam essas questões em pesquisas acadêmicas, sem fins lucrativos e do setor privado. Não é cedo demais, porque o desafio provavelmente se tornará ainda mais crítico, e mais perguntas surgirão. Considere, por exemplo, o fato de que muitas dessas abordagens preditivas baseadas em aprendizado pressupõem implicitamente que o futuro será como o passado. O que devemos fazer em contextos socioculturais onde os esforços estão em andamento para estimular a mudança – e onde tomar decisões baseadas em comportamentos passados poderia inibir o progresso (ou, pior ainda, construir resistência à mudança)? Uma ampla variedade de líderes, incluindo líderes empresariais, pode em breve ser chamada para responder a essas perguntas.
Acertando o Alvo em Movimento
Soluções para as limitações que descrevemos, juntamente com a implementação comercial generalizada de muitos dos avanços descritos aqui, podem estar a anos de distância. Mas a gama de possibilidades de tirar o fôlego da adoção da IA sugere que a maior restrição para a IA pode ser a imaginação. Aqui estão algumas sugestões para os líderes que estão se esforçando para ficar à frente – ou pelo menos não ficarem muito atrás – da curva:
Faça o seu dever de casa e pesquise. Embora a maioria dos executivos não precise saber a diferença entre redes neurais convolucionais e recorrentes, você deve ter uma familiaridade geral com os recursos das ferramentas de hoje, um senso de onde os avanços de curto prazo provavelmente ocorrerão e uma perspectiva sobre o que está além do horizonte. Entre em contato com seus especialistas em ciência de dados e aprendizado de máquina, converse com alguns pioneiros da IA e participe de uma ou duas conferências de IA para ajudá-lo a obter os fatos reais; as agências de notícias podem ser úteis, mas também podem fazer parte da máquina do hype. Estudos de acompanhamento em curso por profissionais experientes, como o AI Index (um estudo do One-Year Studies on Artificial Intelligence, baseado em Stanford), são outra forma útil de manter-se informado.
Adote uma estratégia de dados sofisticada. Os algoritmos de IA precisam de assistência para desbloquear as informações valiosas que se escondem nos dados gerados por seus sistemas. Você pode ajudar desenvolvendo uma estratégia de dados abrangente que se concentra não apenas na tecnologia necessária para reunir dados de sistemas diferentes, mas também na disponibilidade e aquisição de dados, na rotulagem de dados e na governança de dados. Embora novas técnicas prometam reduzir a quantidade de dados necessários para o treinamento de algoritmos de Inteligência Artificial, o aprendizado supervisionado e sedento de dados continua a ser a técnica mais prevalente atualmente. E mesmo técnicas que visam minimizar a quantidade de dados necessários ainda precisam de alguns dados. Portanto, uma parte fundamental disso é conhecer completamente seus próprios pontos de dados e como aproveitá-los.
Pense lateralmente. As técnicas de aprendizado por transferência permanecem em sua infância, mas existem maneiras de alavancar uma solução de IA em mais de uma área. Se você resolver um problema como manutenção preditiva para grandes equipamentos de depósito, você também pode aplicar a mesma solução a produtos de consumo? Uma solução eficaz de próximo produto a comprar pode ser usada em mais de um canal de distribuição? Incentive as unidades de negócios a compartilhar conhecimento que possa revelar maneiras de usar suas melhores soluções de Inteligência Artificial e pensar em mais de uma área da empresa.
Seja um pioneiro. Manter-se atualizado com as tecnologias atuais de IA e os casos de uso não é suficiente para permanecer competitivo por um longo período. Envolva sua equipe de ciência de dados ou parceiro com especialistas externos para resolver um caso de uso de alto impacto com técnicas nascentes, como as discutidas neste artigo, que estão prestes a avançar. Além disso, mantenha-se informado sobre o que é possível e o que está disponível. Muitas ferramentas de aprendizado de máquina, conjuntos de dados e modelos treinados para aplicativos padrões (incluindo detecção de fala, visão e emoção) estão sendo amplamente disponibilizados. Às vezes eles vêm em código aberto e em outros casos por meio de interfaces de programação de aplicativos (APIs) criadas por pesquisadores e empresas pioneiras. Fique de olho em tais possibilidades para aumentar suas chances de apostar em uma vantagem pioneira ou adoção antecipada.
A promessa da IA é imensa, e as tecnologias, ferramentas e processos necessários para cumprir essa promessa não chegaram completamente. Se você acha que pode deixar a tecnologia se desenvolver e ser um seguidor rápido e bem-sucedido, pense novamente. É muito difícil acertar o alvo, principalmente quando o alvo está se movendo tão rapidamente e você não entende o que as ferramentas de Inteligência Artificial podem e não podem fazer agora. Com os pesquisadores e os pioneiros da IA prontos para resolver alguns dos problemas mais espinhosos de hoje, é hora de começar a entender o que está acontecendo na fronteira da Inteligência Artificial para posicionar sua organização para aprender, explorar e talvez até avançar em novas possibilidades.
Referência: relatório de Janeiro/2018 da Consultoria McKinsey.
Equipe DSA
Prezados,
Mudem a cor da fonte. A leitura se torna cansativa pois a cor da fonte tem uma tonalidade muito clara.
Olá Thiago. Vamos verificar. Obrigado pelo feedback.
Abra as ferramentas do desenvolvedor(F12-Chrome), clique em console e cole o seguinte código:
$(“p”).css(“color”, “black”);
clique enter e pronto.