Os radiologistas assistidos por um sistema de IA rastreiam o câncer de mama com mais sucesso do que quando trabalham sozinhos, de acordo com uma pesquisa realizada na Alemanha. O mesmo sistema de IA também produz resultados mais precisos nas mãos de um radiologista do que quando opera sozinho.

O estudo em grande escala, publicado no The Lancet Digital Health (link ao final do artigo), é o primeiro a comparar diretamente o desempenho individual de um sistema de IA no rastreio do cancro da mama com o seu desempenho quando utilizada para auxiliar um especialista humano. A esperança é que tais sistemas de IA possam salvar vidas ao detectar cancros que os médicos não detectam, liberar os radiologistas para atenderem mais pacientes e aliviar o fardo em locais onde há falta de especialistas.

O software em teste é da Vara, startup sediada na Alemanha que também liderou o estudo. A IA da empresa já é utilizada em mais de um quarto dos centros de rastreio do cancro da mama na Alemanha e foi introduzida em um hospital no México e outro na Grécia.

A equipe de Vara, com a ajuda de radiologistas do Hospital Universitário de Essen, na Alemanha, e do Memorial Sloan Kettering Cancer Center, em Nova York, testou duas abordagens. No primeiro, a IA trabalha sozinha para analisar mamografias. No outro, a IA distingue automaticamente entre exames que considera normais e aqueles que levantam uma preocupação. Encaminha estes últimos para um radiologista, que os analisa antes de ver a avaliação da IA. Em seguida, a IA emite um aviso se detectou câncer e o médico não o fez. No estudo, a IA examinou exames antigos e comparou suas avaliações com as do radiologista que os revisou originalmente.

Para treinar a rede neural, Vara alimentou os dados de IA de mais de 367.000 mamografias – incluindo notas de radiologistas, avaliações originais e informações sobre se o paciente tinha câncer – para aprender como colocar essas varreduras em um dos três grupos: “confiante normal ”, “não confiante” (em que nenhuma previsão é dada) e “confiante câncer”. As conclusões de ambas as abordagens foram então comparadas com as decisões que radiologistas reais tomaram originalmente em 82.851 mamografias provenientes de centros de rastreio que não contribuíram com exames utilizados para treinar a IA.

A segunda abordagem – médico e IA trabalhando juntos – foi 2,6% melhor na detecção do câncer de mama do que um médico trabalhando sozinho e gerou menos alarmes falsos. Conseguiu isso deixando de lado automaticamente os exames classificados como “confiantes normais”, que representaram 63% de todas as mamografias. Esta intensa racionalização poderia reduzir a carga de trabalho dos radiologistas.

Após os exames de câncer de mama, os pacientes com um exame normal são encaminhados, enquanto um exame anormal ou pouco claro desencadeia testes de acompanhamento. Mas os radiologistas que examinam as mamografias não detectam um em cada oito cancros. Fadiga, excesso de trabalho e até mesmo a hora do dia afetam a capacidade dos radiologistas de identificar tumores enquanto visualizam milhares de exames. Os sinais visualmente sutis também geralmente têm menos probabilidade de disparar alarmes, e o tecido mamário denso – encontrado principalmente em pacientes mais jovens – torna os sinais de câncer mais difíceis de ver.

Os radiologistas que usam a IA no mundo real são obrigados pela lei alemã a examinar todas as mamografias, pelo menos aquelas que a IA considera boas. A IA ainda os ajuda, preenchendo previamente relatórios em exames rotulados como normais, embora o radiologista possa sempre rejeitar a chamada da IA.

Thilo Töllner, radiologista que dirige um centro alemão de rastreio do cancro da mama, utiliza o programa há dois anos. Ele às vezes discorda quando a IA classifica as varreduras como normais confiantes e preenche relatórios manualmente para refletir uma conclusão diferente, mas ele diz que “os normais são quase sempre normais”. Principalmente, “você só precisa pressionar enter”.

As mamografias que a IA rotulou como ambíguas ou “câncer confiável” são encaminhadas a um radiologista – mas somente depois que o médico oferece uma avaliação inicial e independente.

Os radiologistas classificam as mamografias em uma escala de 0 a 6 conhecida como BI-RADS, onde quanto menor, melhor. Uma pontuação de 3 indica que algo provavelmente é benigno, mas vale a pena verificar. Se Vara tiver atribuído uma pontuação BI-RADS de 3 ou superior a uma mamografia que o radiologista rotular como normal, aparecerá um aviso.

A IA geralmente é excelente na classificação de imagens. Então, por que a IA de Vara por si só teve desempenho inferior ao de um médico solitário? Parte do problema é que uma mamografia por si só não consegue determinar se alguém tem cancro – o que requer a remoção e teste do tecido de aspecto anormal. Em vez disso, a IA examina as mamografias em busca de dicas.

Christian Leibig, principal autor do estudo e diretor de Machine Learning da Vara, diz que as mamografias de mamas saudáveis e cancerosas podem ser muito semelhantes, e ambos os tipos de exames podem apresentar uma ampla gama de resultados visuais. Isso complica o treinamento de IA. O mesmo acontece com a baixa prevalência de cancro nos exames mamários (de acordo com Leibig, “na Alemanha, é cerca de seis em 1.000”). Como as IAs treinadas para detectar câncer são principalmente treinadas em exames de mama saudáveis, elas podem estar sujeitas a falsos positivos.

O estudo testou a IA apenas em decisões anteriores de mamografia e assumiu que os radiologistas concordariam com a IA cada vez que esta emitisse uma decisão de “confiante normal” ou “confiante câncer”. Quando a IA não tinha certeza, o estudo seguiu a leitura original do radiologista. Isso significa que não foi possível testar como o uso da IA afeta as decisões dos radiologistas – e se tais mudanças podem criar novos riscos. Töllner admite que gasta menos tempo examinando exames que a Vara classifica como normais do que aqueles que considera suspeitos. “Você fica mais rápido com os normais porque fica confiante com o sistema”, diz ele.

Curtis Langlotz, diretor do Centro de Inteligência Artificial em Medicina e Imagem de Stanford, está impressionado, mas diz que o próximo passo seria confirmar o desempenho da IA durante um longo período de tempo em clínicas reais com pacientes reais.

Até agora, as tentativas de substituir totalmente os radiologistas pela IA falharam. Uma pesquisa recente descobriu que em 34 dos 36 estudos, a IA teve um desempenho pior do que um único radiologista no rastreio do câncer da mama a partir de mamografias. Todos os 36 foram menos precisos do que o consenso de dois radiologistas, exigido por alguns países.

“Costumamos dizer que a IA não substituirá os radiologistas”, diz Langlotz. “Este estudo não muda isso, mas no processo proposto baseado em IA, quase três quartos dos estudos de triagem não precisaram ser revisados por um radiologista, melhorando ao mesmo tempo a precisão geral.” Isso, diz ele, é “inovador”.

Langlotz acrescenta que esta abordagem poderia aliviar a escassez de radiologistas, especialmente em países como o Malawi, onde há um radiologista por 8,8 milhões de pessoas, ou a Índia, um país de 1,4 bilhão de habitantes servido por um radiologista por cada 100.000 pessoas. Mesmo os EUA, que têm proporcionalmente 10 vezes mais radiologistas que a Índia, prevê-se que tenham falta de 17.000 radiologistas até 2033.

Töllner está otimista de que mais radiologistas usando IA significa uma detecção mais precoce do câncer de mama, o que poderá melhorar as taxas de sobrevivência. Ele também espera que Vara ajude a anular o elevado número de falsos positivos – pacientes chamados de volta para testes adicionais que, na verdade, estão bem.

Equipe DSA

Referências:

Inteligência Artificial Para Análise de Imagens Médicas

Combining the strengths of radiologists and AI for breast cancer screening: a retrospective analysis