Barbara fez uma mamografia de rotina em janeiro de 2023. Algumas semanas depois, ela foi convidada a visitar seu médico na Enfermaria Real de Aberdeen
Barbara fez uma mamografia de rotina em janeiro de 2023. Algumas semanas depois, ela foi convidada a visitar seu médico na Enfermaria Real de Aberdeen, na Escócia. A mamografia parecia boa para dois médicos, mas um sistema de inteligência artificial chamado Mia tinha percebido algo errado: uma mancha de seis milímetros com um tom levemente cinza. Era um câncer em estágio 2. Se não tivesse sido identificado e removido naquele momento, não teria sido captado até que Barbara viesse para seu próximo exame de rotina – ou até que sua presença fosse percebida de alguma outra forma.
Se essas histórias dão uma noção visceral da capacidade da IA para melhorar os diagnósticos, as estatísticas mostram a escala do bem que ela pode proporcionar. O governo britânico afirma que a análise de tomografias cerebrais pelo e-Stroke, sistema desenvolvido pela Brainomix, uma startup da Universidade de Oxford, reduziu em mais de uma hora o tempo entre a internação hospitalar e o tratamento de pessoas por acidente vascular cerebral. E aponta para dados ainda não publicados que dizem que a velocidade do sistema triplicou o número de pacientes que alcançaram independência funcional após um AVC, de 16% para 48%.
A inteligência artificial vem sendo aplicada ao diagnóstico há mais tempo do que a qualquer outra parte dos cuidados de saúde – e os resultados são evidentes. Mas a transformação que ela oferece está longe de ser completa. Os sistemas de IA empregados até aqui muitas vezes têm sido aplicados àquilo que agora parecem ser usos bastante simples de reconhecimento de padrões. Os modelos de base que tanto impressionaram o mundo desde o advento do ChatGPT, em 2022, mal começaram a deixar sua marca.
A revolução começou na radiologia, o primeiro tipo de imagem médica a se tornar totalmente digital. A transição facilitou o armazenamento e o compartilhamento de imagens e também produziu imagens que podiam ser lidas por máquinas. Em 2012, quando uma rede neural chamada AlexNet venceu todos os concorrentes no “desafio ImageNet”, as máquinas começaram a se destacar.
As redes neurais, inspiradas na estrutura do córtex visual do cérebro, são sistemas em que a informação flui através de camadas de “neurônios” empilhados uns sobre os outros. Nas primeiras redes neurais, todos os neurônios de uma camada se conectavam a todos os neurônios da próxima. A AlexNet era uma rede neural “convolucional” – em que as conexões são mais esparsas, o que permite formas de análise mais independentes. A combinação dessa arquitetura com novos processadores dotados de um poder que à época parecia prodigioso permitiu à AlexNet revolucionar a ciência da visão computacional e, com isso, o potencial da radiologia automatizada e, mais tarde, da dermatologia, da oftalmologia e muito mais.
Uma visão que vale a pena ver
Os descendentes da AlexNet estão sendo cada vez mais usados para complementar – e às vezes substituir – o trabalho de radiologistas humanos. O Hospital Capio Saint Göran, em Estocolmo, na Suécia, emprega um sistema de IA da empresa sul-coreana Lunit como o “segundo par de olhos” no seu departamento de radiografia, em vez de as mamografias serem examinadas independentemente por dois radiologistas. Na Dinamarca, o Transpara, produto fornecido pela ScreenPoint Medical, uma empresa holandesa, é utilizado como primeiro leitor de mamografias em casos de baixo risco.
Conseguir fazer mais diagnósticos com menos médicos vai ser útil em todos os lugares, mas promete ser uma dádiva nos países pobres. A japonesa Fujifilm construiu uma máquina de raio X à bateria que, combinada com algoritmos de IA da Qure.ai, uma empresa indiana, está sendo usada para diagnosticar tuberculose na zona rural da Nigéria. O aparelho de 3,5 kg também consegue avaliar uma série de outras doenças, como pneumonia, doença pulmonar obstrutiva crônica (DPOC) e insuficiência cardíaca. De forma mais ambiciosa, Darlington Akogo, do MinoHealth Labs em Gana, está construindo um modelo de radiologia treinado em imagens de toda a África. Será ambição demais esperar deste processo uma ferramenta de diagnóstico? “Digamos que estamos mirando nas estrelas”, diz o Dr. Akogo. “Mesmo que erremos o alvo, vamos acabar com uma máquina de assistência radiológica”.
Alguns sistemas de IA conseguem interpretar imagens feitas com menos radiação do que o normal, reduzindo assim não apenas o número de médicos necessários para interpretar um raio X, mas também a dose necessária para tanto – o que é bom para os pacientes. Esses sistemas também procuram coisas que os médicos não procurariam. No “rastreamento oportunístico”, uma radiografia feita para um problema específico também é examinada em busca de sinais de outros problemas. A maioria das 80 milhões de tomografias computadorizadas feitas anualmente nos Estados Unidos são realizadas para investigar determinado problema em alguma parte específica do corpo, mas quase sempre contêm informações sobre outras partes. Os médicos não têm interesse em ficar repassando imagens tiradas para procurar algo na remota eventualidade de identificarem alguma outra coisa. As máquinas não ligam de fazer várias tarefas ao mesmo tempo e podem se tornar especialistas na identificação de muitos tipos de doenças.
Os sistemas de ultrassom oferecem outra oportunidade para IA. A empresa americana Butterfly produz um aparelho de ultrassom portátil que, graças à IA integrada, pode ser usado para avaliar gestações de alto risco e calcular data de nascimento, peso fetal e quantidade de líquido amniótico. Essas medições não são possíveis fora das clínicas e normalmente requerem uma variedade de instrumentos. A Fundação Bill & Melinda Gates vê os scanners da Butterfly como uma forma de reduzir a mortalidade materna persistentemente elevada na África Subsaariana. Esses sistemas aprimorados com IA – a Philips e a GE Healthcare também estão no mercado – têm contribuições a fazer para além dos cuidados maternos, por exemplo, em cardiologia, medicina de emergência e ortopedia. Centenas de sistemas Butterfly estão sendo utilizados na Ucrânia para ajudar os socorristas a avaliar os ferimentos da guerra.
Outros instrumentos também vêm passando por uma reformulação de IA. Médicos de atenção primária em Londres estão avaliando um estetoscópio com IA para conferir se ele consegue melhorar o diagnóstico de alguns tipos de doenças cardíacas. Ensaios em Oxford estão comparando medições da função pulmonar feitas com um espirômetro controlado por IA com técnicas anteriores para detectar DPOC.
Jonathan Rothberg, cientista, engenheiro e empreendedor que fundou a Butterfly, também é um dos fundadores da Hyperfine, fabricante de uma inovadora máquina portátil de ressonância magnética chamada Swoop. Sua IA faz avaliações a partir de dados coletados com o uso de campos magnéticos comparativamente fracos. Como é mais fácil gerar esses campos fracos, a Swoop pode ser levada para a cabeceira do paciente, em vez ficar instalada na clínica, como acontece com as máquinas de ressonância magnética convencionais.
No outro extremo da escala, a Ezra, empresa sediada em Nova York, está empregando IA para reduzir o custo da ressonância magnética de corpo inteiro como ferramenta para diagnóstico de câncer. O uso de ímãs fortes e de IA deixou os exames mais rápidos e, portanto, mais baratos. A empresa oferece uma varredura de 30 minutos por US$ 1.350 e tem como objetivo reduzir o custo para US$ 500. Ainda faz parte do serviço um relatório produzido por IA, em linguagem simples, sobre o que foi encontrado.
Uma das vantagens dos sistemas de IA é que eles podem ser treinados com muito mais dados do que um estudante de medicina conseguiria assimilar. A Microsoft está colaborando com a Paige, empresa que desenvolve IA para patologistas, na construção de uma ferramenta de IA para diagnosticar câncer que será alimentada com bilhões de imagens – um patologista precisaria olhar um slide por segundo durante mais de cem vidas para acumular a mesma experiência.
Como neurologista pediátrico, Sharief Taraman diz que deve atender milhares de crianças ao longo da carreira; mas a IA que sua empresa sediada no Vale do Silício, a Cognoa, construiu para avaliar o autismo em crianças foi treinada em filmagens de centenas de milhares. Como resultado, ela pode utilizar vídeos enviados pelas famílias, juntamente com um questionário, para estudar cada caso.
Mas não basta simplesmente chegar a uma avaliação: acertar a avaliação também é fundamental. Com a IA vem a oportunidade de igualar ou até superar o desempenho humano. Por exemplo, é provável que as IAs possam exceder a capacidade dos patologistas humanos na hora de “classificar” alterações na próstata como benignas ou malignas. Mas mostrar que um sistema é suficientemente bom leva tempo e, neste momento, está mais rápido gerar algoritmos do que testá-los e regulá-los. Hugh Harvey, chefe da Hardian Health, empresa britânica que avalia dispositivos médicos, diz que atualmente são necessários pelo menos dois anos para que um dispositivo médico obtenha aprovação regulamentar.
Uma visão que vale a pena ver: você
Analisando os planos do governo britânico para acelerar a utilização de IAs no diagnóstico de câncer de pulmão, David Baldwin, professor honorário de medicina na Universidade de Nottingham, salienta que duas avaliações recentes não conseguiram confirmar a precisão e o impacto clínico das ferramentas que vem sendo festejadas. “É um exemplo de que o ritmo de desenvolvimento é mais rápido que o da avaliação, e é preciso muito trabalho para garantir uma implantação segura”, afirma ele.
Em 2019, uma análise sistemática da precisão diagnóstica de 82 algoritmos de imagens médicas descobriu que os métodos pelos quais eles foram avaliados muitas vezes estavam abaixo do ideal. Uma das maiores preocupações foi a falta de ensaios “prospectivos”, que analisam os resultados após uma intervenção, em oposição aos ensaios retrospectivos, que começam com os resultados e voltam para analisar o que aconteceu antes.
Isso é importante, entre outros motivos, porque os ensaios prospectivos são melhores na detecção de “falsos positivos” – casos em que determinado sistema disse que havia algo errado, mas não havia. Gerald Lip, radiologista consultor do NHS em Grampian, na Escócia, descobriu que alguns algoritmos, como o Mia, que são tão bons ou melhores que os humanos na detecção de câncer de mama, ainda geram mais falsos positivos, em parte porque trabalham só com imagens, ao passo que os médicos têm outras fontes de informação. Os falsos positivos são um problema para os pacientes porque suscitam preocupação e desencadeiam etapas potencialmente dolorosas – e até mesmo perigosas. E são um problema para os sistemas de saúde porque aumentam os custos.
Se a IA ocasionar um aumento no “rastreamento oportunístico” para outras coisas quando uma imagem é feita para um propósito específico, então os falsos positivos precisarão ser particularmente baixos. E o mesmo se aplica a todas as abordagens que examinam pessoas que não apresentam sintomas. Quando Eric Topol, diretor do Scripps Research Translational Institute, em San Diego, analisa sistemas como o da Erza, que faz exames de corpo inteiro em pessoas saudáveis, ele se preocupa com a possibilidade de descobertas incidentais e “de se fazer um monte de exames com alto risco e custo” só para descobrir que não há câncer nenhum. Daniel Sodickson, principal conselheiro científico da Ezra, diz que a resposta adequada a descobertas incidentais são exames de acompanhamento para conferir se alguma coisa está mudando. Essa abordagem terá de apresentar muitas provas sólidas para convencer céticos como o Dr. Topol.
A situação parece estar melhorando. À medida que a IA se torna mais popular, quem paga por sua utilização procura dados confiáveis para decidir o que vale a pena. Bons estudos prospectivos levam tempo, por isso não é surpreendente que ainda não existam tantos. Outros problemas observados no estudo de 2019 – alguns testes utilizaram os dados nos quais o sistema foi treinado, em vez de dados que não ele tinha visto antes – devem se tornar menos comuns com o amadurecimento do campo. Não é de surpreender que haja empreendedores irritados com processos de avaliação que custam tempo a eles e a seus pacientes. O Dr. Taraman teme que a hesitação quanto ao uso mais disseminado de testes que oferecem diagnóstico precoce para autismo traga custos claros: as crianças estão “perdendo uma janela de oportunidade e vão sentir consequências por toda a vida”.
Um retrato total, sem nada de fora
Uma nova geração de modelos de base treinados em uma variedade de fontes de dados, não apenas em imagens e textos, provavelmente vai expandir ainda mais a caixa de ferramentas. Esses modelos não exigem a rotulagem das enormes quantidades de dados nos quais são treinados. E têm capacidade de aprendizagem “auto-supervisionada”, o que pode ser aplicado a imagens, dados genômicos, dados de expressão genética, dados metabólicos, registros de saúde eletrônicos, exames de sangue e questionários sobre estilo de vida e histórico familiar.
Os modelos de base devem fazer mais que melhorar o diagnóstico de problemas já presentes. Eles também poderão proporcionar um melhor alerta precoce sobre doenças que ainda estão por vir, como câncer, doenças cardíacas ou diabetes (veja o gráfico). Em 2022, pesquisadores chineses mostraram que esse tipo de modelo podia prever o risco de doença grave em pacientes de covid. Dito isto, essa forma de aplicação de IA precisa de cuidado e atenção especiais para garantir que os modelos não introduzam ou amplifiquem vieses.
Essa nova tecnologia mal começou a entrar na medicina. Em 2023, um artigo na Nature atribuiu isso ao fato de esse desenvolvimento ser recente e de que, embora textos e vídeos sejam abundantes na internet (especialmente se você não ligar muito para direitos autorais), é difícil ter acesso a conjuntos de dados médicos grandes e diversos. Trata-se de uma vantagem para empresas com grandes recursos; daí a empolgação com a parceria da Microsoft com a Paige em um modelo de diagnóstico de câncer.
Pesquisadores do Moorfields Eye Hospital, em Londres, vêm aplicando IA à oftalmologia desde 2016. Em setembro do ano passado, Pearse Keane e colegas do Moorfields e da University College London publicaram um modelo de base para imagens de retina produzidas com o Google DeepMind. O retFound, que foi pré-treinado com mais de um milhão de imagens antes de ver imagens rotuladas com problemas como retinopatia diabética e glaucoma, consegue igualar o desempenho de especialistas na tomada de decisões sobre encaminhamento de pacientes para uma série de doenças oculares. Ao detectar pequenas alterações nos vasos sanguíneos do olho, a máquina também parece prever problemas de saúde como doença de Parkinson e acidente vascular cerebral. Keane diz que a tecnologia deverá estar amplamente disponível em código aberto dentro de dois ou três anos.