Os exames de rastreamento são usados para detectar o câncer de mama precocemente em mulheres que não apresentam sinais evidentes da doença. Essa tarefa de análise de imagem é desafiadora porque o câncer geralmente fica oculto ou mascarado nas mamografias por sobreposição de tecido mamário "denso". O problema estimulou esforços para desenvolver sistemas de inteligência artificial (IA) baseados em computador para melhorar o desempenho diagnóstico. McKinney et al.1 realizaram um relatório sobre o desenvolvimento de um sistema de inteligência artificial que supera os radiologistas especialistas na interpretação precisa de mamografias de programas de rastreamento. O trabalho fez parte de uma onda de estudos que investigam o uso da IA em uma variedade de contextos de imagens médicas.2
Apesar de algumas limitações, o estudo de McKinney e colaboradores é impressionante. Seus pontos fortes incluíram a grande escala dos conjuntos de dados usados para treinar e posteriormente validar o algoritmo de IA.
Mamografias de 25.856 mulheres no Reino Unido e 3.097 mulheres nos Estados Unidos foram usadas para treinar o sistema de IA. O sistema foi então usado para identificar a presença de câncer de mama em mamografias de mulheres com câncer de mama comprovado por biópsia ou resultados de imagem de acompanhamento normais, pelo menos 365 dias depois. Esses resultados são o padrão ouro amplamente aceito para confirmar o status do câncer de mama em pessoas que fazem o rastreamento da doença. Os autores relatam que o sistema de IA superou tanto as decisões históricas feitas por radiologistas que inicialmente avaliaram mamografias, quanto as decisões de 6 radiologistas especialistas que interpretaram 500 casos selecionados aleatoriamente em um estudo controlado.
Os resultados de McKinney e colaboradores sugerem que a IA poderá um dia contribuir para a detecção precoce do câncer de mama, mas os autores corretamente apontam que os ensaios clínicos serão necessários para avaliar melhor a utilidade desta ferramenta na prática médica. O mundo real é mais complicado e potencialmente mais diverso do que o tipo de ambiente de pesquisa controlado relatado neste estudo. Por exemplo, o estudo não incluiu todas as diferentes tecnologias de mamografia atualmente em uso, e a maioria das imagens foi obtida usando um sistema de mamografia de um único fabricante.
O estudo incluiu exemplos de dois tipos de mamografias: tomossíntese (também conhecida como mamografia 3D) e mamografia digital convencional (2D). Seria útil saber como o sistema funciona individualmente para cada tecnologia.
O desempenho dos algoritmos de IA pode ser altamente dependente da população usada nos conjuntos de treinamento. Portanto, é importante que uma amostra representativa da população em geral seja utilizada no desenvolvimento dessa tecnologia, para garantir que os resultados sejam amplamente aplicáveis.
Outra razão para moderar o entusiasmo por este e outros estudos de IA semelhantes são as lições aprendidas com a detecção assistida por computador (DAC) do câncer de mama. DAC é um sistema de computador mais antigo que visa melhorar a interpretação de mamografias na clínica, mostrou-se muito promissor em testes experimentais, mas ficou aquém em configurações do mundo real.3