Artículos

/ Publicado el 14 de noviembre de 2023

Um ensaio clínico multicêntrico, prospectivo e de diagnóstico

Inteligência artificial vs humana no câncer de pele

Comparação de inteligência artificial humana versus inteligência artificial alimentada por dispositivos móveis para o diagnóstico e tratamento de câncer de pele pigmentado em atenção secundária

O diagnóstico de câncer de pele requer experiência médica. A inteligência artificial (IA) impulsionada por dispositivos móveis pode ajudar no diagnóstico, mas não está claro como funciona esta tecnologia em um cenário clínico.

Por esta razão, Menzies e colaboradores (2023) tiveram como objetivo principal testar na clínica se existe equivalência entre os algoritmos de IA e os médicos para o diagnóstico e tratamento das lesões cutâneas pigmentadas.

Métodos

No ensaio clínico diagnóstico multicêntrico, prospectivo, foram incluídos médicos especialistas e recém-formados e pacientes de dois centros de referência terciários na Austrália e na Áustria. Os especialistas possuíam qualificação médica especializada no diagnóstico e tratamento de lesões pigmentadas da pele, enquanto os o grupo controle eram médicos juniores em dermatologia ou registradores em cargos de treinamento com experiência no exame e tratamento dessas lesões.

Os pacientes elegíveis tinham entre 18 e 99 anos e tinham tipo de pele Fitzpatrick I-III modificado; aqueles no ensaio de diagnóstico foram submetidos a excisão ou biópsia de rotina de uma ou mais lesões cutâneas pigmentadas suspeitas maiores que 3 mm no diâmetro mais longo, e aqueles no ensaio de tratamento tiveram fotografias basais de corpo inteiro tiradas dentro de 1 a 4 anos.

Usamos dois instrumentos de inteligência artificial (IA) alimentados por telefones celulares que incorporam um acessório óptico simples: um novo algoritmo de IA de 7 classes e o algoritmo de IA da International Skin Imaging Collaboration (ISIC), que foi previamente testado em um grande estudo de leitores on-line.

O padrão de referência para lesões retiradas no ensaio diagnóstico foi o exame histopatológico. No estudo de manejo, o padrão de referência foi uma hierarquia descendente baseada no exame histopatológico, comparação de fotografias basais de corpo inteiro, monitoramento digital e telediagnóstico.

O principal resultado deste estudo foi comparar a precisão das decisões de gestão e diagnóstico de especialistas e médicos recém-formados com os dois instrumentos de IA. As possíveis decisões no estudo de manejo foram alta, biópsia ou acompanhamento por 3 meses. As decisões de seguimento foram consideradas equivalentes à alta (cenário A) ou biópsia de lesões malignas (cenário B).


Resultados

O estudo diagnóstico incluiu 172 lesões pigmentadas suspeitas (84 malignas) de 124 pacientes e o estudo de manejo incluiu 5.696 lesões pigmentadas (18 malignas) de todo o corpo de 66 pacientes de alto risco.

Os diagnósticos do algoritmo de inteligência artificial (IA) de 7 classes foram equivalentes aos diagnósticos de especialistas (diferença de precisão absoluta de 1,2% [IC 95% –6,9 a 9,2]) e significativamente maiores do que os dos recém-formados(21,5% [13,1 a 30,0]).

Os diagnósticos do algoritmo ISIC AI foram significativamente inferiores aos diagnósticos de especialistas (–11,6% [–20,3 a –3,0]), mas significativamente superior aos diagnósticos dos recém-formados (8,7% [–0· 5 a 18,0]).

A melhor IA de gestão de 7 classes foi significativamente inferior à gestão especializada (diferença de precisão absoluta na decisão de gestão correta –0,5% [IC 95% –0,7 a –0,2] no cenário A e –0,4% [–0,8 a –0,05] no cenário B).

Figura: Objetivo do ensaio diagnóstico primário. Os diagnósticos incorretos e corretos foram pontuados com base nos sete diagnósticos verdadeiros possíveis. As barras de erro mostram ICs de 95%. Os diagnósticos da classe 7 IA e dos especialistas foram equivalentes. Os diagnósticos do ISIC AI foram significativamente inferiores aos dos especialistas; e os diagnósticos de IA classe 7 e IA ISIC foram significativamente maiores que os dos novatos. δ=limite de equivalência clinicamente significativo. IA=inteligência artificial. ISIC=Colaboração Internacional de Imagens da Pele.


Discussão e conclusão

A nova IA impulsionada por um dispositivo móvel de 7 classes, desenvolvida especificamente para o ensaio clínico, utilizando um simples acessório de celular para dermatoscopia que havia formado sua base a partir de uma grande base de dados de imagens capturadas de maneira similar para o desenvolvimento de seu algoritmo, sendo equivalente aos especialistas e significativamente superior aos principiantes para o diagnóstico de todas as lesões pigmentadas. 

Este estudo foi o primeiro estudo prospectivo que respaldou o potencial do diagnóstico de câncer de pele baseado em IA a partir de imagens dermatoscopicas em comparação com os médicos em um entorno clínico para todas as classes de lesões pigmentadas clinicamente relevantes. A importância do estudo é destacada porque os resultados foram obtidos com base em tecnologia simples de telefonia móvel, sem hardware caro, ao contrário dos dispositivos anteriores, mais caros e independentes, que passaram por grandes estudos fundamentais.

Ao contrário da IA ​​de classe 7, o algoritmo ISIC AI descrito acima, que foi superior aos especialistas num estudo com leitores online, foi significativamente inferior aos especialistas (diferença de precisão absoluta –11,6%), embora continuasse a ser superior ao dos recém-formados para diagnóstico (8,7%). Ao comparar a precisão multiclasse balanceada, que foi o desfecho primário dos estudos on-line, nenhuma tendência de mudança foi encontrada neste resultado. Uma possível explicação para a diferença no desempenho da IA ​​Classe 7 e da IA ​​ISIC é que a IA Classe 7 foi treinada em um banco de dados maior de imagens com múltiplas fontes.

Um algoritmo de Inteligência Artificial para câncer de pele que foi superior em estudos experimentais foi significativamente inferior aos especialistas em um cenário do mundo real.