Articles

/ Published on February 16, 2025

Estudo comparativo transversal

Qualidade da imagem e desempenho diagnóstico

Comparação entre clínicos e modelos de aprendizado profundo

Author: Oloruntoba, A. et al. (2024)

Fuente: Journal of the European Academy of Dermatology & Venereology Assessment of image quality on the diagnostic performance of clinicians and deep learning models: Cross-sectional comparative reader study

Introdução

O câncer de pele é um dos tipos de câncer mais comumente diagnosticados globalmente, tornando o diagnóstico precoce e preciso essencial para melhores desfechos clínicos. A dermatoscopia, uma técnica não invasiva, tem demonstrado melhorar significativamente a precisão diagnóstica do câncer de pele por médicos. Paralelamente, o avanço acelerado e a implementação da inteligência artificial (IA) na dermatologia têm o potencial de revolucionar o diagnóstico, especialmente por meio das redes neurais convolucionais (CNNs). As CNNs, uma categoria específica de aprendizado profundo voltada para a análise de dados visuais, mostraram resultados promissores em ambientes controlados, equiparando-se às habilidades de dermatologistas experientes na avaliação de lesões benignas e malignas.

Além dos progressos em IA, a tecnologia de imagem de smartphones evoluiu consideravelmente na última década. A conversão de alta faixa dinâmica (HDR), agora um recurso padrão em dispositivos modernos, permite capturar uma gama mais ampla de luminância, garantindo maior detalhamento em áreas claras e escuras das imagens.

Com o crescimento da teledermatologia e o desenvolvimento de ferramentas baseadas em IA acessíveis para clínicos e pacientes, torna-se crucial compreender os impactos das imagens dermatoscópicas modificadas por HDR no desempenho diagnóstico. Nesse contexto, Oloruntoba e colaboradores (2024) investigaram os efeitos da qualidade variável das imagens, incluindo aquelas aprimoradas por HDR, na capacidade diagnóstica de modelos baseados em CNNs e clínicos.

Métodos

Neste estudo, 18 dermatologistas avaliaram 303 imagens de 101 lesões cutâneas, categorizadas em três grupos de qualidade de imagem: baixa qualidade (LQ), alta qualidade (HQ) e qualidade aprimorada (EQ), esta última obtida por meio de conversão no estilo HDR. Para isto, os clínicos participaram de um estudo em duas etapas, no qual forneceram informações sobre diagnóstico, conduta de manejo e nível de confiança em relação a cada imagem avaliada.

Resultados

Na classificação binária das lesões, os clínicos apresentaram o melhor desempenho diagnóstico ao avaliar imagens de alta qualidade (HQ), com sensibilidade de 77,3% (IC 69,1–85,5), especificidade de 63,1% (IC 53,7–72,5) e precisão de 70,2% (IC 61,3–79,1). Para a classificação multiclasse, o desempenho global também foi superior com imagens HQ, registrando a maior especificidade (91,9%; IC 83,2–95,0) e precisão (51,5%; IC 48,4–54,7).

Os clínicos apresentaram desempenho superior ao modelo CNN (mediana de diagnósticos corretos) na classificação binária das imagens de baixa qualidade (LQ) e qualidade aprimorada (EQ), enquanto o desempenho foi comparável com as imagens HQ. Entretanto, na classificação multiclasse, o modelo CNN superou significativamente os clínicos na análise das imagens HQ (p < 0,01).

Conclusão

Em conclusão, as imagens dermatoscópicas de alta qualidade (HQ) aprimoraram significativamente o desempenho diagnóstico tanto dos clínicos quanto do modelo CNN. Por outro lado, as imagens simulando tecnologias de HDR em smartphones resultaram em uma redução do desempenho diagnóstico para ambos. Para avanços futuros, é essencial que pacientes, clínicos e desenvolvedores de IA estejam cientes dos impactos da qualidade da imagem, incluindo o HDR, no diagnóstico. Além disso, a incorporação de imagens HDR deve ser cuidadosamente considerada no desenvolvimento e no treinamento de modelos de IA, a fim de garantir robustez e precisão no desempenho diagnóstico.