Una reflexión del Dr. Arturo Cagide | 19 MAY 24

El clínico y la Inteligencia Artificial

Una nueva era de procesamiento de datos y de ayudas para la clínica que requiere una integración armoniosa
Autor/a: Dr Arturo Cagide. Hospital Italiano Bs As 
INDICE:  1. Página 1 | 2. Referencias bibliográficas
Página 1

No infrecuentemente los médicos desafían a la inteligencia artificial (IA) con preguntas que abordan la temática de toma de decisiones bajo condiciones de complejidad clínica variada. La situación se aproxima a un juego de entretenimiento.

Pero en un recorrido inverso son los médicos quienes resultan interpelados por la IA mediante comunicaciones bibliográficas cada vez más frecuentes sobre el posible aporte de esta técnica en la práctica clínica cotidiana.

La respuesta del profesional a este desafío se puede encuadrar en diferentes escenarios.

Rechazo. El criterio se fundamenta en que la información (bibliográfica, de congresos, mesas redonda y debates) junto con la experiencia clínica del profesional, no podrá ser superada por la IA. Este razonamiento es infundado por la fenomenal capacidad de análisis de la IA, toda vez que ésta es convenientemente alimentada con múltiples datos fidedignos.

En una comunicación reciente, los médicos generalistas se vieron más dispuestos a aceptar la IA en el diagnóstico por imágenes que los especialistas en esas prácticas.

De mayor contundencia es el argumento sustentado en que la relación médico paciente es imposible de superar al percibir la problemática real más o menos explicitada por quien concurre a la consulta; se afirma que el contacto directo es y será insuperable. Este punto se puede rebatir concluyendo que la IA no pretende reemplazar al profesional, solo asistirlo.

Futuro alejado. En este terreno se señala que la IA es un proyecto y no una realidad más o menos inmediata; pasarán mucho años antes de que irrumpa en la práctica.

Sin embargo, cada vez con mayor frecuencia la IA es motivo de comunicaciones bibliográficas con temas de interés para el especialista y subespecialista. El crecimiento ocurrirá en términos exponenciales y seguramente los médicos en formación (residentes) y los profesionales ya formados, deberán lidiar con la IA en un futuro próximo. Con esta perspectiva es conveniente incursionar en su problemática progresivamente.

Complejidad mayor. Esta aseveración puede ser cierta, pero depende de la perspectiva personal. Ecuaciones, algoritmos, hiperparámetros y los procesos íntimos que gobiernan la IA son patrimonio exclusivo de matemáticos, expertos en computación y en procesos. Pero otros aspectos como falsos positivos y negativos, sensibilidad y especificidad, discriminación, reclasificación, etc., habituales en las discusiones médicas afectan por igual a la IA.

La Fig. 1 grafica en una escala de riesgo la distribución de individuos con y sin eventos. En A la discriminación del criterio, en este caso un score, es muy elevada y un determinado valor separa unos de otros en forma clara (alta sensibilidad con alta especificidad); en B los individuos con y sin eventos tienen una amplia superposición de los valores en el rango medio del score. En el primer caso la curva ROC tendrá un valor elevado; en B el área será reducida debiéndose optar por preservar la sensibilidad (no falos negativos) o la especificidad (no falsos positivos).         


Fig. 1: Ejemplo teórico.
En A, el criterio, en este caso por ejemplo un score de riesgo, discrimina los episodios de los no episodios, con perfecta sensibilidad y especificidad; en B en el rango intermedio hay superposición entre unos y otros, debiéndose optar por preservar la sensibilidad o la especificidad. La IA puede mejorar la capacidad de discriminación pero seguramente no será con la precisión de la situación graficada en A.

Se podría concluir que la IA con sus precisas ecuaciones matemáticas no se ve afectada por esta problemática y su capacidad de discriminación será la graficada en A. Sin embargo la IA sí queda comprometida por estas limitaciones aun cuando el objetivo del estudio sea el análisis de imágenes como eco-doppler o resonancia magnética nuclear en las cuales su capacidad de análisis es insuperable.

De esta forma, pese a que por sus características particulares y por la complejidad que implica el conocimiento íntimo de su funcionamiento, concluir que la IA está muy alejada de los intereses actuales del profesional médico es una conclusión al menos apresurada.


Inteligencia Artificial e Investigación Clínica

La IA en la investigación clínica como paso inicial para su ulterior posicionamiento en la toma de decisiones médicas queda sujeta a los lineamientos generales establecidos firmemente desde tiempo atrás.

Población

Se refiere al conjunto de individuos que constituye la muestra de la población objetivo. Tendrá características propias (edad, condiciones socioculturales, etnia, ingresos etc) que condicionan que los hallazgos resultantes de su análisis estadístico puedan o no generalizarse a otros conjuntos.

El Dato

Es el valor que representa a una determinada variable. Cualidades como su certeza, consistencia, rigurosidad, sistematización en su obtención, etc. son cualidades que definen su validez en una determinada formulación estadística.

Las cualidades de la población y del dato son condiciones que condicionan la validez de la conclusión resultante de un análisis estadístico. Resultan comunes a la estadística convencional y a la inteligencia artificial (IA).

Machine Learning

Machine Learning, (ML) una de las formas de IA, es el procesamiento de la información (relación matemática, algoritmos) mediante la cual se trata de hallar asociaciones (patrones) de datos o parámetros (datos de entrada, input) vinculados con otro/s (output) que constituyen el objeto del estudio, el cual será expresado en términos probabilísticos. Este proceso suela denominarse aprendizaje.

En el caso de deep learning como el graficado en la Fig 2 (modificada de JAMA Cardiol. September 20, 2023) el aprendizaje consiste en generar asociaciones de datos en capas sucesivas de análisis (capas neuronales, ocultas), empleando diferentes algoritmos (algoritmos supervisados) (Random Forests, XGBoost, and Bayesian additive regression tree). Esa información es integrada en unidades o núcleos (nodos) interconectados, progresivamente menores en su número, que en forma muy simplificada se representan en la Fig. 2 como "F". En esencia son sucesivas ecuaciones matemáticas que se ajustan progresivamente.

Aunque el desarrollo es automático, el operador puede definir ciertos parámetros de interés a priori (hiperparámetros).


Fig 2: Se grafican los pasos de una investigación clínica desde la selección de la población y los datos que representan las variables de ingreso, su proceso por IA /ML, y el resultado final expresado como probabilidad (ecuación logística); por último, la validación externa permite su generalización.

El proceso (aprendizaje) continua hasta encontrar un conjunto de asociaciones que finalmente se ponderan según su peso relativo (en la Fig.2 referidos como F x P).

Finalmente, con ellos se formula la ecuación de regresión logística (relación “S” en la figura) para estimar la probabilidad del dato de salida (output).

Ahora bien, el resultado expresado como probabilidad por sí solo no brinda el nivel de confiabilidad ya que debería incluir una medida de dispersión (intervalo de confianza). Esto implica una dificultad extra que agrega complejidad y tiempo al sistema, problemática que han abordado diferentes grupos de investigadores.

Machine Learning y Overfitting

En el proceso se pueden generar errores resultantes de ajustes inadecuados entre las variables de entrada (input) y la de salida (output). Ese error se grafica en la Fig 3


Fig 3: La correlación (input /output) expresada en el centro del gráfico es correcta; la de la derecha es precisa, pero integrando datos ("ruidos", puntos pequeños no rellenos) que constituyen un hallazgo no veraz, y, por lo tanto, no transferible a una población diferente de la población de "aprendizaje" (falla en la validación externa). En la izquierda la correlación tiene un defecto por subestimación.

La línea representa la relación matemática final que estima el output a partir de los datos de entrada. En la izquierda el ajuste es en menos (underfitting) por no representar cabalmente la relación en valores extremos. En la derecha, el ajuste es en mas (overfitting) debido probablemente a la multiplicidad de datos generados, no veraces ("ruidos"), graficados por puntos no rellenos de menor tamaño. Se trata en definitiva de un comportamiento fallido del "aprendizaje", que encuentra asociaciones altamente significativas no reproducibles al repetir el experimento en otras poblaciones (falsos positivos). En otras palabras, se entrega información precisa para los datos de entrenamiento, pero no para su empleo en otras poblaciones.

Con la intención de evitar este sobre ajuste, el propio sistema intenta corregir el error evaluando las ecuaciones halladas en subgrupos de la población original (cross validación) realizando los ajustes necesarios (graficado por flechas contrapuestas). El resultado final debería ser como el que se representa en la parte central de la Fig. 2.

Validación Externa

Para que el traslado de la investigación con IA/ML a la práctica clínica resulte confiable es fundamental su validación externa.

El resultado hallado se corresponde exclusivamente a la población (y sus datos) en los que se realizó el experimento. En otras poblaciones (generalización) puede haber condiciones particulares que la diferencian de la original, lo cual podría determinar su no aplicabilidad. Ya se consideró que la posibilidad de incurrir en falsos positivos es elevada.

El traslado del hallazgo a otra población se explora habitualmente mediante la calibración (correlación en la misma del valor predicho con el real) y por el área ROC (discriminación) comparando el set de derivación (original) con el set de validación en la nueva población. (Fig 3).


Fig 4: Ejemplo teórico.
Validación: a la izquierda correlación de los eventos predichos con los observados en una población diferente, a la que se halló el score con IA/ML; a la derecha, curvas ROC de la población original (derivación, línea continua) y de la validación (línea de puntos) en otra población En el ejemplo ambos gráficos permiten la generalización de lo hallado en IA/ML.

Si una de las cualidades excluyente de la IA es su capacidad para analizar grandes bases de datos (big data), la necesidad de validación es, en alguna medida, un factor limitante ya que también requiere grandes poblaciones para alcanzar respaldo estadístico.

De la Estadística Convencional a la Inteligencia Artificial

Tema de interés particular para el clínico, requiere analizarse desde distintas perspectivas

  • En la estadística clásica, si se permite el término, el estadístico en conjunto con el clínico, definen el objetivo primario del estudio, y a partir de allí, seleccionan las variables (variables de confusión) que podrían afectar la variable de interés, el dato con que serán representadas (punto de corte, estandarización, transformación, etc.) y su incorporación final al modelo multivariado (selección forward o backward). 

    Todos estos aspectos se determinan a priori. Estos criterios aplican también cuando el objetivo de la investigación es una imagen (ECG, eco-doppler, resonancia magnética, tomografía computada, etc.). Por el contrario, una condición excluyente de la IA/ML es, en la fase de entrenamiento, su habilidad para buscar, extraer y transformar datos en forma automática e independiente mediante algoritmos inteligentes. La información a analizar puede incorporar infinidad de parámetros y sus eventuales asociaciones. En el proceso, el juicio clínico puede ser totalmente excluido.
     
  • El análisis bayesiano, no solo desde la perspectiva estadística sino en la toma de decisiones, es fundamental. Implica analizar el valor de la nueva información (test) partiendo de la plataforma de lo ya conocido o investigado (pre test) para alcanzar el resultado (post test). Por ejemplo, en el análisis de imágenes la información aportada por la IA/ML puede ser analizada fuera de todo contexto clínico, es decir no integrándola al algoritmo de análisis original, para luego incorporarla como pre test al input o test, para obtener la probabilidad final (post test).
     
  • Causalidad, como inferencia respecto de una determinada asociación de variables, es vital en la interpretación fisiopatológica que sigue al hallazgo estadístico. La temporalidad como factor determinante de esa inferencia puede ser resuelta por la IA/ML, pero la plausibilidad biológica es una condición fundamental aportada, en principio, solo por el juicio clínico.
     
  • Gold estándar y puntos subrogantes en la interpretación de estudios diagnósticos, pronósticos o de intervención en la estadística clásica, presentan iguales dificultades y fortalezas que en la IA/ML.
 

Comentarios

Para ver los comentarios de sus colegas o para expresar su opinión debe ingresar con su cuenta de IntraMed.

CONTENIDOS RELACIONADOS
AAIP RNBD
Términos y condiciones de uso | Política de privacidad | Todos los derechos reservados | Copyright 1997-2024