En los últimos años, la inteligencia artificial (IA) se ha consolidado como una herramienta para predecir la aparición y progresión de las complicaciones de la diabetes. Ello facilitaría la implementación de estrategias preventivas y terapéuticas personalizadas.
Hay muchos modelos para lograr el cometido. Existen técnicas de machine learning (ML), como la regresión logística, las máquinas de vectores de soporte y el random forests. Pero también está el deep learning, con redes neuronales profundas y modelos basados en XGBoost.
- Modelos basados únicamente en datos clínicos
Las variables clínicas estándar (edad, sexo, índice de masa corporal, HbA1c, presión arterial, niveles lipídicos, historia familiar, duración de la diabetes) son predictores clásicos que podemos cargar a un modelo de IA. Los modelos basados en random forests y máquinas de vectores de soporte alcanzan valores entre 0,70 y 0,85 para la predicción de la nefropatía diabética y entre 0,65 y 0,80 para la retinopatía diabética. Considerando que 1 sería la predicción perfecta, no son datos despreciables.
- Modelos que integran datos genéticos
La información genética también se puede cargar a modelos predictivos de IA. Aquí tenemos como fuentes de datos a los polimorfismos de un solo nucleótido (SNPs), las puntuaciones de riesgo poligénico (PRS) y la epigenética (como la metilación de ADN).
La incorporación de datos genéticos se asocia con un incremento promedio de 0,05 a 0,10 en la predicción, alcanzando puntajes cercanos a 0,90 para complicaciones como la nefropatía y la enfermedad cardiovascular en la diabetes tipo 2.
No obstante, hay dudas respecto a la viabilidad de usar lo genético. Se requieren cohortes de gran tamaño (normalmente >1000 pacientes) y los costos son elevados por el genotipado.
- Modelos multimodales (clínicos + genéticos)
Combinar variables clínicas, genéticas y, en algunos casos, imágenes (retinografías, por ejemplo) o datos de laboratorio avanzado (proteómica urinaria, por ejemplo), podría incrementar la calidad de la predicción. De hecho, estas aproximaciones demuestran el mejor rendimiento global, con valores superiores a 0,90 para la predicción de complicaciones cardiovasculares y renales.
Sin embargo, la complejidad de estos modelos, sumada a la necesidad de manejar datos multimodales con formatos heterogéneos, ha dificultado su replicación y adopción en entornos clínicos.
Hoy nos enfrentamos a desafíos esenciales para que los modelos se transformen en herramientas clínicas de uso diario:
- Falta de validación externa: Solo el 20 % de los estudios al respecto evalúa el desempeño en cohortes independientes o en poblaciones geográficamente distintas. Sin validación externa, es difícil asegurar que un modelo mantenga su precisión cuando se aplica fuera del contexto original de entrenamiento.
- Ausencia de datos de validación en entornos reales: Impide conocer la coherencia frente a variaciones en la calidad de los datos clínicos o en los métodos de genotipado.
- Falta de transparencia y reproducibilidad de los algoritmos: La transparencia en los modelos de IA es fundamental para ganar la confianza de los profesionales de la salud y cumplir con normativas éticas. No obstante, pocos publican el código fuente completo y menos son los que explícitamente adhieren a las guías TRIPOD. La carencia de información sobre parámetros de ajuste, preprocesamiento de datos y criterios de selección de variables socava la reproducibilidad.
A pesar de los desafíos, los modelos de IA para la predicción de complicaciones diabéticas ofrecen muchas ventajas. En principio, permiten identificar pacientes con alto riesgo de desarrollar neuropatía, retinopatía o enfermedad renal, antes de que las alteraciones clínicas sean evidentes. Ello nos llevaría a intervenciones oportunas, con ajuste de las dosis o cambios en el estilo de vida.
Al integrar datos genéticos, se pueden personalizar las estrategias preventivas según la predisposición individual, optimizando recursos y minimizando efectos adversos. La estratificación de riesgo es una estrategia para priorizar seguimientos y pruebas costosas en quienes realmente lo necesitan.
Los próximos pasos para aumentar la validación de los sistemas de IA en este campo es que haya más adherencia a las guías de TRIPOD y que se incorporen métricas de equidad, como la disparidad de falsos positivos/falsos negativos entre subgrupos, por ejemplo. Los análisis de sensibilidad para distintos estratos demográficos también tendrían que aparecer en el horizonte de la investigación, con el fin de reproducir los resultados en diferentes países sin depender de un sesgo de entrenamiento.
Finalmente, llevar adelante estudios costo-efectividad permitirá comparar los costos de implementación de cada modelo versus el ahorro en complicaciones evitadas.
Sin dudas, los modelos de IA aplicados a la predicción de complicaciones en diabetes tipo 2 representan una frontera de innovación en la medicina de precisión. Hoy, los algoritmos que combinan datos clínicos y genéticos suelen ofrecer un rendimiento que supera la predictividad de 0,90. Es decir, se encuentran muy cerca de lograr una predicción casi perfecta de aquellos pacientes que desarrollarán tal o cual complicación.
Referencias bibliográficas
- Khokhar PB, Gravino C, Palomba F. Advances in artificial intelligence for diabetes prediction: insights from a systematic literature review. Artif Intell Med. 2025 Jun;164:103132.
- Zou Q, Qu K, Luo Y, Yin D, Ju Y, Tang H. Predicting Diabetes Mellitus With Machine Learning Techniques. Front Genet. 2018 Nov 6;9:515.
- Mohsen F, Al-Absi HRH, Yousri NA, El Hajj N, Shah Z. A scoping review of artificial intelligence-based methods for diabetes risk prediction. NPJ Digit Med. 2023 Oct 25;6(1):197.
- Tan KR, Seng JJB, Kwan YH, Chen YJ, Zainudin SB, Loh DHF, Liu N, Low LL. Evaluation of Machine Learning Methods Developed for Prediction of Diabetes Complications: A Systematic Review. J Diabetes Sci Technol. 2023 Mar;17(2):474-489.