En la población mayor general

Aprendizaje automático para predecir enfermedades neurodegenerativas

Predicción de nuevos eventos de Parkinson, Alzheimer o demencia

Antecedentes

En la población general de mayor edad, las enfermedades neurodegenerativas (EN) se asocian con una mayor discapacidad, disminución de la función física y cognitiva. La detección de factores de riesgo puede ayudar a implementar medidas de prevención. Usando redes neuronales profundas (DNN), un algoritmo de aprendizaje automático podría ser una alternativa a la regresión de Cox en conjuntos de datos tabulares con muchas características predictivas.

Nuestro objetivo fue comparar el rendimiento de diferentes tipos de redes neuronales profundas (DNN) con modelos de riesgos proporcionales de Cox regularizados para predecir enfermedades neurodegenerativas (EN)  en la población general de mayor edad.

Métodos

Realizamos un análisis longitudinal con participantes del English Longitudinal Study of Ageing. Incluimos hombres y mujeres sin EN al inicio, mayores de 60 años, evaluados cada 2 años desde 2.004 a 2.005 a 2.016-2.017. Las características fueron un conjunto de 91 variables basales clínicas y epidemiológicas.

El resultado fueron nuevos eventos de Parkinson, Alzheimer o demencia. Después de aplicar múltiples imputaciones, entrenamos tres algoritmos DNN: Feedforward, TabTransformer y Dense Convolutional (Densenet). Además, entrenamos dos algoritmos basados ​​en modelos de Cox: regularización de Elastic Net (CoxEn) y características seleccionadas (CoxSf).

Resultados

Se incluyeron 5.433 participantes en el ciclo 2. Durante el seguimiento, el 12,7 % de los participantes desarrollaron enfermedades neurodegenerativas (EN). Aunque los cinco modelos predijeron eventos EN, la capacidad de discriminación fue superior usaENo TabTransformer (estadística C de Uno (coeficiente (intervalos de confianza del 95 %)) 0,757 (0,702, 0,805).

TabTransformer mostró una precisión equilibrada depeENiente del tiempo superior (0,834 (0,779, 0,889) y especificidad (0,855 (0,773, 0,909)) que los otros modelos Con la CoxSf (hazard ratio (intervalos de confianza del 95 %)), edad (10,0 (6,9, 14,7)), mala audición (1,3 (1,1, 1.5)) y la pérdida de peso 1.3 (1.1, 1.6)) se asociaron con un mayor riesgo de DNN. Por el contrario, función ejecutiva (0,3 (0,2, 0,6)), memoria (0, 0, 0,1)), mayor velocidad de la marcha (0,2, (0,1, 0,4)), actividad física vigorosa (0,7, 0,6, 0,9) y mayor índice de masa corporal (IMC) (0,4 (0,2, 0,8)) se asoció con un menor riesgo de DNN.


Figura:
Evaluación dependiente del tiempo de modelos que predicen nuevos eventos de enfermedades neurodegenerativas. Las curvas representan la evolución del rendimiento evaluado con AUC dependiente del tiempo, precisión equilibrada, sensibilidad y especificidad para cada uno de los cinco modelos. Panel A: El promedio de AUC de 40 conjuntos de datos de prueba imputados en 4, 6, 8, 10 y 12 años después de la inscripción. Panel B: El promedio de precisión equilibrada de 40 conjuntos de datos de prueba imputados en 4, 6, 8, 10 y 12 años después de la inscripción. Panel C: El promedio de sensibilidad de 40 conjuntos de datos de prueba imputados en 4, 6, 8, 10 y 12 años después de la inscripción. Panel D: el promedio de especificidad de 40 conjuntos de datos de prueba imputados en 4, 6, 8, 10 y 12 años después de la inscripción.


Conclusión

TabTransformer es prometedor para la predicción de las EN con conjuntos de datos tabulares heterogéneos con numerosas características. Además, puede manejar datos censurados. Sin embargo, los modelos de Cox funcionan bien y son más fáciles de interpretar que los DNN. Por lo tanto, siguen sieENo una buena opción para los EN.

Discusión

Este estudio encontró que TabTransformer, en comparación con otros modelos DNN (Densenet y FeedForward) y Cox regularizados, mostró una capacidad discriminatoria superior para predecir eventos de EN en una población general mayor. Debido a las capas basadas en la atención, TabTransformer funciona bien con datos heterogéneos, particularmente en la gestión de entradas categóricas, lo que no ocurre con otras redes neuronales. En la evaluación dependiente del tiempo, TabTransformer, en comparación con los otros modelos, se desempeñó de manera similar en AUC y precisión equilibrada, ligeramente peor en sensibilidad y mejor en especificidad en los años 4 y 6 de seguimiento. La predicción de los DE a mediano y largo plazo es relevante debido a que estas condiciones tienen largos períodos prodrómicos.

Hasta donde sabemos, esta es la primera vez que se utilizó Tabtransformer con datos censurados e imputaciones múltiples para tratar con datos faltantes para predecir un evento en la población general.

Mensaje final

Demostramos que es posible predecir EN en la población general mayor y que el rendimiento de Tabtransfomer parece mejor que otros NDD para datos tabulares. TabTransformer, un tipo de DNN, puede ser una alternativa a los modelos de Cox para predecir EN en estudios de cohortes de población y es más adecuado para numerosas funciones. Por el contrario, los modelos de Cox son más fáciles de interpretar pero difíciles de implementar con muchos predictores candidatos. TabTransformer combina las ventajas de otras estructuras, como redes convolucionales y recurrentes, y mejora el modelado al considerar el contexto circundante. Además, puede integrar entradas categóricas además de características numéricas y manejar una pérdida de seguimiento y abandono de los participantes porque está modelado. Estas características hacen que esta estructura sea prometedora para análisis de supervivencia de datos complejos y heterogéneos donde existen numerosas características que pueden considerarse predictores potenciales. Tabtransformer podría ser aplicable y la opción preferida sobre los modelos de Cox para combinar datos tabulares y no tabulares (por ejemplo, imágenes).