Predecir y explicar: una peligrosa confusión | 24 AGO 18
Un factor de riesgo no es lo mismo que un factor causal
Los "factores de riesgo" que predicen un estado de salud no son necesariamente objetivos de la intervención. Los estudios que evalúan la causalidad son más explicativos que predictivos
5
14
Autor: C. Mary SchoolingEmail author and Heidi E. Jones Fuente: Emerging Themes in Epidemiology201815:10 https://doi.org/10.1186/s12982-018-0080-z Clarifying questions about “risk factors”: predictors versus explanation
INDICE:  1. Página 1 | 2. Referencias bibliográficas
Página 1

Resumen

Antecedentes

  • En la investigación biomédica se piensa que se desperdicia mucho esfuerzo. Las recomendaciones para la mejora se han centrado principalmente en procesos y procedimientos. Aquí, adicionalmente sugerimos menos ambigüedad con respecto a las preguntas abordadas.

Métodos

  • Aclaramos la distinción entre dos conceptos combinados, predicción y explicación, ambos abarcados por el término "factor de riesgo", y proporcionamos métodos y presentación apropiados para cada uno.

Resultados

  • Los estudios de predicción de riesgos utilizan técnicas estadísticas para generar modelos contextualmente específicos basados en datos que requieren una muestra representativa que identifique a las personas en riesgo de condiciones de salud de manera eficiente (poblaciones objetivo para las intervenciones).
     
  • Los estudios de predicción de riesgos no necesariamente incluyen las causas (objetivos de la intervención), pero pueden incluir sustitutos o biomarcadores de causas baratos y fáciles de medir.
     
  • Los estudios explicativos, idealmente integrados en un modelo informativo de la realidad, evalúan el papel de los factores causales que, si se dirigen a las intervenciones, es probable que mejoren los resultados.
     
  • Los modelos predictivos permiten la identificación de personas o poblaciones con un riesgo elevado de enfermedad, lo que permite focalizar intervenciones probadas que actúan sobre factores causales.
     
  • Los modelos explicativos permiten la identificación de factores causales que se dirigen a las poblaciones para prevenir la enfermedad.

Conclusión

Garantizar una coincidencia clara de la pregunta con los métodos y la interpretación reducirá el desperdicio de investigación debido a interpretaciones erróneas.

Introducción

Asegurar que el enfoque conceptual coincida con la pregunta evitaría confundir la respuesta a una pregunta con la respuesta a una pregunta diferente

La investigación biomédica ha llegado a una crisis en la que se piensa que se desperdicia mucho esfuerzo de investigación [1]. Las recomendaciones para mejorar la situación se han centrado principalmente en procesos y procedimientos, tales como abordar cuestiones de alto impacto, a partir de lo que ya se conoce, el registro de protocolos y la disponibilidad de datos [1].

Aquí también sugerimos que asegurar que el enfoque conceptual coincida con la pregunta evitaría combinar diferentes preguntas y confundir la respuesta a una pregunta con la respuesta a una pregunta diferente.

Gran parte de la investigación biomédica observacional se refiere al papel de los "factores de riesgo" en la enfermedad, que se realiza por dos motivos principales:

(1) Estratificación o predicción del riesgo.

(2) Evaluación de la causalidad.

Estas son dos preguntas fundamentalmente diferentes, relacionadas con dos conceptos diferentes, es decir, predicción versus explicación, que requieren enfoques diferentes y tienen interpretaciones sustancialmente diferentes.

Sin embargo, el uso del término "factor de riesgo" como algo que puede predecir y / o explicar significa que estos dos conceptos pueden combinarse para que un estudio no cumpla ninguno de los objetivos, es decir, no prediga ni explique.

El colesterol LDL de lipoproteínas de baja densidad es un factor de riesgo no causal (es decir, predictor) para la enfermedad cardiovascular

Por ejemplo, los principales predictores de enfermedades cardiovasculares se han asumido durante mucho tiempo como objetivos de la intervención [2].

Después de una inversión de investigación extensa y costosa durante más de 35 años, incluido el desarrollo, prueba y falla de una nueva clase de medicamentos (inhibidores de CETP) [3], recientemente se ha identificado que el colesterol de lipoproteínas de baja densidad es un factor de riesgo no causal (es decir, predictor) para la enfermedad cardiovascular [4, 5].

Igualmente, los factores que no predicen el riesgo rara vez se identifican como factores causales (como los factores que son ubicuos en una comunidad determinada y, por lo tanto, no se los considera un riesgo creciente) [6], lo que sugiere que se están pasando por alto las intervenciones. Teniendo en cuenta la importancia de evitar "preguntas de baja prioridad" [1], aclaramos la diferencia entre estos dos conceptos y su uso en estudios observacionales.

Modelos predictivos

La estratificación del riesgo, los modelos de predicción o los modelos de "pronóstico del clima" identifican a personas o grupos con un riesgo elevado o elevado de una afección de salud particular, idealmente para que se les puedan ofrecer intervenciones comprobadas u otras medidas de mitigación que puedan implementarse.

Un ejemplo muy exitoso de un modelo de estratificación de riesgo es el puntaje de Framingham que predice el riesgo de 10 años de enfermedad cardíaca en personas sanas [7], para informar la prevención, como el uso de moduladores de lípidos.

Otros ejemplos incluyen modelos de pronóstico para identificar el mejor tratamiento para el cáncer [8], o modelos para predecir tendencias de la enfermedad, como Google Flu Trends [9]. Estos modelos predictivos generalmente se basan en proyecciones estadísticas de patrones previos, y para ser factible generalmente se basan en información capturada fácilmente.

Por ejemplo, el puntaje de Framingham puede aplicarse en la práctica clínica diaria, incluso en entornos de escasos recursos, porque solo requiere una evaluación de la edad, el sexo, el tabaquismo, la presión arterial, los lípidos y la diabetes, que son relativamente baratos y rápidos de medir. Las tendencias de gripe de Google se basaron en términos de búsqueda de Internet para síntomas particulares [9].

Los modelos de predicción generalmente se desarrollan con base en criterios estadísticos para ajustarse bien a la distribución de los datos, utilizando técnicas como la selección gradual o, más recientemente, las técnicas de aprendizaje automático. Los modelos de predicción a menudo incluyen varios "factores de riesgo" para obtener un modelo que se ajuste bien a los datos y pueda explicar la mayor cantidad de varianza en la condición de salud del resultado.

La contribución de cada "factor de riesgo" se presenta para que el lector pueda ver la contribución independiente de cada uno a la predicción general, así como las medidas de ajuste del modelo. Los modelos de predicción generalmente se validan en poblaciones similares. Como con todos los modelos estadísticos, no se puede esperar que predigan bien en circunstancias nuevas [9], y se desarrollan mejor utilizando una muestra representativa de la población en la que se aplicarán.

Una medición constantemente deficiente afectará la precisión, ya que agrega ruido. Una medición incoherentemente deficiente afectará el poder predictivo, porque puede cambiar la relación entre el factor de riesgo y el resultado.

Los modelos de predicción pueden no ser generalizables a poblaciones que difieren de aquella en la que se desarrollaron porque en una nueva población la correlación entre factores causales predictivos y verdaderos puede ser diferente. Por ejemplo, el modelo de Framingham a menudo tiene que calibrarse para predecir correctamente el riesgo absoluto de cardiopatía en nuevas poblaciones [10].

Si bien las tendencias de la gripe de Google ya no brindan estimaciones; se volvió impreciso, posiblemente porque el modelo necesitaba una recalibración dinámica de la relación entre los términos de búsqueda y la influenza para mantenerse en el camino correcto [9].

Los "factores de riesgo" que predicen un estado de salud no son necesariamente objetivos de la intervención

Los modelos de predicción probados son inmensamente valiosos para identificar poblaciones objetivo, es decir, personas o grupos que necesitan prevención o tratamiento, pero los "factores de riesgo" que predicen un estado de salud no son necesariamente objetivos de la intervención. Por ejemplo, los síntomas de la gripe no causan influenza y no son objetivos de intervención para prevenir la aparición de la gripe.

Si los "factores de riesgo" que predicen las condiciones de salud en los modelos de estratificación del riesgo también son objetivos de la intervención deben establecerse a partir de diferentes estudios diseñados para evaluar los efectos de las intervenciones. Como tal, no es apropiado calcular un riesgo atribuible a la población o una proporción de "factores de riesgo" a partir de un modelo de predicción de riesgos, porque la eliminación de estos "factores de riesgo" podría o no afectar la salud de la población.

De manera similar, el propósito de los modelos predictivos es explicar la mayor cantidad de varianza en el resultado, por lo que solo se deben incluir los factores que contribuyen a explicar la varianza. Los conceptos de confusión, mediación y modificación de la medida del efecto no son aplicables a los modelos predictivos. Los términos de interacción se pueden agregar a los modelos predictivos para mejorar el ajuste del modelo, pero estas interacciones no deben interpretarse como indicadores de diferentes efectos por subgrupo.

Modelos explicativos

Los estudios que evalúan la causalidad son más explicativos que predictivos

Los modelos explicativos pueden considerarse modelos simplificados, abstractos y proposicionales de algún aspecto particular de cómo funciona el mundo, que proporcionan una guía sobre cómo manipular elementos de interés. Como tal, los modelos explicativos se basan en factores potencialmente causales, es decir, factores cuya manipulación cambia el resultado [11].

Los estudios que evalúan la causalidad son más explicativos que predictivos. Los modelos explicativos están diseñados para evaluar si un "factor de riesgo" particular explica la ocurrencia, o el curso, de la enfermedad y, como tal, es un objetivo válido de intervención. Los "factores de riesgo" seleccionados como posibles factores causales podrían basarse en "factores de riesgo" de los modelos predictivos, podrían basarse teóricamente o podrían formularse hipótesis a partir de otras fuentes.

Por ejemplo, el puntaje de Framingham incluye factores como fumar y la presión arterial, que indudablemente causan enfermedades cardíacas, pero también otros "factores de riesgo" como la edad, el sexo y las lipoproteínas de alta densidad, cuyo papel causal en la enfermedad cardíaca es menos claro [12].

Por el contrario, los factores que no predicen la enfermedad podrían identificarse como posibles factores causales basados en la fisiología o las teorías bien establecidas. Por ejemplo, observacionalmente la longitud de los telómeros no parece predecir el cáncer de células renales, pero las personas con telómeros genéticamente más largos tienen un mayor riesgo [13], lo que sugiere un papel causal en el cáncer de células renales, como en otros cánceres [14].

Los estudios que evalúan el papel de los factores causales deben evitar las principales fuentes de sesgo en los estudios observacionales diseñados para evaluar la causalidad, que pueden considerarse simplemente como un sesgo de confusión y selección [15, 16]. Además, a menudo se piensa que el error de medición es una fuente adicional de sesgo, aunque el error de medición no diferencial suele sesgarse hacia el nulo y el error de medición diferencial puede considerarse una forma de sesgo de selección.

Fumar causa tanto dedos amarillos como cáncer de pulmón, los dedos amarillos podrían predecir pero no explicar el cáncer pulmonar

La confusión se produce cuando se omiten las causas comunes externas de la causa putativa y la condición de salud, de modo que se observa una relación espuria. Por ejemplo, fumar causa tanto dedos amarillos como cáncer de pulmón, por lo que cualquier evaluación del efecto causal de los dedos amarillos sobre el cáncer de pulmón debería tener en cuenta el tabaquismo. La confusión es difícil de evitar a menos que se conozcan todas las causas comunes de la causa y la enfermedad putativas.

Una de las opciones más simples, cuando los estudios experimentales (ensayos controlados aleatorios) no son posibles, es utilizar métodos, como la aleatorización mendeliana, que son menos abiertos a la confusión [17]. Ningún método es una suposición libre, y la aleatorización mendeliana tiene suposiciones rigurosas, sin embargo, ha aclarado algunas controversias sobre las causas de la enfermedad cardiovascular, como el papel de la lipoproteína-colesterol de alta densidad [18].

Es necesario identificar un conjunto suficiente de factores de confusión a partir del conocimiento externo de la causalidad, medidos con precisión en el estudio e incluidos en el modelo analítico, de modo que cualquier confusión residual no cause una inferencia causal incorrecta. Dado que la dificultad de evaluar los factores de confusión conocidos y desconocidos, demostrar que las estimaciones para otras asociaciones sujetas a la misma confusión son coherentes con los efectos causales conocidos da mayor credibilidad a las nuevas estimaciones del mismo estudio [19, 20].

Un factor de riesgo o predictor identifica a las personas en riesgo de enfermedad, pero no identifica necesariamente los objetivos de la intervención

Por ejemplo, los estudios observacionales de la terapia de reemplazo hormonal (TRH) en mujeres encontraron beneficios aparentes para los accidentes y las enfermedades cardiovasculares [21], lo que sugiere una confusión residual para las enfermedades cardiovasculares porque no se esperaría que la TRH proteja fisiológicamente contra los accidentes.

Los hallazgos aparentemente protectores tampoco fueron coherentes con los estrógenos que no tienen beneficio para los hombres en el ensayo del proyecto de fármacos coronarios [22] y posiblemente causan infarto de miocardio en mujeres jóvenes [23]. No obstante, la confusión puede, potencialmente, abordarse en un estudio observacional mediante la recopilación de suficiente información relevante sobre los participantes del estudio, de modo que toda la confusión se justifique por ajuste, probabilidad inversa de ponderación del tratamiento o estandarización.

La confusión es un concepto causal y no relevante para los modelos predictivos [24]. La confusión no se puede evaluar de manera confiable a partir de datos de observación; lo que significa que probar los factores de confusión para su inclusión en un modelo analítico basado en correlaciones estadísticas o cambios en las estimaciones no es válido. Por el contrario, los factores que no son factores de confusión no deberían incluirse en el modelo analítico porque pueden evitar la evaluación del efecto completo de la causa hipotética en cuestión.

Por ejemplo, un estudio observacional diseñado para evaluar el efecto del alcohol en el accidente cerebrovascular no debe incluir la presión arterial en el modelo como un factor de confusión. La presión arterial puede causar un accidente cerebrovascular, pero es más probable que sea una consecuencia del consumo de alcohol que una causa del consumo de alcohol, por lo que la presión arterial probablemente sea un mediador y no un factor de confusión. Como tal, ajustar el modelo de presión arterial no daría el efecto completo del alcohol en el accidente cerebrovascular.

Los estudios diseñados para evaluar el papel de los factores causales potenciales solo deberían presentar la estimación del efecto para la causa hipotética en cuestión, porque es improbable que las estimaciones de otros factores en el modelo sean controladas correctamente por factores de confusión (a veces denominada "falacia de la Tabla 2"). ) [25].

Sin embargo, puede ser útil presentar modelos que se ajusten para diferentes conjuntos de factores de confusión debido a la dificultad de identificar inequívocamente los factores de confusión. Además, la presentación de las estimaciones brutas y ajustadas para la causa hipotética puede dilucidar la medida en que la estimación del efecto está influenciada por los factores de confusión hipotéticos.

El sesgo de selección ocurre cuando la muestra se construye inadvertidamente de manera tal que genera una relación espuria, la mayoría de las veces selección inadvertida sobre los efectos comunes de la causa hipotética y el resultado [24], por lo que a veces se describe como "sesgo del colisionador".

Por ejemplo, un estudio que evalúe la relación del tabaquismo con el cáncer de pulmón en personas muy mayores puede no encontrar relación porque la muestra es, por definición, solo aquellos que han sobrevivido a su hábito de fumar; es decir, depende del hábito de fumar y no contraer cáncer de pulmón [26]. El sesgo de selección es difícil de detectar porque puede requerir conceptualizar la relación de la exposición causal hipotética con la enfermedad en la muestra ausente del estudio.

Por ejemplo, un estudio que evalúe la relación entre la obesidad y la muerte en personas con diabetes [27] no dará una estimación causal válida a menos que tenga en cuenta la relación entre la obesidad y la muerte en personas con diabetes ausentes del estudio debido a enfermedad o muerte anterior.

De manera similar, un vínculo espurio entre la causa potencial y la enfermedad puede surgir de la medición que depende de la causa y la enfermedad potenciales. La recuperación del sesgo de selección solo es posible en ciertas circunstancias, por ejemplo, cuando hay datos externos disponibles, pero no se puede garantizar [16].

Los "factores de riesgo" biomédicos en modelos explicativos son potencialmente causales, es decir, manipular el "factor de riesgo" cambia el resultado, y como todos los factores causales, en la experiencia cotidiana, se esperaría que fueran consistentes dentro de su área particular de aplicación, y por lo tanto generalizables (o más precisamente transportable [11, 24]) a otras situaciones. Sin embargo, esta coherencia puede no ser siempre aparente o relevante, porque no todas las partes de un modelo explicativo pueden aplicarse en todas las situaciones.

Por ejemplo, un modelo explicativo para el cáncer de pulmón podría incluir el tabaquismo y el amianto, entre otros factores, pero intentar reducir el cáncer de pulmón mediante la manipulación del tabaquismo no sería eficaz en una población no fumadora. Como tal, se debe considerar cómo aplicar el modelo explicativo para actuar sobre los factores causales relevantes en cualquier población dada [24].

Es apropiado calcular los riesgos atribuibles a la población o las proporciones de los factores explicativos, ya que estos son factores causales cuya manipulación podría afectar la salud de la población. Sin embargo, los riesgos o proporciones atribuibles nos dicen qué proporción del resultado no se habría producido si la exposición hubiera estado ausente, pero no garantiza que sea el efecto de eliminar la exposición.


Síntesis

La predicción y la explicación requieren diferentes enfoques

Predecir y explicar el riesgo de las condiciones de salud están respondiendo dos preguntas fundamentalmente diferentes con enfoques e implicaciones completamente diferentes. En este contexto, los investigadores deben identificar la intención o el propósito de su estudio, como identificar quién está en riesgo (estratificación de riesgo) o qué sería una intervención efectiva (explicación), para garantizar que las preguntas de investigación se aborden de manera adecuada y efectiva.

Algunos "factores de riesgo" pueden ser tanto predictores como factores explicativos, al mismo tiempo, lo que puede llevar a una combinación de estos términos en la comunidad investigadora.

Por ejemplo, la presión arterial es tanto un predictor como una causa de enfermedad cardiovascular. Sin embargo, los estudios en los que la presión arterial se consideraba como un predictor de riesgo tendrían un propósito diferente, una pregunta de investigación y un enfoque de los estudios en los que se consideraba la presión arterial como un factor explicativo.

La predicción y la explicación generalmente requieren diferentes enfoques en términos de conceptualización, modelado, análisis, validación, presentación, interpretación, generalización y atribución de riesgos.

  • Los estudios de predicción de riesgos utilizan técnicas estadísticas para generar modelos contextualmente específicos basados en datos que requieren un representante muestra que identifica a las personas en riesgo de enfermedad de manera eficiente, pero no identifica necesariamente los objetivos de la intervención.
     
  • Los estudios explicativos, idealmente integrados en un modelo explicativo de la realidad, evalúan los factores causales que pueden ser objetivos de la intervención.
     
  • Los modelos predictivos permiten a los profesionales de la salud pública identificar poblaciones con un riesgo elevado de enfermedad para permitir la focalización de intervenciones probadas en factores causales.
     
  • Los modelos explicativos permiten que los profesionales de la salud pública identifiquen los factores causales que se dirigen a las poblaciones para prevenir la enfermedad.

Conclusiones

  • La distinción explícita entre los diferentes propósitos de los estudios biomédicos observacionales y la coincidencia explícita del enfoque, la interpretación y la redacción con la intención del investigador permitirá un uso más centrado y productivo de los recursos de investigación.
     
  • Evitar el término impreciso "factor de riesgo" y usar una palabra, como "predictor", en los estudios de estratificación de riesgo y factor "explicativo" en los estudios causales podría aportar claridad de pensamiento y, por lo tanto, reducir suposiciones injustificadas en la investigación biomédica.
 

Comentarios

Usted debe ingresar al sitio con su cuenta de usuario IntraMed para ver los comentarios de sus colegas o para expresar su opinión. Si ya tiene una cuenta IntraMed o desea registrase, ingrese aquí