modelos de regresión de peligros aditivos: una aplicación a la Historia Natural del virus del papiloma humano

resumen

Existen varios métodos estadísticos para el análisis del tiempo hasta el evento, entre los cuales se encuentra el modelo de riesgos proporcionales de Cox que se usa más comúnmente. Sin embargo, cuando el cambio absoluto en el riesgo, en lugar de la razón de riesgo, es de interés primario o cuando se viola la hipótesis de riesgo proporcional para el modelo de riesgos proporcionales de Cox, un modelo de regresión de riesgo aditivo puede ser más apropiado., En este artículo, damos una visión general de este enfoque y luego aplicamos un modelo aditivo semiparamétrico y no paramétrico a un conjunto de datos de un estudio de la historia natural del virus del papiloma humano (VPH) en mujeres VIH positivas y VIH negativas., Los resultados del modelo semiparamétrico indicaron en promedio 14 infecciones oncogénicas por VPH por 100 mujeres-año relacionadas con el recuento de CD4 < 200 en relación con las mujeres VIH negativas, y los del modelo aditivo no paramétrico mostraron 40 infecciones oncogénicas por VPH por 100 mujeres durante 5 años de seguimiento, mientras que la razón de riesgos estimada en el modelo de Cox fue de 3,82. Aunque el modelo de Cox puede proporcionar una mejor comprensión de la Asociación de la enfermedad de exposición, el modelo aditivo es a menudo más útil para la planificación e intervención de salud pública.

1., Introducción

el análisis del tiempo hasta el evento se utiliza comúnmente para estudiar los factores de riesgo asociados a la incidencia de eventos clínicos . Por ejemplo, el tiempo hasta el desarrollo de la enfermedad, el tiempo hasta la hospitalización, el tiempo hasta la recaída/recidiva y el tiempo hasta la muerte se utilizan con frecuencia como criterios de valoración. Sin embargo, hay varios modelos diferentes para medir la relación de los datos del tiempo hasta el evento con los factores de riesgo, incluidos los modelos paramétricos, semiparamétricos y no paramétricos. En los modelos paramétricos, se asume una distribución para el tiempo hasta el evento (p. ej.,, una distribución exponencial, gamma o Weibull), y se asume además que hay una relación lineal entre el logaritmo del tiempo al evento y las covariables en el modelo. La fuerza de asociación se estima entonces utilizando el enfoque de máxima verosimilitud. En los modelos semiparamétricos, en particular los modelos de regresión de riesgo proporcional de Cox, se supone que la función de riesgo está relacionada multiplicativamente con las covariables, con una función de riesgo basal no especificada, y se utiliza el método de máxima verosimilitud parcial para estimar los parámetros., En los modelos no paramétricos, en particular el enfoque de Kaplan-Meier, no se hacen suposiciones con respecto a la relación entre el riesgo de enfermedad y las covariables. En cambio, la función de supervivencia para cada estrato de las covariables se estima con métodos empíricos, y la prueba de rango logarítmico y otras pruebas no paramétricas se utilizan típicamente para probar los efectos de estas covariables.

un método bien conocido pero menos utilizado para analizar los datos del tiempo hasta el evento es un modelo de regresión de riesgo aditivo ., A diferencia del modelo de riesgos proporcionales que estima las razones de riesgo, un modelo aditivo estima la diferencia en los riesgos: el cambio en la función de riesgo debido a la exposición de interés o indica más simplemente la diferencia absoluta en la tasa de fallo instantáneo por unidad de cambio en la variable de exposición. Sobre la base de la estimación de la diferencia en los peligros, se puede estimar aún más el cambio en la incidencia acumulada: cuando el peligro acumulado es pequeño (e. g.,, eventos raros), el cambio en el peligro acumulado se aproxima a la diferencia en el riesgo de enfermedad debido a la exposición, es decir, el riesgo atribuible debido a la exposición. Por lo tanto, cuando el riesgo atribuible es de interés primario o se viola la hipótesis de riesgo proporcional, un modelo de regresión de riesgo aditivo puede ser más apropiado. Desde que el modelo aditivo no paramétrico fue propuesto originalmente por Aalen, ha habido extensas investigaciones sobre el tema ., Sin embargo, los modelos de regresión de peligros aditivos siguen siendo subutilizados en la salud pública y la investigación médica principalmente debido a la falta de familiaridad con los modelos y la falta de conocimiento sobre cómo implementar los modelos utilizando el software existente. En este trabajo, proporcionamos un ejemplo para ilustrar la aplicación de dos modelos aditivos utilizando software estadístico existente (se proporcionan códigos de programa).

el ejemplo motivador de este artículo fue un estudio de la historia natural de la infección por el virus del papiloma humano (VPH) entre mujeres VIH positivas y VIH negativas., El análisis previo de este conjunto de datos utilizó el modelo de riesgo proporcional de Cox para evaluar la relación de la detección del VPH incidente con el estado inmune del huésped medido por el estado serológico del VIH y el recuento de CD4 . En este trabajo, analizamos una versión actualizada de este mismo conjunto de datos con cuatro años de seguimiento adicional, utilizando modelos de regresión de peligros aditivos para estimar el riesgo atribuible de infección por VPH relacionado con cambios en el estado inmune y luego contrastamos estos resultados con los resultados utilizando el modelo de Cox.

2. Métodos

2.1., Datos

los datos se obtuvieron del Women’s Interagency HIV Study (WIHS), un gran estudio observacional multiinstitucional en curso con visitas de seguimiento clínico semestrales que incluyen la recolección de células cervicales exfoliadas para la prueba de ADN del VPH y la prueba de Papanicolaou. Había 3.766 mujeres (2.791 seropositivas, 975 seropositivas−; dos tercios de ellas se matricularon en 1994-95 y el resto en 2001-02. Los detalles de la inscripción en el estudio y los métodos se han informado previamente ., Después de excluir a aquellas mujeres que tuvieron seroconversión del VIH durante el seguimiento, que se sometieron a una histerectomía antes de inscribirse en WIHS, que carecían de datos sobre el VPH durante el seguimiento o que dieron positivo para el VPH oncogénico al inicio, el número de mujeres disponibles para el análisis actual de la detección de incidentes de VPH oncogénico fue de 2.386 (1.672 VIH+, 714 VIH−). Los tipos oncogénicos de VPH incluyen HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, y 68., También estudiamos la detección incidental de cualquier VPH en la que se excluyó a más mujeres por ser detectadas positivas para cualquier tipo de VPH al inicio; el número correspondiente de mujeres fue de 1.733 (1.116 VIH+, 617 VIH−). Este conjunto de datos representa una actualización de 8 visitas adicionales (4 años adicionales de seguimiento).

la detección del tiempo hasta el incidente del VPH se estimó utilizando el intervalo medio entre la última visita negativa al VPH y la primera visita positiva al VPH. La detección del tiempo hasta el incidente del VPH oncogénico o de cualquier VPH se analizó por separado., La variable principal de exposición fue el estado inmune del huésped caracterizado por el estado del VIH y el recuento de CD4: VIH negativo, VIH positivo con un recuento de CD4 mayor de 500, recuento de CD4 entre 200 y 500 y recuento de CD4 menor de 200. Las covariables adicionales incluyeron la edad (<30, 30-34, 35-39, 40-44, ≥45 años), raza (blanco, negro, Hispano, otro), tabaquismo (nunca, ex, actual), y el número de pareja sexual masculina en los últimos 6 meses (0, 1, 2, ≥3).

2.2. Métodos estadísticos

Se consideraron dos modelos de riesgo aditivo., El primer modelo fue el modelo de riesgo aditivo semiparamétrico donde es la tasa de riesgo condicional de un sujeto dado con la covariable es el número de las covariables, es la función de riesgo basal desconocida y son los coeficientes independientes del tiempo desconocidos. En este estudio, solo consideramos las covariables independientes del tiempo, todas al inicio del estudio. Se han estudiado formas más generales del modelo (1) con covariables dependientes del tiempo , que mostraron que las estimaciones de y son consistentes y asintóticamente normales., Tenga en cuenta que el modelo (1) tiene una forma similar al modelo de regresión de riesgo proporcional de Cox: ambos modelos tienen una función de riesgo basal no especificada y coeficientes independientes del tiempo, aunque el modelo de Cox se define en una escala multiplicativa, mientras que el modelo de riesgo aditivo se define en una escala aditiva. A diferencia del modelo de regresión de riesgo proporcional de Cox que requiere iteraciones numéricas para estimar los parámetros de regresión, el modelo de regresión de riesgo aditivo semiparamétrico mencionado anteriormente tiene una solución de forma cerrada para estimar los parámetros de regresión., Podemos estimar el cambio absoluto en el riesgo en lugar del cambio relativo en el riesgo con el modelo (1). Se utilizó el código SAS in para ajustar el modelo, que produce la estimación, su error estándar y la matriz de varianza-covarianza. Los valores se calcularon bajo suposición normal. Se escribió código SAS adicional para calcular la estimación del peligro basal acumulado y sus errores estándar basados en . Las estimaciones de la función de riesgo acumulativo se calcularon sobre la base del modelo (1). Se evaluó el residuo de Cox-Snell para cada sujeto en su tiempo de supervivencia observado., Específicamente, para un sujeto con tiempo de supervivencia observado, indicador de eventos y covariable, el residual se estima por . Si el modelo (1) es correcto, el ‘S debe seguir una distribución exponencial unitaria con censura correcta . Debido a que la distribución exponencial de la unidad tiene la propiedad de que su función de riesgo acumulativo es la función de identidad, se puede usar esta propiedad para verificar la bondad de ajuste para el modelo aditivo. Por lo tanto, calculamos las estimaciones de Nelson-Aalen de los riesgos acumulativos en los datos para todos los sujetos., En SAS, esto se puede obtener utilizando proc phreg con la instrucción baseline y la opción method=ch en la instrucción (el código se proporciona en los materiales en línea). Se generó la gráfica de los peligros acumulados estimados en los residuos versus los residuos, en la cual se espera una línea cercana a los 45 grados si el modelo (1) es verdadero.

el modelo (1) asume que el efecto de la covariable es constante en la función de peligro, pero de hecho puede generalizarse a cualquier forma paramétrica conocida que posiblemente dependa del tiempo., También consideramos un modelo de riesgo aditivo más general que permite que los coeficientes de la covariable sean dependientes del tiempo y no paramétricos, donde . A diferencia del modelo (1), el nuevo modelo no asume la forma de . Se estudió la teoría asintótica de este modelo . Se utilizó una macro SAS proporcionada para ajustar el modelo, que da las estimaciones de y sus estimaciones de error estándar. Las estimaciones de cantidades tienen soluciones de forma cerrada., es el peligro acumulativo de referencia y son los peligros acumulativos excesivos en el tiempo, que se definen desde el tiempo 0 hasta el tiempo máximo en el que la matriz de diseño basada en las covariables y los tiempos observados es de Rango completo . If es un indicador (0/1) para algunos , , la estimación de da la estimación de riesgo acumulativo adicional en el momento de estar en el grupo mientras se ajusta para las otras covariables. El modelo de riesgo aditivo no paramétrico se ajustó para las mismas covariables que en el modelo de riesgo aditivo semiparamétrico., Se generó una gráfica residual de Cox-Snell Similar a la del modelo semiparamétrico, con la diferencia de que todos los residuos del modelo aditivo no paramétrico fueron censurados en el tiempo máximo .

los modelos tradicionales de riesgo proporcional de Cox para la detección de incidentes de oncogénico y cualquier VPH, incorporando las mismas covariables mencionadas anteriormente, se ejecutaron para la comparación con los modelos aditivos. Todos los análisis estadísticos se realizaron con SAS 9.1.3 y las parcelas se generaron con R 2.9.2. El código de la computadora se puede descargar en https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.

3., Resultados

El modelo de riesgo proporcional de Cox para la detección de incidentes de VPH oncogénico mostró que las mujeres VIH positivas con CD4 > 500 tenían un hazard ratio (HR) 1,62 con un intervalo de confianza (IC) del 95% de 1,31 a 2,00 en relación con las mujeres VIH negativas. El Cr y el IC del 95% que compararon a mujeres VIH positivas con CD4 200-500 y CD4 < 200, utilizando a mujeres VIH negativas como grupo de referencia, fueron 2,49 (IC: 2,04-3,03) y 3,82 (IC: 3,01-4,86), respectivamente., La tendencia for se calculó tratando el grupo VIH / CD4 como una variable ordinal con cuatro niveles (0 a 3) y fue altamente significativa (). Además, la edad se asoció negativamente y el tabaquismo se asoció positivamente con la detección incidental de VPH oncogénico. En los modelos de detección de incidentes de cualquier VPH, el HRs y el IC del 95% para mujeres VIH positivas con CD4 > 500, CD4 200-500 y CD4 < 200 fueron 1,65 (IC: 1,39-1,96), 2,76 (IC: 2,33–3,27), y 3,40 (IC: 2,66–4,34), respectivamente. La tendencia de for fue inferior a 0,0001., Se encontraron factores significativos similares a los del incidente del VPH oncogénico con los hallazgos adicionales de que las mujeres afroamericanas tenían una incidencia más alta de cualquier VPH que las mujeres caucásicas, y el número de parejas sexuales masculinas en los últimos 6 meses se asoció positivamente con la detección del incidente de cualquier VPH.

estas razones de riesgo, sin embargo, no abordaron el número absoluto de nuevas infecciones por VPH que se detectarían con una disminución en el recuento de CD4., Además, la comprobación del supuesto de proporcionalidad para los modelos de Cox muestra que la proporcionalidad de la función de riesgo no se mantuvo para el VIH positivo con CD4 < 200 en el análisis oncogénico del VPH () y para el número de parejas sexuales masculinas en los últimos 6 meses ≥3 en cualquier análisis del VPH (). Por estas razones, aplicamos los modelos de regresión de peligros aditivos a este conjunto de datos.

se ajustó el modelo semiparamétrico de riesgo aditivo para VPH oncogénico y los resultados se presentan en la tabla 1., Las mujeres VIH positivas con CD4 > 500 tuvieron un riesgo adicional de 0.03 que las mujeres VIH negativas, lo que implica que en promedio hubo 3 casos adicionales de infección oncogénica por VPH por 100 mujeres VIH positivas por año con CD4 > 500 en comparación con las mujeres VIH negativas; las mujeres VIH positivas con CD4 200-500 tuvieron un aumento de riesgo 0,08; mujeres VIH positivas con CD4 < 200 tuvieron un aumento de riesgo 0,14., Todos los aumentos relativos a las mujeres VIH negativas fueron estadísticamente significativos (), y la tendencia creciente con respecto al grupo VIH/CD4 fue significativa con un valor < 0,0001. Los efectos de la edad, la raza, el tabaquismo y el número de parejas sexuales masculinas en los últimos 6 meses coincidieron con los del modelo de Cox correspondiente.

Las probabilidades estimadas de supervivencia para los cuatro estratos VIH/CD4 ajustadas para otras covariables del modelo aditivo semiparamétrico se presentan en la Figura 1 (a). Muestra que un recuento más bajo de CD4 se asoció con una mayor detección de VPH oncogénico.,/p>


(a)

(b)


(a)
(b)

Figure 1

Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., De arriba a abajo para cada resultado y cada ajuste del modelo: VIH -, CD4 > 500, CD4: 200-500, y CD4 < 200.

el modelo de riesgo aditivo no paramétrico también se ajustó a los datos. Las variables del modelo de regresión de riesgo aditivo no paramétrico tuvieron significación estadística similar a las del modelo aditivo semiparamétrico y también a las del modelo de regresión de riesgo proporcional de Cox con las mismas covariables., La figura 1(a) Muestra las estimaciones de las probabilidades de supervivencia del VPH oncogénico para los cuatro grupos de VIH/CD4: , , , para mujeres VIH negativas, mujeres VIH positivas con CD4 > 500, CD4 200-500 y CD4 < 200, respectivamente, ajustadas para otras covariables, donde está el riesgo basal acumulado estimado y es estimación del exceso de peligro acumulado asociado a cada estrato de CD4. La figura 1 (a) muestra que el modelo semiparamétrico (modelo (1)) y los modelos no paramétricos (modelo (2)) en general dieron estimaciones similares sobre las funciones de riesgos acumulativos., En particular, las distancias entre las curvas son similares, lo que indica que estos dos modelos dieron estimaciones cercanas del efecto CD4.

en este análisis basado en el modelo (2), la probabilidad estimada de supervivencia de VPH oncogénico durante 5 años de seguimiento entre mujeres VIH negativas con una edad < 30, de raza caucásica, que no fumaban y tenían solo una pareja sexual masculina en los últimos 6 meses, fue de 0,80., La incidencia acumulada correspondiente fue , lo que implica que durante 5 años de seguimiento el 20% de las mujeres VIH negativas con las características mencionadas anteriormente tuvieron al menos una prueba positiva para VPH oncogénico; las tasas de incidencia acumulada a 5 años de seguimiento fueron 0.33, 0.47 y 0.60 Para CD4 > 500, CD4 200-500 y CD4 < 200 grupos, respectivamente., Así, por cada 100 mujeres con CD4 < 200, hubo 40 más infecciones oncogénicas por VPH en el año 5 en comparación con cada 100 mujeres VIH negativas, lo que representa un aumento significativo en el número de infecciones. Tanto los modelos semiparamétricos como los no paramétricos de riesgo aditivo se ajustan bien a los datos basados en las gráficas residuales de Cox-Snell( Figura 2): las curvas de riesgo acumulativo estimadas siguen aproximadamente las líneas de 45 grados.

se realizaron los mismos análisis para cualquier VPH (Tabla 1)., Las estimaciones de efectos para mujeres VIH positivas con CD4 > 500, CD4 200-500, CD4 < 200 fueron 0.09, 0.23, 0.30, respectivamente, con valores menores que 0.0001 ( para tendencia < 0,0001). A partir del modelo aditivo no paramétrico (Figura 1(b)), La diferencia en la supervivencia de cualquier VPH entre el grupo CD4 200-500 y CD4 < 200 no fue tan significativa como la supervivencia del VPH oncogénico. Las incidencias acumuladas de cualquier VPH a los 5 años fueron de 0,40, 0,63, 0,77, 0.,84 para mujeres VIH negativas, mujeres VIH positivas con CD4 >500, CD4 200-500, CD4 < 200, respectivamente. Los modelos de riesgo aditivo para cualquier VPH también se ajustan bien a los datos (Figura 3).

4. Conclusión

Este estudio aplicó dos tipos de modelos de regresión de riesgos aditivos: los modelos de regresión de riesgos aditivos semiparamétricos y no paramétricos y un modelo de riesgo proporcional de Cox para el análisis de los datos de detección de la incidencia de VPH en mujeres VIH positivas y VIH negativas y contrastó las estimaciones de efectos obtenidas mediante cada abordaje estadístico., Todos los modelos encontraron asociaciones altamente significativas entre el estado inmune del huésped y el riesgo de detección del VPH incidente. El modelo aditivo semiparamétrico mostró que, en promedio, hubo 14 casos adicionales de infección oncogénica por VPH por cada 100 mujeres-año relacionados con el recuento de CD4 < 200 en relación con las mujeres VIH negativas; y el modelo no paramétrico mostró 40 infecciones oncogénicas por VPH por cada 100 mujeres después de 5 años de seguimiento.,

mientras que, como era de esperar, los modelos aditivos tenían estimaciones de efectos mucho más bajas que el modelo de Cox, los dos enfoques abordan cuestiones diferentes; es decir, el modelo de Cox proporciona estimaciones del peligro relativo (en una escala multiplicativa), mientras que los modelos de peligros aditivos proporcionan estimaciones aproximadas para el riesgo atribuible (es decir, la diferencia absoluta en la tasa de eventos por unidad de cambio en la variable de exposición) bajo el supuesto de eventos raros., El riesgo atribuible puede ser utilizado para determinar el aumento absoluto en el número de casos, es decir, el número de casos adicionales de infección por VPH que ocurrieron debido a la exposición de interés. Los peligros relativos estimados por los modelos de Cox pueden ser especialmente útiles para comprender la magnitud de la asociación, que puede ser importante científicamente; es decir, cuando el peligro basal de la enfermedad es bajo, el número absoluto de casos adicionales relacionados con la exposición puede ser pequeño, pero el riesgo relativo aún puede ser fuerte., Sin embargo, el riesgo absoluto puede ser especialmente útil para la planificación de la salud pública y la intervención, cuando el número real de casos adicionales de una enfermedad es de interés.

se consideraron modelos de riesgo aditivo semiparamétrico y no paramétrico. En comparación con el modelo semiparamétrico de regresión de riesgos aditivos, el modelo no paramétrico de riesgos aditivos permite que los efectos covariables varíen con el tiempo de forma no paramétrica y, por lo tanto, proporciona una estimación más sólida de la función de riesgos acumulativos que el modelo semiparamétrico de riesgos aditivos., Sin embargo, los modelos no paramétricos también utilizan más grados estadísticos de libertad. Por lo tanto, si las estimaciones efectivas promedio de covariables son de interés primario, se podría usar el modelo de riesgo aditivo semiparamétrico, pero si se desea examinar si algunos efectos covariables varían con el tiempo o si la función de riesgo acumulado (o la tasa de incidencia acumulada) es de interés primario, se puede preferir el modelo de riesgo aditivo no paramétrico.

observamos que el modelo propuesto por Lin y Ying se ha ampliado para incluir efectos covariables aditivos y multiplicativos ., Este modelo puede ser necesario, por ejemplo, cuando ciertas covariables en un modelo de riesgos proporcionales de Cox satisfacen la suposición de riesgos proporcionales y otras no. Sin embargo, la interpretación de este modelo no es tan sencilla como el modelo de Cox o los modelos aditivos.

En resumen, aunque la base teórica para los modelos de riesgo aditivo está bien establecida y los códigos informáticos para la adaptación de estos modelos están disponibles, se han utilizado con menos frecuencia que otros métodos de análisis del tiempo hasta el evento., Esto puede reflejar en parte un cierto grado de desconocimiento de estos modelos en la comunidad investigadora en general. Los bioestadísticos y epidemiólogos que participen en la enseñanza de la próxima generación de investigadores deben seguir esforzándose por aumentar el conocimiento de estos métodos estadísticos.

agradecimientos

Este trabajo fue apoyado parcialmente por las subvenciones 5R01CA085178, 1r21ca139388 del NCI y una subvención de Lupus Foundation of America., Los datos de este artículo fueron recolectados por el Women’s Interagency HIV Study (WIHS); Collaborative Study Group with centers (principal investigators) at New York City/Bronx Consortium (Kathryn Anastos); Brooklyn, NY (Howard Minkoff); Washington DC Metropolitan Consortium (Mary Young); The Connie Wofsy Study Consortium of Northern California (Ruth Greenblatt); Los Angeles County/Southern California Consortium (Alexandra Levine); Chicago Consortium (Mardge Cohen); Data Coordinating Center (Stephen Gange)., El WIHS está financiado por el Instituto Nacional de alergias y Enfermedades Infecciosas (Uo1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993 y UO1-AI-42590) y por el Instituto Nacional de Salud Infantil y Desarrollo Humano Eunice Kennedy Shriver (Uo1-HD-32632). El estudio es cofinanciado por el Instituto Nacional del cáncer, El Instituto Nacional sobre el abuso de drogas y el Instituto Nacional de sordera y otros trastornos de la comunicación. El financiamiento también es proporcionado por el Centro Nacional de recursos de investigación (UCSF-CTSI Grant no. UL1 RR024131)., El contenido de esta publicación es responsabilidad exclusiva de los autores y no representa necesariamente las opiniones oficiales de los Institutos Nacionales de la salud. El apoyo adicional fue proporcionado por el Centro Einstein-Montefiore para la investigación del SIDA (P30-AI-51519), el Instituto de Investigación Clínica y traslacional (UL1RR025750) y el Centro Oncológico Albert Einstein.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir a la barra de herramientas