Additive Hazard Regression Models: An Application to the Natural History of Human Papillomavirus (Italiano)

Abstract

Esistono diversi metodi statistici per l’analisi time-to-event, tra cui il modello Cox proportional hazards più comunemente utilizzato. Tuttavia, quando la variazione assoluta del rischio, invece del rapporto di rischio, è di interesse primario o quando viene violata l’ipotesi di pericolo proporzionale per il modello di rischi proporzionali di Cox, un modello di regressione del pericolo additivo può essere più appropriato., In questo articolo, diamo una panoramica di questo approccio e quindi applichiamo un modello additivo semiparametrico e non parametrico a un set di dati da uno studio della storia naturale del papillomavirus umano (HPV) in donne HIV-positive e HIV-negative., I risultati del modello semiparametrico hanno indicato in media ulteriori 14 infezioni oncogene da HPV per 100 donne-anno correlate alla conta CD4 < 200 rispetto alle donne HIV-negative, e quelli del modello additivo non parametrico hanno mostrato ulteriori 40 infezioni oncogene da HPV per 100 donne oltre 5 anni di follow-up, mentre l’hazard ratio stimato nel modello Cox è stato di 3,82. Sebbene il modello Cox possa fornire una migliore comprensione dell’associazione di malattie da esposizione, il modello additivo è spesso più utile per la pianificazione e l’intervento della salute pubblica.

1., Introduzione

L’analisi time-to-event è comunemente usata per studiare i fattori di rischio associati all’incidenza degli eventi clinici . Ad esempio, lo sviluppo di time-to-disease, il time-to-ospedalizzazione, il time-to-relapse/recidive e il time-to-death sono frequentemente utilizzati come endpoint. Tuttavia, esistono diversi modelli per misurare la relazione dei dati time-to-event con i fattori di rischio, inclusi modelli parametrici, semiparametrici e non parametrici. Nei modelli parametrici, si assume una distribuzione per il time to event (ad esempio,, una distribuzione esponenziale, gamma o Weibull), e si presume inoltre che esista una relazione lineare tra il logaritmo del tempo all’evento e le covariate nel modello. La forza dell’associazione viene quindi stimata utilizzando l’approccio di massima verosimiglianza. Nei modelli semiparametrici, in particolare nei modelli di regressione proporzionale del rischio di Cox, si presume che la funzione di pericolo sia moltiplicativamente correlata alle covariate, con una funzione di pericolo basale non specificata, e per stimare i parametri viene utilizzato il metodo di massima probabilità parziale., Nei modelli non parametrici, in particolare l’approccio Kaplan-Meier, non vengono fatte ipotesi sulla relazione tra il rischio di malattia e le covariate. Invece, la funzione di sopravvivenza per ogni strato delle covariate è stimata con metodi empirici, e il test log-rank e altri test non parametrici sono tipicamente utilizzati per testare gli effetti di queste covariate.

Un metodo ben noto ma meno utilizzato per analizzare i dati time-to-event è un modello di regressione del pericolo additivo ., A differenza del modello dei pericoli proporzionali che stima i rapporti di pericolo, un modello additivo stima la differenza nei pericoli: la variazione della funzione di pericolo dovuta all’esposizione di interesse o più semplicemente la differenza assoluta nel tasso di fallimento istantaneo per unità di variazione della variabile di esposizione. Sulla base della stima della differenza nei pericoli, si può stimare ulteriormente la variazione dell’incidenza cumulativa: quando il pericolo cumulativo è piccolo (ad es.,, eventi rari), la variazione del rischio cumulativo approssima la differenza nel rischio di malattia dovuta all’esposizione, cioè il rischio attribuibile dovuto all’esposizione. Pertanto, quando il rischio attribuibile è di interesse primario o l’ipotesi di pericolo proporzionale è violata, un modello di regressione del pericolo additivo può essere più appropriato. Poiché il modello additivo non parametrico è stato originariamente proposto da Aalen , ci sono state ampie ricerche sull’argomento ., Tuttavia, i modelli di regressione del rischio additivo rimangono sottoutilizzati nella sanità pubblica e nella ricerca medica principalmente a causa della mancanza di familiarità con i modelli e della mancanza di conoscenza su come implementare i modelli utilizzando il software esistente. In questo articolo, forniamo un esempio per illustrare l’applicazione di due modelli additivi utilizzando software statistici esistenti (sono forniti i codici di programma).

L’esempio motivante di questo articolo è stato uno studio della storia naturale dell’infezione da papillomavirus umano (HPV) tra donne positive e HIV-negative del virus dell’immunodeficienza umana., La precedente analisi di questo set di dati ha utilizzato il modello di rischio proporzionale Cox per valutare la relazione tra il rilevamento dell’HPV incidente e lo stato immunitario dell’ospite misurato dal sierostato dell’HIV e dalla conta dei CD4 . In questo articolo, abbiamo analizzato una versione aggiornata di questo stesso set di dati con quattro anni di follow-up aggiuntivo, utilizzando modelli di regressione dei pericoli additivi per stimare il rischio attribuibile di infezione da HPV correlato a cambiamenti nello stato immunitario e quindi contrastato questi risultati con i risultati utilizzando il modello Cox.

2. Metodi

2.1., Dati

I dati sono stati ottenuti dal Women’s Interagency HIV Study (WIHS), un ampio studio osservazionale multi-istituzionale in corso con visite cliniche di follow-up semestrali che includono la raccolta di cellule cervicali esfoliate per il test del DNA HPV e Pap test. C’erano 3766 donne (2791 HIV+, 975 HIV−); due terzi dei quali sono stati arruolati nel 1994-95 e il resto nel 2001-02. I dettagli dell’iscrizione allo studio e dei metodi sono stati precedentemente riportati ., Dopo aver escluso quelle donne che avevano sieroconversione dell’HIV durante il follow-up, avevano avuto isterectomia prima dell’arruolamento in WIHS, mancavano di dati sull’HPV durante il follow−up o risultavano positive all’HPV oncogeno al basale, il numero di donne disponibili per l’attuale analisi della rilevazione incidente di HPV oncogeno era 2386 (1672 HIV+, 714 HIV -). I tipi oncogeni di HPV inclusi HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, e 68., Abbiamo anche studiato il rilevamento incidente di qualsiasi HPV in cui più donne sono state escluse perché rilevate positive per qualsiasi tipo di HPV al basale; il numero corrispondente di donne era 1733 (1116 HIV+, 617 HIV−). Questo set di dati rappresenta un aggiornamento da con 8 visite aggiuntive (4 ulteriori anni di follow-up).

Il rilevamento del tempo di incidente dell’HPV è stato stimato utilizzando il midintervallo tra l’ultima visita HPV-negativa e la prima visita HPV-positiva. Il rilevamento time-to-incident di oncogenico o di qualsiasi HPV è stato analizzato separatamente., La variabile di esposizione primaria era lo stato immunitario dell’ospite caratterizzato da stato HIV e conteggio CD4: HIV-negativo, HIV-positivo con un conteggio CD4 superiore a 500, conteggio CD4 tra 200 e 500 e conteggio CD4 inferiore a 200. Le covariate aggiuntive includevano l’età (<30, 30-34, 35-39, 40-44, ≥45 anni), razza (bianco, nero, ispanico, altro), il fumo (mai, ex, corrente), e il numero di partner sessuale maschile negli ultimi 6 mesi (0, 1, 2, ≥3).

2.2. Metodi statistici

Sono stati presi in considerazione due modelli di pericolo additivo., Il primo modello è stato il modello di pericolo additivo semiparametrico in cui è il tasso di pericolo condizionale di un dato soggetto con la covariata è il numero delle covariate, è la funzione di pericolo di base sconosciuta ed è i coefficienti indipendenti dal tempo sconosciuti. In questo studio, abbiamo considerato solo le covariate indipendenti dal tempo, tutte al basale. Sono state studiate forme più generali del modello (1) con covariate dipendenti dal tempo , che hanno dimostrato che le stime di e sono coerenti e asintoticamente normali., Si noti che il modello (1) ha una forma simile al modello di regressione proporzionale del pericolo di Cox: entrambi i modelli hanno una funzione di pericolo di base non specificata e coefficienti indipendenti dal tempo, sebbene il modello di Cox sia definito su una scala moltiplicativa mentre il modello di pericolo additivo è definito su una scala additiva. A differenza del modello di regressione proporzionale del rischio di Cox che richiede iterazioni numeriche nella stima dei parametri di regressione, il modello di regressione additiva semiparametrica precedentemente menzionato ha una soluzione di forma chiusa per stimare i parametri di regressione., Siamo in grado di stimare la variazione assoluta del rischio invece della variazione relativa del rischio con il modello (1). Il codice SAS in è stato utilizzato per adattarsi al modello, che produce la stima per, il suo errore standard e la matrice varianza-covarianza. I valori sono stati calcolati in base alle normali ipotesi. Codice SAS aggiuntivo è stato scritto per calcolare la stima del rischio cumulativo di base e dei suoi errori standard basati su . Le stime cumulative della funzione di pericolo sono state stimate sulla base del modello (1). Il residuo di Cox-Snell è stato valutato per ciascun soggetto al tempo di sopravvivenza osservato., In particolare, per un soggetto con tempo di sopravvivenza osservato, indicatore di evento e covariata, il residuo è stimato da . Se il modello (1) è corretto, le ’s dovrebbero seguire una distribuzione esponenziale unitaria con censura corretta . Poiché la distribuzione esponenziale dell’unità ha la proprietà che la sua funzione di pericolo cumulativo è la funzione di identità, è possibile utilizzare questa proprietà per verificare la bontà di adattamento per il modello additivo. Abbiamo quindi calcolato le stime Nelson-Aalen dei rischi cumulativi sui dati per tutti i soggetti., In SAS, questo può essere ottenuto utilizzando proc phreg con baseline statement e method = ch option nell’istruzione (il codice è fornito nei materiali online). È stato generato il grafico dei rischi cumulativi stimati sui residui rispetto ai residui, in cui è prevista una linea vicina ai 45 gradi se il modello (1) è vero.

Il modello (1) presuppone che l’effetto della covariata sia costante sulla funzione di pericolo, ma in realtà può essere generalizzato a qualsiasi forma parametrica nota che sia eventualmente dipendente dal tempo., Abbiamo anche considerato un modello di pericolo additivo più generale che consente ai coefficienti della covariata di essere dipendenti dal tempo e non parametrici, dove . A differenza del modello (1), il nuovo modello non assume la forma di . La teoria asintotica di questo modello è stato studiato in . Una macro SAS fornita in è stata utilizzata per adattarsi al modello, che fornisce le stime e le relative stime di errore standard. Le stime per le quantità hanno soluzioni di forma chiusa., è il pericolo cumulativo di base e sono i pericoli cumulativi in eccesso al momento, che sono definiti dal tempo 0 al tempo massimo in cui la matrice di progettazione basata sulle covariate e sui tempi osservati è piena. Se è un indicatore (0/1) per alcuni , , la stima di fornisce la stima di rischio cumulativo aggiuntivo al momento per essere nel gruppo mentre si adegua per le altre covariate. Il modello di pericolo additivo non parametrico è stato adeguato per le stesse covariate del modello di pericolo additivo semiparametrico., La trama residua di Cox-Snell simile a quella del modello semiparametrico è stata generata con la differenza che tutti i residui per il modello additivo non parametrico sono stati censurati al tempo massimo .

I modelli tradizionali di rischio proporzionale Cox per la rilevazione di incidenti di oncogenici e di qualsiasi HPV, che incorporano le stesse covariate precedentemente menzionate, sono stati eseguiti per il confronto con i modelli additivi. Tutte le analisi statistiche sono state condotte utilizzando SAS 9.1.3 e i grafici sono stati generati con R 2.9.2. Il codice del computer può essere scaricato su https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.

3., Risultati

Il modello di rischio proporzionale Cox per il rilevamento di incidenti di HPV oncogeno ha mostrato che le donne sieropositive con CD4> 500 avevano un hazard ratio (HR) 1,62 con intervallo di confidenza (CI) del 95% da 1,31 a 2,00 rispetto alle donne HIV-negative. Le HR corrispondenti e il 95% dei CIs che hanno confrontato le donne sieropositive con CD4 200-500 e CD4 < 200, utilizzando le donne HIV-negative come gruppo di riferimento, sono state rispettivamente 2,49 (IC: 2,04-3,03) e 3,82 (IC: 3,01–4,86)., La tendenza for è stata calcolata trattando il gruppo HIV / CD4 come una variabile ordinale con quattro livelli (da 0 a 3) ed è stata altamente significativa (). Inoltre, l’età è stata associata negativamente e il fumo è stato associato positivamente, con il rilevamento di incidenti di HPV oncogenico. Nei modelli di rilevamento dell’incidente di qualsiasi HPV, l’HRs e il 95% CIs per le donne sieropositive con CD4 > 500, CD4 200-500 e CD4 < 200 erano 1,65 (CI: 1,39-1,96), 2,76 (CI: 2,33–3,27), e 3,40 (CI: 2,66–4,34), rispettivamente. La tendenza per era inferiore a 0,0001., Fattori significativi simili come nell’HPV oncogenico incidente sono stati trovati con i risultati aggiuntivi che le donne afroamericane avevano una maggiore incidenza di qualsiasi HPV rispetto alle donne caucasiche, e il numero di partner sessuali maschili negli ultimi 6 mesi è stato positivamente associato al rilevamento incidente di qualsiasi HPV.

Questi hazard ratio, tuttavia, non hanno affrontato il numero assoluto di nuove infezioni da HPV che sarebbero state rilevate con una diminuzione della conta dei CD4., Inoltre, il controllo dell’ipotesi di proporzionalità per i modelli di Cox mostra che la proporzionalità della funzione di pericolo non è stata mantenuta per i sieropositivi con CD4 < 200 nell’analisi oncogenica dell’HPV () e per il numero di partner sessuali maschili negli ultimi 6 mesi ≥3 in qualsiasi analisi dell’HPV (). Per questi motivi, abbiamo applicato i modelli di regressione dei pericoli additivi a questo set di dati.

È stato montato il modello di pericolo additivo semiparametrico per l’HPV oncogeno, i cui risultati sono riportati nella Tabella 1., HIV-positivi in donne con CD4 > 500 ha avuto un ulteriore rischio di 0,03 e di HIV-negativi, le donne, il che implica che, in media, c’erano altre 3 oncogeni di HPV infezione casi ogni 100 donne HIV positive in un anno, con CD4 > 500 rispetto all’HIV-negativi per le donne; donne HIV positive con CD4 200-500 ha avuto un incremento del pericolo 0.08; HIV-positivi in donne con CD4 < 200 ha avuto un incremento del pericolo 0.14., Tutti gli aumenti relativi alle donne HIV-negative erano statisticamente significativi (), e la tendenza all’aumento rispetto al gruppo HIV / CD4 era significativa con valore < 0,0001. Gli effetti dell’età, della razza, del fumo e del numero di partner sessuali maschili negli ultimi 6 mesi concordati con quelli del modello Cox corrispondente.

Le probabilità di sopravvivenza stimate per i quattro strati HIV / CD4 aggiustate per altre covariate dal modello additivo semiparametrico sono riportate nella Figura 1(a). Mostra che un numero inferiore di CD4 è stato associato ad un aumento del rilevamento di HPV oncogenico.,/p>


(a)

(b)


(a)
(b)

Figure 1

Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., Dall’alto verso il basso per ogni risultato e ogni modello in forma: HIV−, CD4 > 500, CD4: 200-500, e CD4 < 200.

Il modello di pericolo additivo non parametrico è stato inoltre adattato ai dati. Le variabili nel modello di regressione del pericolo additivo non parametrico avevano una significatività statistica simile a quelle nel modello di additivo semiparametrico e anche a quelle nel modello di regressione del pericolo proporzionale Cox con le stesse covariate., Figura 1(a) mostra le stime di probabilità di sopravvivenza di oncogeni di HPV per le quattro HIV/CD4 gruppi: , , , per l’HIV-negativi, donne, donne HIV positive con CD4 > 500 CD4 200-500, e CD4 < 200, rispettivamente, rettificato per le altre covariate, dove è cumulativo stimato baseline hazard e stimato per eccesso cumulativo di pericolo associato per ogni CD4 falda. La figura 1 a) mostra che il modello semiparametrico (modello (1)) e i modelli non parametrici (modello (2) in generale hanno fornito stime simili sulle funzioni cumulative dei pericoli., In particolare, le distanze tra le curve sono simili, indicando che questi due modelli hanno dato stime ravvicinate dell’effetto CD4.

In questa analisi basata sul modello (2), la probabilità di sopravvivenza stimata di HPV oncogeno in 5 anni di follow-up tra le donne HIV-negative con un’età< 30, di razza caucasica, che erano non fumatori e avevano un solo partner sessuale maschile negli ultimi 6 mesi, era 0,80., L’incidenza cumulativa corrispondente era , il che implica che in 5 anni di follow-up il 20% delle donne HIV-negative con le caratteristiche precedentemente menzionate aveva almeno un test positivo per l’HPV oncogeno; i tassi di incidenza cumulativa entro 5 anni di follow-up erano 0,33, 0,47 e 0,60 per CD4 > 500, CD4 200-500 e CD4 < 200 gruppi, rispettivamente., Pertanto, per ogni 100 donne con CD4 < 200, c’erano 40 più infezioni da HPV oncogeniche entro l’anno 5 rispetto a ogni 100 donne HIV-negative, che è un aumento significativo del numero di infezioni. Entrambi i modelli di rischio additivo semiparametrico e non parametrico si adattano bene ai dati sulla base dei grafici residui di Cox-Snell (Figura 2) : le curve di rischio cumulativo stimate seguono approssimativamente le linee di 45 gradi.

Le stesse analisi sono state condotte per qualsiasi HPV (Tabella 1)., Le stime degli effetti per le donne sieropositive con CD4 > 500, CD4 200-500, CD4 < 200 erano rispettivamente 0,09, 0,23, 0,30, con valori inferiori a 0,0001 ( per trend < 0,0001). Dal modello additivo non parametrico(Figura 1 (b)), la differenza nella sopravvivenza di qualsiasi HPV tra CD4 200-500 e CD4 < 200 gruppo non era così significativa come quella per la sopravvivenza dell’HPV oncogeno. L’incidenza cumulativa di qualsiasi HPV a 5 anni è stata di 0,40, 0,63, 0,77, 0.,84 per le donne HIV-negative, le donne HIV-positive con CD4 > 500, CD4 200-500, CD4< 200, rispettivamente. Anche i modelli di pericolo additivo per qualsiasi HPV si adattano bene ai dati (Figura 3).

4. Conclusione

Questo studio ha applicato due tipi di modelli di regressione del rischio additivo: i modelli di regressione del rischio additivo semiparametrico e non parametrico e un modello di rischio proporzionale Cox all’analisi dei dati di rilevamento dell’incidenza di HPV in donne HIV-positive e HIV-negative e ha contrastato le stime degli effetti ottenute utilizzando ciascun approccio statistico., Tutti i modelli hanno trovato associazioni altamente significative tra lo stato immunitario dell’ospite e il rischio di rilevamento HPV incidente. Il modello additivo semiparametrico ha mostrato che in media c’erano altri 14 casi di infezione da HPV oncogeno per 100 donne-anno correlati alla conta CD4 < 200 relativi a donne HIV-negative; e il modello non parametrico ha mostrato ulteriori 40 infezioni da HPV oncogeni per 100 donne dopo 5 anni di follow-up.,

Mentre, come previsto, i modelli additivi era molto inferiore stime di effetto rispetto al modello di Cox, i due approcci indirizzo di domande diverse; che è, il modello di Cox, che fornisce stime di rischio relativo (in un moltiplicativo scala), mentre l’additivo modelli di pericolosità fornire stime approssimative per il rischio attribuibile (cioè, l’assoluta differenza nel tasso di eventi per unità di variazione della variabile di esposizione) sotto raro caso di assunzione., Il rischio attribuibile può essere utilizzato per determinare l’aumento assoluto del numero di casi, cioè il numero di casi aggiuntivi di infezione da HPV che si sono verificati a causa dell’esposizione di interesse. I rischi relativi stimati dai modelli di Cox possono essere particolarmente utili per comprendere l’entità dell’associazione, che può essere importante scientificamente; cioè, quando il rischio di base della malattia è basso il numero assoluto di casi aggiuntivi correlati all’esposizione può essere piccolo, ma il rischio relativo può ancora essere forte., Tuttavia, il rischio assoluto può essere particolarmente utile per la pianificazione e l’intervento della salute pubblica, quando il numero effettivo di casi aggiuntivi di una malattia è di interesse.

Abbiamo considerato un modello di pericolo additivo semiparametrico e non parametrico. Rispetto al modello di regressione del pericolo additivo semiparametrico, il modello di pericolo additivo non parametrico consente agli effetti covariati di variare nel tempo in modo non parametrico e fornisce quindi una stima più solida della funzione di pericolo cumulativo rispetto al modello di pericolo additivo semiparametrico., Tuttavia, i modelli non parametrici utilizzano anche più gradi statistici di libertà. Pertanto, se le stime effettive covariate medie sono di interesse primario, è possibile utilizzare il modello di pericolo additivo semiparametrico, ma se si desidera esaminare se alcuni effetti covariati variano nel tempo o se la funzione di pericolo cumulativo (o il tasso di incidenza cumulativa) è di interesse primario, il modello di pericolo additivo non parametrico può essere preferito.

Notiamo che il modello proposto da Lin e Ying è stato esteso per includere effetti covariati sia additivi che moltiplicativi ., Questo modello può essere necessario, ad esempio, quando alcune covariate in un modello di rischi proporzionali di Cox soddisfano l’ipotesi di rischi proporzionali e altre no. Tuttavia, l’interpretazione di questo modello non è così semplice come il modello Cox o i modelli additivi.

In sintesi, sebbene le basi teoriche per i modelli di pericolo additivo siano ben consolidate e siano disponibili codici informatici per il montaggio di questi modelli, essi sono stati utilizzati meno spesso di altri metodi di analisi time-to-event., Ciò può in parte riflettere un certo grado di scarsa familiarità con questi modelli nella comunità di ricerca generale. Sono necessari sforzi continui per aumentare la consapevolezza di questi metodi statistici e dovrebbero essere considerati dai biostatisti e dagli epidemiologi coinvolti nell’insegnamento della prossima generazione di ricercatori.

Riconoscimenti

Questo lavoro è stato parzialmente supportato da NCI Grants 5R01CA085178, 1R21CA139388 e da una sovvenzione della Lupus Foundation of America., I dati in questo documento sono stati raccolti dalle Donne dell’Interagency HIV Studio (WIHS); Collaborazione di un Gruppo di Studio con i centri (principal investigator) a New York City/Bronx Consorzio (Kathryn Anastos); Brooklyn, NY (Howard Minkoff); Metropolitana di DC di Washington Consorzio (Maria Giovani); La Connie Wofsy Consorzio di ricerca della California del Nord (Ruth Greenblatt); Contea di Los Angeles/Southern California Consorzio (Alexandra Levine); Chicago Consorzio (Mardge Cohen); Dati del Centro di Coordinamento (Stephen Gange)., Il WIHS è finanziato dall’Istituto Nazionale di allergia e malattie infettive (UO1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993 e UO1-AI-42590) e dall’Istituto Nazionale di salute infantile e sviluppo umano Eunice Kennedy Shriver (UO1-HD-32632). Lo studio è cofinanziato dal National Cancer Institute, dall’Istituto nazionale sull’abuso di droghe e dall’Istituto nazionale sulla sordità e altri disturbi della comunicazione. Il finanziamento è fornito anche dal Centro Nazionale per le risorse di ricerca (UCSF-CTSI Grant no. UL1 RR024131)., I contenuti di questa pubblicazione sono di esclusiva responsabilità degli autori e non rappresentano necessariamente le opinioni ufficiali del National Institutes of Health. Ulteriore supporto è stato fornito dal Centro Einstein-Montefiore per la ricerca sull’AIDS (P30-AI-51519), dall’Istituto per la ricerca clinica e traslazionale (UL1RR025750) e dall’Albert Einstein Cancer Center.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Vai alla barra degli strumenti