Additiv Fare regresjonsmodeller: En Søknad til Natural History of Human Papillomavirus

Abstrakt

Det er flere statistiske metoder for-tid-til-event analyse, blant som er Cox proporsjonal farer modell som er mest brukt. Imidlertid, når den absolutte endringen i risiko, i stedet for risiko-forhold, er av primær interesse, eller når proportional hazard forutsetning for Cox proporsjonal farer modellen er brutt, en additiv fare regresjonsmodell kan være mer hensiktsmessig., I denne artikkelen gir vi en oversikt over denne tilnærmingen, og deretter bruke en semiparametric samt en nonparametric additiv modell til data fra en studie av natural history of human papillomavirus (HPV) hos HIV-positive og HIV-negative kvinner., Resultatene fra semiparametric modellen som er angitt på gjennomsnittlig en ekstra 14 oncogenic HPV-infeksjoner per 100 kvinne-årene knyttet til CD4 telling < 200 i forhold til HIV-negative kvinner, og de fra nonparametric additiv modell viste en ekstra 40 oncogenic HPV-infeksjoner per 100 kvinner over 5 års oppfølging, mens den estimerte hazard ratio i Cox-modellen ble 3.82. Selv om Cox-modellen kan gi en bedre forståelse av eksponering sykdom association, den additive modellen er ofte mer nyttig for folkehelsen planlegging og intervensjon.

1., Innledning

-Tid-til-event analyse er ofte brukt til å studere risikofaktorer forbundet med forekomst av kliniske hendelser . For eksempel, tid til sykdom utvikling, tid til sykehusinnleggelse, tid til tilbakefall/tilbakefall, og tid-til-døden er hvert ofte brukt som endepunkter. Det er imidlertid flere ulike modeller for å måle forhold av tid-til-event data med risiko faktorer, inkludert parametrisk, semiparametric, og nonparametric modeller. I parametriske modeller, en fordeling som er antatt for tid til å hendelse (f.eks., en eksponentiell, gamma, eller Weibull fordeling), og det er videre antatt at det er en lineær sammenheng mellom logaritmen av tid til hendelsen og covariates i modellen. Styrken av foreningen er deretter beregnet ved hjelp av maximum likelihood-tilnærming. I semiparametric modeller, særlig Cox proporsjonal fare regresjonsberegninger , hazard-funksjonen er antatt å være multiplicatively knyttet til covariates, med en uspesifisert baseline fare funksjon, og den maksimale delvis likelihood metoden er brukt for å estimere parametrene., I nonparametric modeller, først og fremst Kaplan-Meier tilnærming, ingen antakelser er gjort når det gjelder forholdet mellom sykdom risiko og covariates. I stedet, overlevelse funksjon for hvert stratum av covariates er estimert med empiriske metoder, og den log-rank test og andre nonparametric tester er vanligvis brukt for å teste effekten av disse covariates.

En godt kjent, men mindre ofte brukt metode for å analysere tid-til-event data er en additiv fare regresjonsmodell ., I motsetning til de proporsjonal farer modell som anslår hazard ratio, en additiv modell anslår forskjellen i farer: endring i fare funksjon på grunn av eksponering av interesse eller oppgitt mer bare den absolutte forskjellen i umiddelbar feil pris per enhet endring i eksponering variabel. Basert på estimat på forskjellen i risiko, man kan videre beregne endring i kumulativ insidens: når den kumulative fare er liten (f.eks., sjeldne hendelser), endring i akkumulerte fare tilnærmet lik forskjellen i risiko for sykdom på grunn av eksponering, som er knyttet risiko på grunn av eksponering. Derfor, når som kan tilskrives risikoen er av primær interesse eller proporsjonal fare forutsetningen er brutt, en additiv fare regresjonsmodell kan være mer hensiktsmessig. Siden nonparametric additive modellen ble opprinnelig foreslått av Aalen , det har vært omfattende forskning på temaet ., Imidlertid, den additive fare regresjonsmodeller være utnyttet fullt ut i offentlig helse og medisinsk forskning først og fremst på grunn av mangel på kjennskap til modeller og mangel på kunnskap om hvordan å implementere modellene ved hjelp av eksisterende programvare. I denne artikkelen gir vi et eksempel for å illustrere anvendelse av to additive modeller ved hjelp av eksisterende statistisk programvare (program koder er gitt).

Den motiverende eksempel på dette papiret var en studie av natural history of human papillomavirus (HPV) – infeksjon blant menneskelig immunsvikt-virus (HIV-) positive og HIV-negative kvinner., Den tidligere analyse av dette datasettet som brukes Cox proporsjonal fare modell for å vurdere forhold av hendelsen HPV deteksjon med host immun status målt ved HIV serostatus og CD4 telling . I dette innlegget, vi analysert en oppdatert versjon av denne samme datasettet med fire år av ekstra oppfølging, bruk av tilsetningsstoff farer regresjonsmodeller for å beregne tilskrives risikoen for HPV-smitte relatert til endringer i immunforsvaret status og sammenlignet disse resultatene med resultatene ved hjelp av Cox-modellen.

2. Metoder

2.1., Data

data ble innhentet fra Kvinne Tverrfaglig HIV-Studien (WIHS), en stor pågående multi-institusjonelle observasjonsstudie med halvårlige klinisk oppfølging besøk, som inkluderer innsamling av ekspandert livmorhalsen celler for HPV DNA-testing og Pap tester. Det var 3766 kvinner (2791 HIV+, 975 HIV−); to tredjedeler av disse ble registrert i 1994-95, og resten i 2001-02. Detaljer om studien påmelding og metoder som tidligere har blitt rapportert ., Etter ekskludert de kvinner som hadde HIV seroconversion under oppfølging, hadde hysterektomi før innmelding i WIHS, manglet HPV data under oppfølging, eller testet positivt for oncogenic HPV ved baseline, antall kvinner som er tilgjengelige for den aktuelle analysen av hendelsen påvisning av oncogenic HPV var 2386 (1672 HIV+, 714 HIV−). Den oncogenic HPV-typer, inkludert HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, og 68., Vi har også undersøkt hendelsen påvisning av eventuelle HPV der flere kvinner ble ekskludert på grunn av at det oppdages positiv for alle typer av HPV ved baseline; tilsvarende tall for kvinner var 1733 (1116 HIV+, 617 HIV−). Dette datasettet representerer en oppdatering fra med 8 ekstra besøk (4 år ekstra til oppfølging).

-Tid-til-hendelsen påvisning av HPV) ble estimert ved hjelp av midinterval mellom den siste HPV-negative besøk og den første HPV-positive besøk. Tid til hendelsen påvisning av oncogenic eller alle HPV ble analysert separat., Den primære eksponering variabel var vert immun status preget av HIV-status og CD4 telling: HIV-negative og HIV-positive med en CD4-telling er større enn 500, CD4 telling mellom 200 og 500, og CD4 telle mindre enn 200. Den ekstra covariates inkludert alder (<30, 30-34, 35-39, 40-44, ≥45 år), løp (hvit, svart, Spansk, andre), røyking (aldri, tidligere, nåværende), og antallet av mannlige seksuelle partner i løpet av de siste 6 måneder (0, 1, 2, ≥3).

2.2. Statistiske Metoder

To additive fare modeller ble vurdert., Den første modellen var semiparametric additiv fare modell hvor er betinget fare pris for et gitt motiv med covariate er nummeret på covariates, er ukjent baseline fare funksjon, og er ukjent tid-uavhengige koeffisienter. I denne studien har vi bare vurdert tid-uavhengig covariates, alle ved baseline. Mer generelle former av modell (1) med tidsavhengig covariates har blitt studert i , som viste at estimater av og er konsekvent og asymptotically normal., Merk at modellen (1) har en lignende form til Cox proporsjonal fare regresjonsmodell: begge modellene har en uspesifisert baseline fare funksjon og tid-uavhengige koeffisienter, selv om Cox-modellen er definert på en multiplicative skala, mens den additive fare modellen er definert på en additiv skala. I motsetning til Cox proporsjonal fare regresjonsmodell som krever numeriske iterasjoner i estimering av regresjon parametere, som tidligere nevnt semiparametric additiv fare regresjonsmodell har lukket form løsning for å estimere regresjon parametere., Vi er i stand til å estimere den absolutte endringen i risiko i stedet for relativ endring i risiko med modellen (1). SAS-kode i ble brukt til å passe modellen, som gir anslag for , sin standard feil og avvik-covariance matrise. Verdiene ble beregnet under normale forutsetning. Flere SAS-koden ble skrevet for å beregne estimert kumulativ baseline fare og standard feil basert på . Den kumulative fare funksjon estimatene ble beregnet basert på modell (1). Cox-Snell gjenværende ble evaluert for hvert fag på sitt observert overlevelse tid., Spesielt, for et emne med observert overlevelse tid , event-indikator og covariate , de resterende er beregnet av . Hvis modell (1) er riktig, det ‘s bør følge en enhet eksponentiell fordeling med rett til å sensurere . Fordi enheten eksponentielle fordelingen har eiendommen som sin kumulative fare funksjon er identiteten funksjon, man kan bruke denne eiendommen for å sjekke goodness of fit » for additiv modell. Vi har derfor beregnet Nelson-Aalen estimater av kumulative farer på data for alle fag., I SAS, dette kan oppnås ved hjelp av proc phreg med baseline-setningen og metode=ch-alternativet i utsagnet (koden er gitt i online materialer). Tomten av estimert kumulativ farer på restene versus restene ble generert, der en nær 45-graders linjen er forventet hvis modell (1) er sann.

Modell (1) forutsetter at effekten av covariate er konstant på fare funksjon, men faktum er at det kan bli generalisert til en kjent parametrisk form som er muligens tidsavhengig., Vi har også vurdert en mer generell additiv fare modell som gjør at koeffisientene i covariate å være tidsavhengig og nonparametric, der . I motsetning til i modell (1), den nye modellen gir ingen antakelse om form av . Den asymptotiske teori av denne modellen ble studert i . Et SAS macro gitt i ble brukt til å passe modellen, som gir estimater av deres standard feil estimater. Estimatene for mengder har lukket form løsninger., er den kumulative baseline fare og er overflødig kumulative farer på tidspunktet som er definert fra 0 tid for kvalitetstid på som matrix design basert på covariates og observert ganger er full rang . Hvis du er en indikator (0/1) for noen , , estimering av gir ekstra kumulative fare estimat på tidspunkt for å være i gruppen, mens justering for andre covariates. Den nonparametric additiv fare modell ble justert til samme covariates som i semiparametric additiv fare modell., Lignende Cox-Snell restplott som i semiparametric modellen ble generert med den forskjell at alle restene for nonparametric additiv modell ble sensurert på maksimal tid .

Tradisjonell Cox proporsjonal fare modeller for hendelsen påvisning av oncogenic og noen HPV, som omfatter de samme covariates som tidligere nevnt, ble kjørt til sammenligning til additive modeller. Alle statistiske analyser ble utført ved bruk av SAS 9.1.3, og tomter ble generert med R 2.9.2. Datamaskinen kan også lastes ned på https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.

3., Resultater

Cox proporsjonal fare modell for hendelsen påvisning av oncogenic HPV viste at HIV-positive kvinner med CD4 > 500 hadde en hazard ratio (HR) 1.62 med 95% konfidensintervall (CI) 1.31 til 2.00 i forhold til HIV-negative kvinner. Tilsvarende Timer og 95% CIs å sammenligne HIV-positive kvinner med CD4 200-500 og CD4 < 200, ved hjelp av HIV-negative kvinner som referanse-gruppe, ble 2.49 (CI: 2.04–3.03) og 3.82 (CI: 3.01–4.86), henholdsvis., For trenden ble beregnet ved behandling av HIV/CD4-gruppen som en ordenstallet variabel med fire nivåer (0 til 3) og var sterkt signifikant (). I tillegg, alder var negativt assosiert, og røyking var positivt assosiert med hendelsen påvisning av oncogenic HPV. I modeller av hendelsen påvisning av eventuelle HPV, i Timer og 95% CIs for HIV-positive kvinner med CD4 > 500, CD4 200-500, og CD4 < 200 var 1.65 (CI: 1.39–1.96), 2.76 (CI: 2.33–3.27), og 3.40 (CI: 2.66–4.34), henholdsvis. For trenden var mindre enn 0,0001., Lignende viktige faktorer som i hendelsen oncogenic HPV ble funnet med flere funn som Afrikansk-Amerikanske kvinner hadde høyere forekomst av alle HPV enn Kaukasiske kvinner, og antallet av mannlige seksuelle partnere i de siste 6 måneder var positivt assosiert med hendelsen påvisning av eventuelle HPV.

Disse hazard ratios, men tok ikke stilling til det absolutte antall nye HPV-infeksjoner som ville bli oppdaget med en reduksjon i CD4 telling., Videre, kontroll av forholdsmessighet forutsetning for Cox-modeller viser at forholdsmessigheten av hazard-funksjonen holder ikke for HIV-positive med CD4 < 200 i oncogenic HPV-analyse () og for antall mannlige seksuelle partner i løpet av de siste 6 måneder ≥3 i noen HPV-analyse (). For disse grunner, vi brukt den additive farer regresjonsmodellene til dette datasettet.

semiparametric additiv fare modell for oncogenic HPV ble montert, og resultatene er gitt i Tabell 1., HIV-positive kvinner med CD4 > 500 hadde en ekstra fare på 0,03 enn HIV-negative kvinner, noe som innebærer at i gjennomsnitt var det 3 ekstra oncogenic HPV-infeksjon tilfeller per 100 HIV-positive kvinner per år med CD4 > 500 i forhold til HIV-negative kvinner; HIV-positive kvinner med CD4 200-500 hadde en økning på fare 0.08; HIV-positive kvinner med CD4 < 200 hadde en økning på fare 0.14., Alle de øker i forhold til HIV-negative kvinner var statistisk signifikant (), og den økende trenden med hensyn til HIV/CD4-gruppen var signifikant med verdi < 0.0001. Effekten av alder, rase, røyking, og antallet av mannlige seksuelle partner i løpet av de siste 6 måneder som er avtalt med de tilsvarende Cox-modellen.

estimert overlevelse sannsynligheter for de fire HIV/CD4 strata justert for andre covariates fra semiparametric additive modellen er gitt i Figur 1(a). Det viser at lavere CD4 telling ble assosiert med økt gjenkjenning av oncogenic HPV.,/p>


(a)

(b)


(a)
(b)

Figure 1

Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., Fra topp til bunn for hvert resultat, og hver modell passer: HIV−, CD4 > 500, CD4: 200-500, og CD4 < 200.

nonparametric additiv fare modellen ble også montert på data. Variablene i nonparametric additiv fare regresjonsmodell hadde lignende statistiske signifikansen til de som er i semiparametric additiv modell og også til de som er i Cox proporsjonal fare regresjonsmodell med samme covariates., Figur 1(a) viser estimater av overlevelse sannsynligheten for oncogenic HPV for de fire HIV/CD4 grupper: , , , for HIV-negative kvinner, HIV-positive kvinner med CD4 > 500, CD4 200-500, og CD4 < 200 kroner, justert for andre covariates, der er estimert kumulativ baseline fare og er beregnet overskudd kumulative fare forbundet for hver CD4 stratum. Figur 1(a) viser at semiparametric modell (modell (1)) og nonparametric modellene (modell (2)) generelt ga lignende anslag på kumulativ farer funksjoner., Spesielt avstander mellom kurvene er like, noe som indikerer at disse to modellene ga i nærheten estimater av CD4 effekt.

I denne analysen er basert på modell (2), estimert overlevelse sannsynligheten for oncogenic HPV over 5 års oppfølging hos HIV-negative kvinner med en alder < 30, av Kaukasiske rase, som var røykere, og hadde bare én mann seksuell partner i de siste 6 måneder, var 0.80., Tilsvarende kumulativ insidens var , noe som innebærer at over 5 års oppfølging 20% av HIV-negative kvinner med tidligere nevnte egenskaper hadde i det minste en positiv test for oncogenic HPV; den kumulative insidens priser ved 5 års oppfølging var 0.33, 0.47, og 0.60 for CD4 > 500, CD4 200-500, og CD4 < 200 grupper, henholdsvis., Derfor, for hver 100 kvinner med CD4 < 200, var det 40 mer oncogenic HPV-infeksjoner ved 5 år i forhold til hver 100 HIV-negative kvinner, som er en betydelig økning i antall infeksjoner. Både semiparametric og nonparametric additiv fare modeller passe dataene vel basert på Cox-Snell gjenværende tomter (Figur 2): estimert kumulativ fare kurver ca følg 45 graders linjer.

De samme analysene ble gjennomført for alle HPV (Tabell 1)., Effekten estimater for HIV-positive kvinner med CD4 > 500, CD4 200-500, CD4 < 200 var 0.09, 0.23, 0.30, henholdsvis, med verdier mindre enn 0,0001 ( for trend < 0.0001). Fra nonparametric additiv modell (Figur 1(b)), forskjellen i overlevelse av alle HPV mellom CD4 200-500 og CD4 < 200 gruppen var ikke like viktig som for overlevelse av oncogenic HPV. Kumulativ forekomst av alle HPV på 5 år var 0.40, 0.63, 0.77, 0.,84 for HIV-negative kvinner, HIV-positive kvinner med CD4 > 500, CD4 200-500, CD4 < 200 kroner. Den additive fare modeller for alle HPV også passe dataene godt (Figur 3).

4. Konklusjon

Denne studien brukt to typer additiv fare regresjonsmodeller: den semiparametric og nonparametric additiv farer regresjonsmodeller og en Cox proporsjonal fare modell til analyse av HPV forekomst deteksjon data i HIV-positive og HIV-negative kvinner og kontrastert effekten estimater innhentet ved hjelp av hvert statistisk tilnærming., Alle modeller fant meget signifikant sammenheng mellom vert immun status og risiko for hendelsen HPV gjenkjenning. Den semiparametric additiv modell viste at i gjennomsnitt var det en ytterligere 14 oncogenic HPV-infeksjon tilfeller per 100 kvinne-årene knyttet til CD4 telling < 200 i forhold til HIV-negative kvinner, og nonparametric modellen viste en ekstra 40 oncogenic HPV-infeksjoner per 100 kvinner etter 5 års oppfølging.,

Mens du er som forventet additive modeller hadde mye lavere effekt estimater enn Cox-modellen, to tilnærminger adresse forskjellige spørsmål, det er, Cox modellen gir anslag for relativ fare (på en multiplicative skala), mens den additive fare modeller gir omtrentlige anslag for den som kan tilskrives risikoen (dvs., den absolutte forskjellen i tilfelle pris per enhet endring i eksponering variabel) i sjeldne tilfelle forutsetning., Den som kan tilskrives risikoen kan brukes til å finne den absolutte økningen i antall saker, det er, antall ekstra tilfeller av HPV-infeksjon som har oppstått på grunn av eksponering av interesse. Den relative farer anslått av Cox-modeller kan være spesielt nyttig i å forstå omfanget av association, som kan være viktig vitenskapelig, det er, når baseline fare for sykdom er lav det absolutte antall av flere saker relatert til eksponering kan være liten, men den relative risikoen kan fortsatt være sterk., Men den absolutte risikoen kan være spesielt nyttig for folkehelsen planlegging og intervensjon, når den faktiske antall ekstra tilfeller av en sykdom som er av interesse.

Vi vurderte semiparametric og en nonparametric additiv fare modeller. Sammenlignet med semiparametric additiv fare regresjonsmodell, den nonparametric additiv fare modellen tillater covariate effekter for å variere over tid nonparametrically og dermed gir en mer robust estimat på de akkumulerte fare funksjon enn semiparametric additiv fare modell., Men nonparametric modeller bruker også mer statistisk grader av frihet. Derfor, hvis den gjennomsnittlige covariate effektiv estimater er av primær interesse semiparametric additiv fare modellen kan brukes, men hvis man ønsker å undersøke hvorvidt noen covariate effekter er varierende over tid eller den kumulative fare funksjon (eller den kumulative insidens) er av primær interesse, nonparametric additiv fare modell kan være å foretrekke.

Vi oppmerksom på at den modellen som er foreslått av Lin og Ying har blitt utvidet til å omfatte både additive og multiplicative covariate effekter ., Denne modellen kan være nødvendig, for eksempel når visse covariates i en Cox proporsjonal farer modell tilfredsstille proporsjonal farer antagelse, og andre ikke. Men tolkningen av denne modellen er ikke så enkelt som enten Cox-modellen eller den additive modeller.

I sammendraget, selv om det teoretiske grunnlaget for additiv fare modeller er godt etablert og datamaskin koder for å tilpasse disse modeller er tilgjengelige, og de har blitt sjeldnere brukt enn andre metoder for-tid-til-event analyse., Dette kan delvis reflektere en grad av unfamiliarity med disse modellene i den generelle forskningsmiljøer. Fortsatt innsats for å øke bevisstheten om disse statistiske metoder er nødvendig, og bør vurderes av biostatisticians og epidemiologists involvert i undervisning på neste generasjon av forskere.

Erkjennelsene

Dette arbeidet ble delvis støttet av NCI Tilskudd 5R01CA085178, 1R21CA139388 og et stipend fra Lupus Foundation of America., Data i dette papiret ble samlet inn av Kvinne Tverrfaglig HIV-Studien (WIHS); Collaborative Study Group med sentre (rektor undersøkere) i New York/Bronx Consortium (Kathryn Anastos); Brooklyn, new york (Howard Minkoff); Washington DC Metropolitan Consortium (Mary Unge); Den Connie Wofsy Studier Consortium i Nord-California (Ruth Greenblatt); Los Angeles County/Sør-California Consortium (Alexandra Levine); Chicago Consortium (Mardge Cohen); Data Koordinerende Senter (Stephen Gange)., Den WIHS er finansiert av National Institute of Allergy og Smittsomme Sykdommer (UO1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993, og UO1-AI-42590) og Eunice Kennedy Shriver National Institute of Child Health and Human Development (UO1-HD-32632). Studien er cofunded av National Cancer Institute, National Institute on Drug Abuse og National Institute on Deafness and Other Communication Disorders. Midler er også gitt av Nasjonalt Senter for Forskning Ressurser (UCSF-CTSI Stipend ingen. UL1 RR024131)., Innholdet i denne publikasjonen er selv ansvarlig for forfatterne og representerer ikke nødvendigvis de offisielle synspunkter av National Institutes of Health. Ekstra støtte ble gitt av Einstein-Montefiore Senter for AIDS-Forskning (P30-AI-51519), Institute for Clinical and Translational Research (UL1RR025750), og Albert Einstein Cancer Center.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

Hopp til verktøylinje