Additiv Hazard Regression Modeller: En Ansøgning til den Naturlige Historie af Humant Papillomvirus

Abstrakt

Der er flere statistiske metoder til time-to-event analyse, blandt hvilke er Cox proportional hazards model, der er mest almindeligt anvendte. Når den absolutte risikoændring i stedet for risikoforholdet er af primær interesse, eller når den proportionale risikoantagelse for co.proportional ha .ard-modellen overtrædes, kan en additiv ha .ard-regressionsmodel imidlertid være mere hensigtsmæssig., I dette papir giver vi et overblik over denne tilgang og anvender derefter en semiparametrisk såvel som en ikke-parametrisk additivmodel til et datasæt fra en undersøgelse af naturhistorien for human papillomavirus (HPV) hos HIV-positive og HIV-negative kvinder., Resultaterne fra semiparametric model, der er angivet på gennemsnitlige yderligere 14 kræftfremkaldende HPV-infektioner per 100 kvinde-år, der er relateret til CD4-tælling < 200 i forhold til HIV-negative kvinder, og dem fra nonparametric additive model viste en yderligere 40 kræftfremkaldende HPV-infektioner per 100 kvinder over 5 års opfølgning, mens den anslåede hazard ratio i Cox-modellen blev 3.82. Selvom Co. – modellen kan give en bedre forståelse af eksponeringssygdomsforeningen, er additivmodellen ofte mere nyttig til folkesundhedsplanlægning og intervention.

1., Introduktion

Time-to-event analyse bruges ofte til at studere risikofaktorer forbundet med forekomsten af kliniske hændelser . For eksempel, tid-til-sygdom udvikling, tid-til-hospitalsindlæggelse, tid-til-tilbagefald/tilbagefald, og tid-til-død er hver ofte brugt som endpoints. Der er dog flere forskellige modeller til måling af forholdet mellem tid-til-begivenhed data med risikofaktorer, herunder parametriske, semiparametriske og nonparametriske modeller. I parametriske modeller antages en distribution for tid til begivenhed (f. eks., eller exponeibull distribution), og det antages endvidere, at der er et lineært forhold mellem logaritmen til tid til begivenhed og kovariaterne i modellen. Foreningens styrke estimeres derefter ved hjælp af den maksimale sandsynlighedsmetode. I semiparametric modeller, især Cox proportional hazard regression modeller , fare-funktionen antages at være multiplicatively relateret til kovariater, med en uspecificeret baseline hazard funktion, og den maksimale delvis sandsynligheden metode anvendes til at estimere parametre., I ikke-parametriske modeller, især Kaplan-Meier-tilgangen, er der ingen antagelser om forholdet mellem sygdomsrisikoen og kovariaterne. I stedet estimeres overlevelsesfunktionen for hvert lag af kovariaterne med empiriske metoder, og log-rank-testen og andre ikke-parametriske tests bruges typisk til at teste virkningerne af disse kovariater.

en velkendt, men mindre ofte anvendt metode til analyse af tid-til-begivenhed data er en additiv fare regression model ., I modsætning til de proportional hazards model, som estimerer hazard ratios, en additiv model skøn forskellen i farer: ændringen i fare funktion på grund af eksponering af interesse, eller som sagt flere simpelthen den absolutte forskel i den øjeblikkelige manglende sats per enhed af ændringer i eksponering variabel. Baseret på estimatet af forskellen i Farer kan man yderligere estimere ændringen i kumulativ forekomst: når den kumulative fare er lille (f. eks.,, sjældne tilfælde), er ændringen i kumulativ fare tilnærmelsesvis forskellen i risiko for sygdom på grund af eksponering, det vil sige den henførbare risiko på grund af eksponering. Derfor kan en regressionsmodel for additiv fare være mere hensigtsmæssig, hvis den henførbare risiko er af primær interesse, eller hvis antagelsen om proportional fare overtrædes. Da den ikke-parametriske additivmodel oprindeligt blev foreslået af Aalen, har der været omfattende undersøgelser om emnet ., Imidlertid forbliver additive ha .ard regression modeller underudnyttet i folkesundhed og medicinsk forskning primært på grund af manglende kendskab til modellerne og manglende viden om, hvordan man implementerer modellerne ved hjælp af eksisterende soft .are. I dette papir giver vi et eksempel til at illustrere anvendelsen af to additive Modeller ved hjælp af eksisterende statistisk soft .are (programkoder leveres).

det motiverende eksempel på dette papir var en undersøgelse af naturhistorie med human papillomavirus (HPV) infektion blandt human-immundefekt-virus- (HIV-) positive og HIV-negative kvinder., Den forudgående analyse af dette datasæt anvendte Co .proportional ha .ard model til at vurdere forholdet mellem incident HPV detection med host immunstatus målt ved HIV serostatus og CD4 count. I dette papir analyserede vi en opdateret version af det samme datasæt med fire års yderligere opfølgning ved hjælp af additive farer regressionsmodeller til at estimere den henførbare risiko for HPV-infektion relateret til ændringer i immunstatus og kontrasterede derefter disse resultater med resultater ved hjælp af Co. – modellen.

2. Metoder

2.1., Data

dataene blev indhentet fra Womenomen ‘ s Interagency HIV Study (WIIHS), et stort igangværende multiinstitutionelt observationsstudie med halvårlige kliniske opfølgningsbesøg, der inkluderer indsamling af eksfolierede cervikale celler til HPV-DNA-test og Pap-test. Der var 3766 kvinder (2791 HIV+, 975 HIV -); to tredjedele af dem blev indskrevet i 1994-95 og resten i 2001-02. Detaljer om studietilmelding og metoder er tidligere rapporteret ., Efter at have udelukket de kvinder, der havde HIV, der i løbet af followup, havde hysterektomi forud for indskrivning i WIHS, manglede HPV-data under opfølgning, eller testet positiv for kræftfremkaldende HPV-ved baseline, antallet af kvinder, der er tilgængelige for den aktuelle analyse af hændelsen påvisning af kræftfremkaldende HPV-var 2386 (1672 HIV+, 714 HIV−). De onkogene HPV-typer inkluderede HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, og 68., Vi undersøgte også hændelsesdetektion af enhver HPV, hvor flere kvinder blev udelukket på grund af at blive påvist positive for alle typer HPV ved baseline; det tilsvarende antal kvinder var 1733 (1116 HIV+, 617 HIV−). Dette datasæt repræsenterer en opdatering fra med 8 yderligere besøg (4 yderligere års opfølgning).

tid-til-hændelse påvisning af HPV blev estimeret ved hjælp af melleminterval mellem det sidste HPV-negative besøg og det første HPV-positive besøg. Tid-til-hændelse påvisning af onkogen eller enhver HPV blev analyseret separat., Den primære eksponeringsvariabel var værtsimmunstatus karakteriseret ved HIV-status og CD4-tæller: HIV-negativ, HIV-positiv med en CD4-tæller større end 500, CD4-tæller mellem 200 og 500 og CD4-tæller mindre end 200. Yderligere kovariater i prisen alder (<30, 30-34, 35-39, 40-44, ≥45 år), race (hvide, sorte, Spansktalende, andre), ryger (aldrig, tidligere, nuværende), og antallet af mandlige seksuelle partner i de sidste 6 måneder (0, 1, 2, ≥3).

2.2. Statistiske metoder

to modeller for additiv fare blev overvejet., Den første model var semiparametric tilsætningsstof hazard model, hvor er den betingede hazard rate af et givet emne med covariate er antallet af kovariater, som er den ukendte baseline hazard funktion, og er den ukendte tid-uafhængig koefficienter. I denne undersøgelse overvejede vi kun de tidsuafhængige kovariater, alle ved baseline. Mere generelle former for modellen (1) med tidsafhængige kovariater er blevet undersøgt i , hvilket viste, at estimaterne af og er konsistente og asymptotisk normale., Bemærk, at den model (1) har en lignende form for Cox proportional hazard regression model: begge modeller har en uspecificeret baseline hazard funktion og tid-uafhængig koefficienter, selv om Cox-model, der er defineret på en multiplikativ skala, mens den additive hazard model er defineret på en additiv skala. I modsætning til Cox proportional hazard regression model, som kræver numeriske iterationer i forbindelse med vurderingen af regression parametre, som tidligere nævnt semiparametric tilsætningsstof hazard regression model har lukket form løsning regression til at estimere parametre., Vi er i stand til at estimere den absolutte risikoændring i stedet for relativ risikoændring med modellen (1). SAS-koden i blev brugt til at passe til modellen, der producerer estimatet for , dens standardfejl, og varians-kovariansmatri.. Værdierne blev beregnet under normal antagelse. Yderligere SAS-kode blev skrevet for at beregne estimatet af kumulativ baselinefare og dens standardfejl baseret på . De kumulative farefunktionsestimater blev estimeret på grundlag af modellen (1). Den resterende Co. – Snell blev evalueret for hvert individ på den observerede overlevelsestid., Specifikt , for et individ med observeret overlevelsestid , hændelsesindikator og kovariat, den resterende estimeres af . Hvis modellen (1) er korrekt, skal ‘s følge en enhed eksponentiel fordeling med højre censurering . Fordi enhedens eksponentielle distribution har den egenskab, at dens kumulative farefunktion er identitetsfunktionen, kan man bruge denne egenskab til at kontrollere godheden af pasform til additivmodellen. Vi har derfor beregnet Nelson – Aalen-estimaterne af kumulative farer på dataene for alle emner., I SAS kan dette opnås ved at bruge proc phreg med baseline-sætning og metode=ch-indstilling i erklæringen (kode findes i online-materialer). Plottet af de estimerede kumulative farer på restene versus restene blev genereret, hvor en tæt på 45 graders linje forventes, hvis modellen (1) er sand.

Model (1) antager, at kovariatets virkning er konstant på farefunktionen, men det kan faktisk generaliseres til enhver kendt parametrisk form, der muligvis er tidsafhængig., Vi overvejede også en mere generel additivfaremodel, der gør det muligt for kovariatets koefficienter at være tidsafhængige og ikke-parametriske, hvor . I modsætning til model (1), den nye model gør ingen antagelse om form af . Den asymptotiske teori om denne model blev undersøgt i . En SAS-Makro, der blev leveret i, blev brugt til at passe til modellen, som giver estimaterne af og deres standardfejlestimater. Estimaterne for mængder har lukkede formløsninger., er den kumulative baseline hazard og er den overskydende kumulative risici på tid , som er defineret fra tid 0 til maksimal tid, hvor design-matrix baseret på kovariater, og de observerede gange er fuld rang . Hvis er en indikator (0/1) for nogle, giver estimatet af det ekstra kumulative farestimat på tidspunktet for at være i gruppen , mens du justerer for de andre kovariater. Den ikke-parametriske additivfaremodel blev justeret for de samme kovariater som i den semiparametriske additivfaremodel., Tilsvarende Co. – Snell resterende plot som i den semiparametriske model blev genereret med den forskel, at alle rester til den ikke-parametriske additivmodel blev censureret på det maksimale tidspunkt.

Traditionelle Cox proportional hazard-modeller for hændelsen påvisning af kræftfremkaldende og enhver HPV, som indeholder de samme kovariater, som tidligere nævnt, blev kørt til sammenligning med den additive modeller. Alle de statistiske analyser blev udført ved hjælp af SAS 9.1.3, og plottene blev genereret med R 2.9.2. Computerkoden kan do .nloades på https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.

3., Resultater

Cox proportional hazard model for hændelsen påvisning af kræftfremkaldende HPV viste, at HIV-positive kvinder med CD4 > 500 havde en hazard ratio (HR) 1.62 med 95% konfidens interval (CI) 1,31-2.00 i forhold til HIV-negative kvinder. Den tilsvarende Timer, og 95% CIs sammenligne HIV-positive kvinder med CD4 200-500 og CD4 < 200, ved hjælp af HIV-negative kvinder, som reference gruppe, var 2.49 (CI: 2.04–3.03) og 3.82 (CI: 3.01–4.86), hhv., For-trenden blev beregnet ved at behandle HIV/CD4-gruppen som en ordinær variabel med fire niveauer (0 til 3) og var meget signifikant (). Derudover var alder negativt forbundet, og rygning var positivt forbundet med hændelsespåvisning af onkogen HPV. I modeller af hændelsen påvisning af eventuelle HPV, Timer og 95% CIs til HIV-positive kvinder med CD4 > 500, CD4 200-500, og CD4 < 200 blev 1.65 (CI: 1.39–1.96), 2.76 (CI: 2.33–3.27), og 3.40 (CI: 2.66–4.34), hhv. For trenden var mindre end 0.0001., Lignende væsentlige faktorer, som i hændelsen kræftfremkaldende HPV-blev fundet med yderligere resultater, at afro-Amerikanske kvinder havde højere forekomst af alle HPV end Kaukasiske kvinder, og antallet af mandlige seksuelle partnere i de sidste 6 måneder var positivt forbundet med hændelsen påvisning af eventuelle HPV.

disse ha .ard ratio adresserede imidlertid ikke det absolutte antal nye HPV-infektioner, der ville blive påvist med et fald i CD4-antal., Yderligere, kontrol af proportionalitet antagelse for Cox-modeller viser, at proportionalitet i fare funktion ikke holder, for de HIV-positive med CD4 < 200 i onkogene HPV-analyse (er) og til antallet af mandlige seksuelle partner i de sidste 6 måneder ≥3 i nogen HPV-analyse (). Af disse grunde anvendte vi additive ha .ards regressionsmodeller til dette datasæt.

den semiparametriske additivfaremodel for onkogen HPV er monteret, og resultaterne er angivet i tabel 1., HIV-positive kvinder med CD4 > 500 havde en ekstra fare på 0,03 end HIV-negative kvinder, som indebærer, at der i gennemsnit var der 3 flere kræftfremkaldende HPV-infektion tilfælde per 100 HIV-positive kvinder per år med CD4 > 500 i forhold til HIV-negative kvinder, HIV-positive kvinder med CD4 200-500 haft en stigning i fare 0.08; HIV-positive kvinder med CD4 < 200 haft en stigning i fare 0.14., Alle de stigninger i forhold til HIV-negative kvinder, der var statistisk signifikant (), og den stigende tendens med hensyn til HIV/CD4-gruppen var signifikant med værdi < 0.0001. Virkningerne af alder, race, rygning, og antallet af mandlige seksuelle partner i fortiden 6 måneder aftalt med dem fra den tilsvarende Co.model.

de estimerede overlevelsessandsynligheder for de fire HIV / CD4-lag justeret for andre kovariater fra den semiparametriske additivmodel er angivet i Figur 1(a). Det viser, at lavere CD4-tælling var forbundet med øget påvisning af onkogen HPV.,/p>


(a)

(b)


(a)
(b)

Figure 1

Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., Fra top til bund for hvert enkelt resultat og hver model passer til: HIV−, CD4 > 500, CD4: 200-500, og CD4 < 200.

den ikke-parametriske additivfaremodel blev også monteret på dataene. Variablerne i den ikke-parametriske regressionsmodel for additivfare havde samme statistiske signifikans som variablerne i den semiparametriske additivmodel og også variablerne i Co.proportional ha .ard regressionsmodellen med de samme kovariater., Figur 1(a), viser estimater for overlevelse sandsynligheder for kræftfremkaldende HPV-for de fire HIV/CD4 grupper: , , , for HIV-negative kvinder, HIV-positive kvinder med CD4 > 500, CD4 200-500, og CD4 < 200, henholdsvis, justeret for andre kovariater, hvor er den anslåede samlede baseline hazard og er den anslåede overskydende kumulative risiko, der er forbundet til hver CD4 stratum. Figur 1 (a) viser, at den semiparametriske model (model (1)) og de ikke-parametriske modeller (model (2)) generelt gav lignende skøn over kumulative farefunktioner., Især er afstandene mellem kurverne ens, hvilket indikerer, at disse to modeller gav tætte estimater af CD4-effekt.

I denne analyse baseret på model (2), den forventede overlevelse sandsynligheden for kræftfremkaldende HPV-over 5 års opfølgning blandt HIV-negative kvinder med en alder < 30, af den Kaukasiske race, som var ikke-rygere, og havde kun én mand seksuel partner i de sidste 6 måneder, var 0.80., Den tilsvarende kumulativ incidens var , hvilket indebærer, at over 5 års followup 20% af de HIV-negative kvinder med de tidligere nævnte karakteristika i det mindste havde en positiv test for kræftfremkaldende HPV -; den kumulative incidens af 5 års opfølgning var 0.33, 0.47, og 0,60 for CD4 > 500, CD4 200-500, og CD4 < 200 grupper, hhv., Således, for hver 100 kvinder med CD4 < 200, der var 40 flere kræftfremkaldende HPV-infektioner med 5 år i forhold til hver 100 HIV-negative kvinder, hvilket er en betydelig stigning i antallet af infektioner. Både semiparametric og nonparametric tilsætningsstof hazard modeller, der passer godt til dataene baseret på Cox-Snell resterende parceller (Figur 2): den anslåede samlede risiko kurver ca følg 45 graders linjer.

de samme analyser blev udført for enhver HPV (tabel 1)., Effekten skøn for HIV-positive kvinder med CD4 > 500, CD4 200-500, CD4 < 200 blev 0.09, 0.23, 0.30, henholdsvis med værdier, som er mindre end 0.0001 ( for trend < 0.0001). Fra nonparametric additive model (Figur 1(b)), forskellen i overlevelse af alle HPV-mellem CD4 200-500 og CD4 < 200-gruppen var ikke så markant som for overlevelse af onkogene HPV. De kumulative forekomster af enhver HPV efter 5 år var 0, 40, 0, 63, 0, 77, 0.,84 for HIV-negative kvinder, HIV-positive kvinder med CD4 > 500, CD4 200-500, CD4 < 200, hhv. Modellerne til additiv fare for enhver HPV passer også godt til dataene (figur 3).

4. Konklusion

i Denne undersøgelse anvendes to typer af tilsætningsstoffer hazard regression modeller: semiparametric og nonparametric tilsætningsstof farer regression modeller og en Cox proportional hazard model til analyse af HPV forekomsten afsløring af data i HIV-positive og HIV-negative kvinder, og i kontrast effekten anslår, er opnået ved hjælp af den statistiske metode., Alle modeller fandt meget signifikante sammenhænge mellem værtsimmunstatus og risiko for HPV-detektion af hændelser. Den semiparametric additive model viste, at i gennemsnit var der yderligere 14 kræftfremkaldende HPV-infektion tilfælde per 100 kvinde-år, der er relateret til CD4-tælling < 200 i forhold til HIV-negative kvinder, og nonparametric model viste en yderligere 40 kræftfremkaldende HPV-infektioner per 100 kvinder efter 5 års opfølgning.,

Mens der som forventet er den additive modeller havde meget lavere effekt estimater end Cox-model, de to tilgange, der henvender sig til forskellige spørgsmål, det er, Cox-modellen giver estimater for den relative risiko (på en multiplikativ skala), der henviser til, at den additive risiko modeller giver omtrentlige skøn for den, der kan henføres risiko (dvs, den absolutte forskel i tilfælde sats per enhed af ændringer i eksponering variabel) i sjældne tilfælde antagelse., Den henførbare risiko kan bruges til at bestemme den absolutte stigning i antallet af tilfælde, Det vil sige antallet af ekstra tilfælde af HPV-infektion, der opstod på grund af eksponering af interesse. De relative farer estimeret af Co. – modeller kan være særligt nyttige til at forstå foreningens størrelse, hvilket kan være vigtigt videnskabeligt; det vil sige, når basisfaren for sygdom er lav, kan det absolutte antal yderligere tilfælde relateret til eksponering være lille, men den relative risiko kan stadig være stærk., Den absolutte risiko kan dog være særlig nyttig til folkesundhedsplanlægning og intervention, når det faktiske antal yderligere tilfælde af en sygdom er af interesse.

Vi overvejede en semiparametrisk og en nonparametric additive ha .ard modeller. I forhold til den semiparametric tilsætningsstof hazard regression model, nonparametric tilsætningsstof hazard model giver covariate effekter at variere over tid nonparametrically og giver således et mere robust skøn af den kumulative risiko funktion end den semiparametric tilsætningsstof hazard model., Imidlertid bruger de ikke-parametriske modeller også mere statistiske frihedsgrader. Derfor, hvis den gennemsnitlige covariate effektiv skøn er af primær interesse semiparametric tilsætningsstof hazard model, der kunne bruges, men hvis man ønsker at undersøge, om nogle covariate effekter er varierende over tid, eller den samlede risiko funktion (eller den kumulative incidens) er af primær interesse, nonparametric tilsætningsstof hazard model kan være at foretrække.

Vi bemærker, at modellen foreslået af Lin og Ying er blevet udvidet til at omfatte både additive og multiplikative kovariate effekter ., Denne model kan f.eks. være nødvendig, når visse kovariater i en co. – proportionalfarer-model opfylder proportionalfarer-antagelsen, og andre ikke gør det. Fortolkningen af denne model er imidlertid ikke så ligetil som hverken Co. – modellen eller additivmodellerne.

selv om det teoretiske grundlag for modellerne med additiv fare er veletableret, og der findes computerkoder til montering af disse modeller, er de i mindre grad blevet anvendt end andre metoder til time-to-event-analyse., Dette kan til dels afspejle en vis manglende kendskab til disse modeller i det generelle forskningsmiljø. Fortsatte bestræbelser på at øge bevidstheden om disse statistiske metoder er nødvendige og bør overvejes af biostatisticians og epidemiologer involveret i undervisningen af den næste generation af forskere.

Tak

Dette arbejde blev delvist understøttet af NCI Tilskud 5R01CA085178, 1R21CA139388 og et tilskud fra Lupus Foundation of America., Data i dette papir, der blev indsamlet af Kvinder er med Andre HIV-Undersøgelse (WIHS); Collaborative Study Group med centre (forskningsledere) på New York City/Bronx Consortium (Kathryn Anastos); Brooklyn, NY (Howard Minkoff); Washington DC Metropolitan Consortium (Mary Unge); Connie Wofsy Undersøgelse Konsortium i det Nordlige Californien (Ruth Greenblatt); Los Angeles County/Southern California Consortium (Alexandra Levine); Chicago Consortium (Mardge Cohen); Data Coordinating Center (Stephen Gange)., Den WIHS er finansieret af National Institute of Allergy and Infectious Diseases (UO1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993, og UO1-AI-42590) og af Eunice Kennedy Shriver National Institute of Child Health and Human Development (UO1-HD-32632). Undersøgelsen samfinansieres af National Cancer Institute, National Institute on Drug Abuse og National Institute on døvhed og andre kommunikationsforstyrrelser. Finansiering ydes også af National Center for Research Resources (UCSF-CTSI Grant no. UL1 RR024131)., Indholdet af denne publikation er udelukkende forfatterens ansvar og repræsenterer ikke nødvendigvis de officielle synspunkter fra National Institutes of Health. Yderligere blev der ydet støtte af Einstein-Montefiore Center for AIDS-Forskning (P30-AI-51519), Institut for Klinisk og Translationel Forskning (UL1RR025750), og Albert Einstein Cancer Center.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Videre til værktøjslinje