Abstrakt
Existuje několik statistických metod pro časově-události, analýzy, mezi které je Cox proporcionálních rizik model, který se nejčastěji používá. Nicméně, když absolutní změna v nebezpečí, místo toho, poměr rizik, je primární zájem, nebo když je úměrná nebezpečnosti předpoklad pro Cox proporcionálních rizik modelu je porušena, aditivní riziko regresní model může být vhodnější., V tomto článku jsme se dát přehled tohoto přístupu a poté naneste semiparametrické stejně jako neparametrický aditivní model na souboru dat ze studie o přírodní historii lidského papilomaviru (HPV) u HIV pozitivní a HIV negativní ženy., Výsledky z semiparametrické modelu je uvedeno na průměru další 14 onkogenních HPV infekcí na 100 žena-let týkající se počtu CD4 < 200 relativní HIV-negativních žen, a ty, které z neparametrický aditivní model ukázal, dalších 40 onkogenních HPV infekcí na 100 žen v průběhu 5 let sledování, zatímco odhadovaný poměr rizik v Cox model byl 3.82. Ačkoli model Cox může poskytnout lepší pochopení asociace expozičních nemocí, aditivní model je často užitečnější pro plánování a intervenci veřejného zdraví.
1., Úvod
analýza času na událost se běžně používá ke studiu rizikových faktorů spojených s výskytem klinických příhod . Jako koncové body se často používají například vývoj času k nemoci, čas k hospitalizaci, čas k relapsu/recidivě a čas k smrti. Nicméně, existuje několik různých modelů pro měření vztahu time-to-data událostí s rizikovými faktory, včetně parametrické, semiparametrické a neparametrické modely. V parametrických modelech se předpokládá rozdělení času na událost (např.,, exponenciální, gama, nebo Weibullova rozdělení), a to je dále předpokládal, že existuje lineární vztah mezi logaritmem času na akce a proměnné v modelu. Síla asociace se pak odhaduje pomocí přístupu s maximální pravděpodobností. V semiparametrické modely, zejména Cox úměrné nebezpečí regrese modely , výstražná funkce se předpokládá, že budou násobně souvisí s proměnnými, s nespecifikované základní nebezpečnosti funkce, a maximální dílčí pravděpodobnost metoda se používá k odhadu parametrů., V neparametrické modely, především Kaplan-Meier přístup, ne domněnky, pokud jde o vztah mezi rizikem onemocnění a kovariancí. Místo, funkce přežití pro každou vrstvu z proměnné odhaduje se empirické metody, a log-rank test a další neparametrické testy se obvykle používají k testování účinků těchto proměnných.
známá, ale méně často používaná metoda pro analýzu dat z času na událost je aditivní regresní model nebezpečnosti ., Na rozdíl od proporcionálního rizika modelu, který odhaduje poměry rizik, aditivní model odhaduje, že rozdíl v nebezpečnosti: změna nebezpečnosti funkce v důsledku vystavení úroků nebo řečeno jednodušeji absolutní rozdíl v okamžité selhání sazba na jednotku změny v expozici proměnné. Na základě odhadu rozdílu v nebezpečnosti lze dále odhadnout změnu kumulativního výskytu: pokud je kumulativní riziko malé (např.,, vzácné příhody), změna kumulativního rizika přibližuje rozdíl v riziku onemocnění v důsledku expozice,tj. Pokud je tedy přisuzovatelné riziko primárního zájmu nebo je porušen předpoklad proporcionálního rizika, může být vhodnější model regrese aditivního rizika. Vzhledem k tomu , že neparametrický aditivní model byl původně navržen Aalenem, došlo k rozsáhlým výzkumům na toto téma ., Regresní modely aditivních rizik však zůstávají ve veřejném zdraví a lékařském výzkumu nevyužité především kvůli nedostatečné znalosti modelů a nedostatku znalostí o tom, jak implementovat modely pomocí stávajícího softwaru. V tomto článku uvádíme příklad pro ilustraci použití dvou aditivních modelů pomocí stávajícího statistického softwaru (jsou k dispozici programové kódy).
motivujícím příkladem tohoto článku byla studie přirozené anamnézy infekce lidským papilomavirem (HPV) u HIV pozitivních a HIV negativních žen., Předchozí analýze tohoto souboru dat použita Coxova proporčního modelu rizika posoudit vztah incidentu HPV detekce s hostitelskou imunitní stav měřeno HIV než sérová hranice a počet CD4 . V tomto článku jsme analyzovali aktualizovanou verzi tohoto stejného souboru dat se čtyři roky o další návaznosti, používání doplňkové látky nebezpečí regresní modely pro odhad připadající riziko HPV infekce související se změnami v imunitní stav a pak kontrastoval tyto výsledky s výsledky pomocí Coxova modelu.
2. Metody
2.1 ., Data
údaje byly získány od Žen Mezirezortní HIV Studie (WIHS), velké průběžné, multi-institucionální observační studie s. pololetní klinické follow-up návštěvy, které zahrnují sbírku exfoliovaných buněk děložního čípku HPV DNA testování a Pap testy. Bylo tam 3766 žen (2791 HIV+, 975 HIV−); dvě třetiny z nich byly zapsány v letech 1994-95 a zbytek v letech 2001-02. Podrobnosti o zápisu a metodách studie byly dříve hlášeny ., Po vyloučení těch žen, kteří měli HIV sérokonverze v průběhu sledování, měla hysterektomii před zápis v WIHS, postrádal HPV údajů v návaznosti, nebo pozitivní testy na onkogenní HPV na základní linii, počet žen k dispozici pro aktuální analýzu incidentu detekce onkogenních HPV byla 2386 (1672 HIV+, 714 HIV−). Onkogenní typy HPV zahrnovaly HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, a 68., Také jsme studovali incidentu detekce HPV ve více žen, které byly vyloučeny, protože byly zjištěny pozitivní pro všechny typy HPV na počátku; odpovídající počet žen byl 1733 (1116 HIV+, 617 HIV−). Tato datová sada představuje aktualizaci z 8 dalších návštěv (další 4 roky sledování).
čas od času byla detekce HPV odhadnuta pomocí midintervalu mezi poslední HPV-negativní návštěvou a první HPV-pozitivní návštěvou. Čas od času byla detekce onkogenního nebo jakéhokoli HPV analyzována Samostatně., Primární expozice proměnná hostitele imunitní stav charakterizován HIV status a počet CD4: HIV-negativní, HIV-pozitivní s počet CD4 vyšší než 500, počet CD4 mezi 200 a 500, a počet CD4 menší než 200. Další proměnné zahrnuté věku (<30, 30-34, 35-39, 40-44, ≥45 let), rasy (bílé, černé, Hispánské, jiné), kouření (nikdy, bývalé, současné), a počet mužské sexuální partner v posledních 6 měsících (0, 1, 2, ≥3).
2.2. Byly zváženy statistické metody
dva modely nebezpečnosti pro doplňkové látky., První model byl semiparametrické doplňkové látky nebezpečnosti model, kde je podmíněná míra rizika daného předmětu s veličinou je počet proměnných, je neznámý baseline hazard funkce, a je známo, čas-nezávislé koeficienty. V této studii jsme zvažovali pouze časově nezávislé kovariáty, všechny na začátku. Byly studovány obecnější formy modelu (1) s kovariáty závislými na čase , což ukázalo, že odhady a jsou konzistentní a asymptoticky normální., Všimněte si, že model (1) má podobnou formu do Cox úměrné nebezpečí regrese model: oba modely mají nespecifikované základní nebezpečnosti funkci a čas-nezávislé koeficienty, i když Cox model je definován na multiplikativní měřítku, zatímco aditivní riziko model je definován na aditivní škále. Na rozdíl od Cox úměrné nebezpečí regrese model, který vyžaduje numerické iterace v odhadu regresních parametrů, již zmíněný semiparametrické přídatná látka nebezpečí regresní model má uzavřený tvar řešení pro odhad regresních parametrů., Jsme schopni odhadnout absolutní změnu rizika namísto relativní změny rizika s modelem (1). Kód SAS v byl použit, aby se vešly model , který produkuje odhad pro, jeho standardní chyba, a rozptyl-kovariance matice. Hodnoty byly vypočteny za normálního předpokladu. Další kód SAS byl napsán pro výpočet odhadu kumulativního základního rizika a jeho standardních chyb na základě . Odhady kumulativní funkce nebezpečnosti byly odhadnuty na základě modelu (1). Zbytkový Cox-Snell byl hodnocen pro každý subjekt v době jeho pozorovaného přežití., Konkrétně u subjektu s pozorovanou dobou přežití, indikátorem události a kovariátem se zbytková hodnota odhaduje . Pokud je model (1) správný, měly by se ‚s řídit exponenciální distribucí jednotky se správným cenzurováním . Protože exponenciální rozdělení jednotky má tu vlastnost, že jeho kumulativní funkcí nebezpečnosti je funkce identity, lze tuto vlastnost použít ke kontrole dobroty vhodné pro aditivní model. Vypočítali jsme proto odhady kumulativních rizik Nelson-Aalen na datech pro všechny subjekty., V SAS to lze získat pomocí proc phreg s baseline statement a method=ch option v prohlášení (kód je uveden v online materiálech). Děj odhadované kumulativní nebezpečí na rezidua versus rezidua byla generována, v jehož blízkosti 45 stupňů linie se očekává, že pokud model (1) je pravdivý.
Model (1) předpokládá, že účinek kovariátu je konstantní na funkci nebezpečnosti, ale ve skutečnosti může být zobecněn na jakoukoli známou parametrickou formu, která je možná závislá na čase., Jsme také považován za obecnější doplňkové látky nebezpečnosti model, který umožňuje koeficienty kovariance být závislé na čase a neparametrické, kde . Na rozdíl od modelu (1), nový model nemá žádný předpoklad, pokud jde o formu . Asymptotická teorie tohoto modelu byla studována v. Makro SAS poskytnuté v byl použit, aby se vešly model, který dává odhady a jejich standardní odhady chyb. Odhady pro množství mají uzavřené formy řešení., je kumulovaný základní nebezpečí a jsou přebytečné kumulativní rizika v době , které jsou definovány od času 0 do maximální čas, ve kterém design matrix na základě proměnných a pozorovaných časů je plné hodnosti . Pokud je indikátor (0/1) pro některé , odhad dává další kumulativní nebezpečí odhad na čas, za to, že ve skupině při nastavování pro jiné proměnné. Neparametrický doplňkové látky nebezpečnosti modelu byla upravena pro stejné proměnné jako v semiparametrické aditivní riziko modelu., Podobné Cox-Snell zbytkové děj jako v semiparametrické model byl vytvořen s tím rozdílem, že všechny zbytky pro neparametrické aditivní model byly cenzurovány, na maximální dobu .
Tradiční Cox úměrné nebezpečí modely za incident detekce onkogenních a případné HPV, zahrnující stejné proměnné jak již bylo zmíněno, byly pro srovnání aditivní modely. Všechny statistické analýzy byly provedeny pomocí SAS 9.1.3 a pozemky byly vytvořeny s R 2.9.2. Kód počítače lze stáhnout na https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.
3., Výsledky
Cox úměrné nebezpečí model za incident detekce onkogenních HPV ukázaly, že HIV-pozitivní ženy s CD4 > 500 měl poměr rizik (HR) 1.62 s 95% intervalem spolehlivosti (CI) 1.31 až 2.00 vzhledem k HIV-negativních žen. Odpovídající Hodin a 95% CIs srovnání HIV-pozitivních žen s CD4 200-500 a CD4 < 200, pomocí HIV-negativních žen jako referenční skupina, byly 2.49 (CI: 2.04–3.03) a 3.82 (CI: 3.01–4.86), resp., Trend for byl vypočítán léčbou skupiny HIV / CD4 jako pořadové proměnné se čtyřmi úrovněmi (0 až 3) a byl velmi významný (). Kromě toho, věk byl negativně spojen, a kouření bylo pozitivně spojeno s incidentem detekce onkogenních HPV. V modelech incidentu detekce HPV, Hodin a 95% CIs pro HIV-pozitivních žen s CD4 > 500, CD4 200-500, a CD4 < 200 byly 1.65 (CI: 1.39–1.96), 2.76 (CI: 2.33–3.27), a 3.40 (CI: 2.66–4.34), resp. For trend byl menší než 0.0001., Podobné významné faktory, jako v incidentu onkogenní HPV byly nalezeny s další zjištění, že Africké Americké ženy měly vyšší výskyt jakékoliv HPV než bělošky, a počet mužských sexuálních partnerů za posledních 6 měsíců byla pozitivně spojena s incidentem detekce HPV.
tyto poměry nebezpečnosti se však nezabývaly absolutním počtem nových infekcí HPV, které by byly detekovány se snížením počtu CD4., Dále, kontrola přiměřenosti předpoklad pro Cox modelů ukazuje, že přiměřenost nebezpečnosti funkce neplatí pro HIV pozitivní, s CD4 < 200 v onkogenní HPV analýzy () a pro počet mužské sexuální partner v posledních 6 měsících o ≥3 v každém HPV analýzy (). Z těchto důvodů jsme na tuto datovou sadu použili regresní modely aditivních rizik.
semiparametrické doplňkové látky nebezpečnosti model pro onkogenní HPV byl vybaven, a výsledky jsou uvedeny v Tabulce 1., HIV-pozitivní ženy s CD4 > 500 měl další nebezpečí 0,03 než HIV-negativních žen, což znamená, že v průměru byly tam 3 další onkogenní HPV infekce případů na 100 HIV pozitivních žen za rok s CD4 > 500 ve srovnání s HIV-negativní ženy; HIV-pozitivních žen s CD4 200-500 měli nárůst nebezpečí 0.08; HIV-pozitivní ženy s CD4 < 200 měli nárůst nebezpečí 0.14., Všechny zvyšuje relativní HIV-negativních žen byly statisticky významné (), a rostoucí trend s ohledem na HIV/CD4 skupiny byl významný s hodnotou < 0.0001. Účinky věku, rasa, kouření, a počet mužských sexuálních partnerů v minulosti 6 měsíce souhlasil s těmi z odpovídajícího modelu Cox.
odhad pravděpodobnosti přežití pro čtyři HIV/CD4 vrstvy upraveny pro jiné proměnné z semiparametrické aditivní model jsou uvedeny na Obrázku 1(a). Ukazuje, že nižší počet CD4 byl spojen se zvýšenou detekcí onkogenního HPV.,/p>
(a)
(b)
(a)
(b)
Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., Od shora dolů pro každý výsledek a každý model fit: HIV−, CD4 > 500, CD4: 200-500 a CD4 < 200.
k údajům byl také namontován neparametrický model nebezpečnosti doplňkové látky. Proměnné v neparametrické přídatná látka nebezpečí regresní model měl podobné statistické významnosti pro ty, v semiparametrické aditivní model a také těm, v Cox úměrné nebezpečí regrese model se stejnými proměnnými., Obrázek 1(a) ukazuje odhady přežití a pravděpodobnost, že onkogenní HPV pro čtyři HIV/CD4 skupin: , , , pro HIV negativní ženy, HIV-pozitivní ženy s CD4 > 500, CD4 200-500, a CD4 < 200, respektive upravit pro jiné proměnné, kde je odhadovaná kumulativní základní nebezpečí a je odhadovaná přebytečná kumulativní riziko spojené pro každou CD4 vrstvě. Obrázek 1(a) ukazuje, že semiparametrické model (model (1)) a neparametrické modely (model (2)) v obecné dal podobné odhady kumulativní nebezpečí funkce., Zejména jsou vzdálenosti mezi křivkami podobné, což naznačuje, že tyto dva modely poskytly úzké odhady efektu CD4.
V této analýze založené na modelu (2), odhaduje pravděpodobnost přežití onkogenních HPV v průběhu 5 let sledování u HIV-negativních žen s věkem < 30, Kavkazské rasy, kteří byli nekuřáci, a měl jen jedno mužské sexuální partner v posledních 6 měsících, byl 0.80., Odpovídající kumulativní incidence byla , což znamená, že více než 5 let navazující 20% HIV-negativních žen s dříve uvedenými vlastnostmi měl alespoň jeden pozitivní test na onkogenní HPV; kumulativní incidence o 5 let sledování byly 0,33, 0.47, a 0,60 pro CD4 > 500, CD4 200-500, a CD4 < 200 skupin, respektive., Tak, že na každých 100 žen s CD4 < 200, tam byly 40 více onkogenních HPV infekcí rok 5 v porovnání s každých 100 HIV-negativních žen, což je výrazný nárůst počtu infekcí. Jak semiparametrické a neparametrické přídatná látka nebezpečí modely se vešly data založené na Cox-Snell zbytkové pozemky (Obrázek 2): odhadované kumulativní riziko křivky přibližně postupujte 45 stupňů linie.
stejné analýzy byly provedeny u všech HPV (Tabulka 1)., Účinek odhady pro HIV-pozitivních žen s CD4 > 500, CD4 200-500, CD4 < 200 byl 0,09, 0.23, 0.30, respektive s hodnotami méně než 0,0001 ( pro trend < 0.0001). Z neparametrický aditivní model (viz Obrázek 1(b)), rozdíl v přežití HPV mezi CD4 200-500 a CD4 < 200 skupina není tak významná jako, že pro přežití onkogenních HPV. Kumulativní výskyt jakéhokoli HPV po 5 letech byl 0, 40, 0, 63, 0, 77, 0.,84 u HIV negativních žen, HIV pozitivních žen s CD4 >500, CD4 200-500, CD4 < 200. Modely aditivního rizika pro jakýkoli HPV také dobře zapadají do dat (obrázek 3).
4. Závěr
Tato studie aplikuje dva typy aditivní riziko regresní modely: semiparametrické a neparametrické přídatná látka nebezpečí regresní modely a Cox úměrné nebezpečí model k analýze HPV výskyt zjišťování dat za HIV pozitivní a HIV negativní ženy a kontrastu efekt odhady získané pomocí jednotlivých statistický přístup., Všechny modely našly velmi významné asociace mezi imunitním stavem hostitele a rizikem incidentní detekce HPV. Na semiparametrické aditivní model ukázal, že v průměru tam bylo dalších 14 onkogenních HPV infekce případů na 100 žena-let týkající se počtu CD4 < 200 relativní HIV-negativních žen, a neparametrický model ukázal, dalších 40 onkogenních HPV infekcí na 100 žen po 5 letech sledování.,
Zatímco, jak se očekávalo aditivní modely měly mnohem nižší účinek, než odhady Cox model, dva přístupy k řešení různých otázek; to znamená, že Cox model poskytuje odhady relativní riziko (na multiplikativní měřítku), vzhledem k tomu, že přídatná látka nebezpečí modely poskytují přibližné odhady pro připadající rizika (tj., absolutní rozdíl v případě, že sazba za jednotku změny v expozici proměnné) pod vzácná událost nanebevzetí panny marie., Přičitatelné riziko lze použít k určení absolutního nárůstu počtu případů, tedy počtu dalších případů infekce HPV, ke kterým došlo v důsledku vystavení zájmu. Relativní rizika, odhadují Cox modely mohou být obzvláště užitečné v pochopení velikosti sdružení, které může být důležité vědecky; to je, když základní riziko nemoci je nízké absolutní počet dodatečných případů týkajících se expozice může být malý, ale relativní riziko může být stále silný., Absolutní riziko však může být zvláště užitečné pro plánování a intervenci veřejného zdraví, pokud je zajímavý skutečný počet dalších případů onemocnění.
uvažovali jsme o poloparametrických a neparametrických modelech nebezpečnosti aditiv. Ve srovnání s semiparametrické přídatná látka nebezpečí regresní model, neparametrické doplňkové látky nebezpečnosti model umožňuje účinky těchto proměnných se mění v průběhu času nonparametrically, a tak poskytuje více robustní odhad kumulativní riziko funkci, než semiparametrické aditivní riziko modelu., Neparametrické modely však také používají více statistických stupňů volnosti. Proto, pokud je průměrná kovariance efektivní odhady jsou primární zájem semiparametrické doplňkové látky nebezpečnosti model by mohl být použit, ale pokud někdo chce zkoumat, zda je či není některé účinky těchto proměnných jsou různé v průběhu času, nebo kumulativní riziko funkce (nebo kumulativní incidence rate) je primární zájem, neparametrické doplňkové látky nebezpečnosti model může být výhodné.
Upozorňujeme, že model navržený Lin a Ying byl rozšířen tak, aby zahrnoval jak aditivní, tak multiplikativní kovariátové účinky ., Tento model může být nezbytný, například, když určité kovariáty v modelu Cox proporcionální nebezpečí splňují předpoklad proporcionálních rizik a jiné ne. Interpretace tohoto modelu však není tak přímočará jako model Cox nebo aditivní modely.
stručně řečeno, i když teoretický základ pro doplňkové látky nebezpečí modelů je dobře zavedený a počítačové kódy pro šroubení tyto modely jsou k dispozici, jsou méně často používány než jiné metody time-to-event analýzy., To může částečně odrážet míru neznalosti těchto modelů v obecné výzkumné komunitě. Je zapotřebí pokračovat v úsilí o zvýšení povědomí o těchto statistických metodách a měli by je zvážit biostatisté a epidemiologové, kteří se podílejí na výuce nové generace výzkumných pracovníků.
tato práce byla částečně podpořena granty NCI 5r01ca085178, 1r21ca139388 a grantem od Lupus Foundation of America., Údaje v tomto dokumentu byly shromážděny Ženy Mezirezortní HIV Studie (WIHS); Collaborative Study Group s centrech (hlavní zkoušející) v New Yorku/Bronx Consortium (Kathryn Anastos); Brooklyn, NY (Howard Minkoff); Washington DC Metropolitní Consortium (Mary Young); Connie Wofsy Studie Konsorcia ze Severní Kalifornie (Ruth Greenblatt); Los Angeles County/Jižní Kalifornii Consortium (Alexandra Levina); Chicago Consortium (Mardge Cohen); Údaje Koordinačního Centra (Stephen Gange)., Na WIHS je financován z Národního Institutu pro Alergie a Infekční Choroby (UO1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993, a UO1-AI-42590) a Eunice Kennedy Shriver National Institute of Child Health and Human Development (UO1-HD-32632). Studie je spolufinancována Národním onkologickým Ústavem, Národním institutem pro zneužívání drog a Národním institutem pro hluchotu a další poruchy komunikace. Financování zajišťuje také Národní centrum pro výzkumné zdroje (UCSF-CTSI Grant no. UL1 RR024131)., Obsah této publikace je výhradně odpovědností autorů a nemusí nutně představovat oficiální názory národních zdravotnických ústavů. Další podpora byla poskytována Einstein-Montefiore Centrum pro Výzkum AIDS (P30-AI-51519), Institut Klinické a Translační Výzkum (UL1RR025750), a Albert Einstein Cancer Center.