modele de regresie a pericolelor aditive: o aplicație la istoricul Natural al papilomavirusului uman

Abstract

există mai multe metode statistice pentru analiza timpului până la eveniment, printre care se numără Modelul Cox de pericole proporționale care este cel mai frecvent utilizat. Cu toate acestea, atunci când modificarea absolută a riscului, în locul raportului de risc, este de interes primar sau atunci când ipoteza proporțională de risc pentru modelul de risc proporțional Cox este încălcată, un model de regresie a riscului aditiv poate fi mai adecvat., În această lucrare, ne da o imagine de ansamblu a acestei abordări și apoi se aplică un semiparametric precum și o neparametrice aditiv model pentru un set de date dintr-un studiu de istorie naturală de papilomavirus uman (HPV) în HIV-pozitive și HIV-negative femei., Rezultatele de la semiparametric modelul indicat în medie, o suplimentare de 14 oncogene de HPV infectii pe 100 de ani-femei legate de numărul de celule CD4 < 200 relativă a HIV-negative femei, și cei de la neparametrice aditiv modelul arătat o suplimentare de 40 de HPV oncogene infecții la 100 de femei de peste 5 ani de urmărire, în timp ce estimarea ratei de risc în model Cox a fost 3.82. Deși modelul Cox poate oferi o mai bună înțelegere a Asociației bolilor de expunere, modelul aditiv este adesea mai util pentru planificarea și intervenția sănătății publice.

1., Introducere

analiza timpului până la eveniment este frecvent utilizată pentru a studia factorii de risc asociați cu incidența evenimentelor clinice . De exemplu, dezvoltarea timpului până la boală, timpul până la spitalizare, timpul până la recidivă/recurență și timpul până la moarte sunt utilizate frecvent ca criterii finale. Cu toate acestea, există mai multe modele diferite pentru măsurarea relației datelor timp-eveniment cu factorii de risc, inclusiv modele parametrice, semiparametrice și neparametrice. În modelele parametrice, se presupune o distribuție pentru timp până la eveniment (de ex.,, o distribuție exponențială, gamma sau Weibull) și se presupune în continuare că există o relație liniară între logaritmul timpului la eveniment și covariatele din model. Puterea asocierii este apoi estimată folosind abordarea probabilității maxime. În semiparametric modele, cele mai multe în special Cox hazardului proporțional modele de regresie , în pericol funcția este presupus a fi multiplicatively legate de covariabilele, cu un număr nespecificat de referință pericol funcție, iar cea maximă parțială probabilitatea metodă este folosită pentru a estima parametrii., În modelele neparametrice, în special abordarea Kaplan-Meier, nu se fac presupuneri cu privire la relația dintre riscul de boală și covariabile. În schimb, funcția de supraviețuire pentru fiecare strat de covariabilele este estimat cu metode empirice, și log-rank test și a altor teste neparametrice sunt de obicei folosite pentru a testa efectele acestor variabile.o metodă bine cunoscută, dar mai puțin frecvent utilizată pentru analizarea datelor de timp până la eveniment este un model de regresie a pericolelor aditive ., Spre deosebire de modelul de risc proporțional care estimează ratele de risc, un model aditiv estimează diferența de risc: modificarea funcției de pericol datorată expunerii de interes sau a declarat mai simplu diferența absolută a ratei de eșec instantaneu pe unitate de modificare a variabilei de expunere. Pe baza estimării diferenței de pericole, se poate estima în continuare modificarea incidenței cumulative: atunci când pericolul cumulativ este mic (de ex.,, evenimente rare), modificarea pericolului cumulativ aproximează diferența de risc de boală datorată expunerii, adică riscul atribuibil datorat expunerii. Prin urmare, atunci când riscul atribuibil este de interes primar sau ipoteza proporțională de pericol este încălcată, un model de regresie a pericolului aditiv poate fi mai adecvat. Deoarece modelul aditiv neparametric a fost inițial propus de Aalen , au existat cercetări ample pe această temă ., Cu toate acestea, modelele de regresie a pericolelor aditive rămân insuficient utilizate în sănătatea publică și cercetarea medicală, în primul rând din cauza lipsei de familiarizare cu modelele și a lipsei de cunoștințe despre modul de implementare a modelelor folosind software-ul existent. În această lucrare, oferim un exemplu pentru a ilustra aplicarea a două modele aditive folosind software-ul statistic existent (codurile de program sunt furnizate). exemplul motivant al acestei lucrări a fost un studiu al istoriei naturale a infecției cu papilomavirus uman (HPV) în rândul femeilor pozitive și negative ale virusului imunodeficienței umane (HIV)., Analiza anterioară a acestui set de date a utilizat modelul de risc proporțional Cox pentru a evalua relația dintre detectarea incidentă a HPV și statusul imun gazdă, măsurată prin serostatul HIV și numărul de CD4 . În această lucrare, am analizat o versiune actualizată a aceluiași set de date cu patru ani de urmărire suplimentară, folosind modele de regresie a riscurilor aditive pentru a estima riscul atribuibil de infecție cu HPV legat de modificările statusului imunitar și apoi am contrastat aceste rezultate cu rezultatele folosind modelul Cox.

2. Metode

2.1., Datele

datele au fost obținute din studiul Women ‘ s Interagency HIV (WIHS), un amplu studiu observațional multi-instituțional în curs de desfășurare, cu vizite clinice semianuale de urmărire care includ colectarea de celule cervicale exfoliate pentru testarea ADN HPV și testele Papanicolau. Au fost 3766 de femei (2791 HIV+, 975 HIV -); două treimi dintre acestea au fost înrolate în 1994-95, iar restul în 2001-02. Detalii privind înscrierea și metodele de studiu au fost raportate anterior ., După excluderea acele femei care au avut seroconversie HIV în urmărire, a avut histerectomie înainte de înscrierea în WIHS, lipsit de HPV date în urmărire, sau testat pozitiv pentru HPV oncogene la momentul inițial, numărul de femei disponibile pentru analiza actuală a incidentului de detectare a HPV oncogene a fost 2386 (1672 HIV+, 714 HIV). Tipurile oncogene de HPV au inclus HPV16, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, și 68., Am studiat, de asemenea, detectarea incidentelor oricărui HPV în care mai multe femei au fost excluse din cauza faptului că au fost detectate pozitiv pentru orice tip de HPV la momentul inițial; numărul corespunzător de femei a fost 1733 (1116 HIV+, 617 HIV−). Acest set de date reprezintă o actualizare de la cu 8 vizite suplimentare (4 ani suplimentari de urmărire).detectarea timpului până la incident a HPV a fost estimată utilizând midinterval între ultima vizită HPV-negativă și prima vizită HPV-pozitivă. Detectarea timpului până la incident a ONCOGENICULUI sau a oricărui HPV a fost analizată separat., Variabila de expunere primară a fost statusul imun gazdă caracterizat prin statusul HIV și numărul de CD4: HIV-negativ, HIV-pozitiv cu un număr de CD4 mai mare de 500, Numărul de CD4 între 200 și 500 și numărul de CD4 mai mic de 200. Suplimentare variabile incluse vârstă (<30, 30-34, 35-39, 40-44, ≥45 ani), rasa (albi, negri, Hispanici, alte), fumatul (nu, foști, actuali), și numărul de sex masculin partener de sex în ultimele 6 luni (0, 1, 2, ≥3).

2. 2. Metode statistice

au fost luate în considerare două modele de risc aditiv., Primul model a fost semiparametric aditiv pericol în cazul în care modelul este condiționată rată de risc de la un subiect dat cu covariate este numărul de variabile, este necunoscut bază de pericol funcție, și este necunoscut independentă de timp coeficienți. În acest studiu, am luat în considerare doar covariatele independente de timp, toate la momentul inițial. Mai multe forme generale ale modelului (1) cu covariabile dependente de timp au fost studiate în , care a arătat că estimările și sunt consistente și asimptotic normale., Rețineți că modelul (1) are o formă similară cu modelul de regresie proporțională a pericolului Cox: ambele modele au o funcție de hazard de bază nespecificată și coeficienți independenți de timp, deși modelul Cox este definit pe o scară multiplicativă, în timp ce modelul de pericol aditiv este definit pe o scară aditivă. Spre deosebire de modelul Cox de regresie proporțională a pericolelor care necesită iterații numerice în estimarea parametrilor de regresie, modelul semiparametric de regresie a pericolelor aditive menționat anterior are o soluție de formă închisă pentru estimarea parametrilor de regresie., Putem estima schimbarea absolută a riscului în loc de schimbarea relativă a riscului cu modelul (1). Codul SAS a fost utilizat pentru a se potrivi modelului , care produce estimarea pentru, eroarea sa standard și matricea varianței-covarianței. Valorile au fost calculate în funcție de ipoteza normală. Codul SAS suplimentar a fost scris pentru a calcula estimarea riscului cumulativ de referință și erorile sale standard bazate pe . Estimările cumulative ale funcției de pericol au fost estimate pe baza modelului (1). Reziduul Cox-Snell a fost evaluat pentru fiecare subiect în timpul său de supraviețuire observat., Mai exact, pentru un subiect cu timp de supraviețuire observat, indicator de eveniment și covariat, reziduul este estimat de . Dacă modelul (1) este corect, ” s ar trebui să urmeze o distribuție exponențială unitate cu cenzura dreapta . Deoarece distribuția exponențială a unității are proprietatea că funcția sa de pericol cumulativ este funcția de identitate, se poate folosi această proprietate pentru a verifica bunătatea potrivirii pentru modelul aditiv. Prin urmare, am calculat estimările Nelson-Aalen ale pericolelor cumulative asupra datelor pentru toți subiecții., În SAS, acest lucru poate fi obținut prin utilizarea proc phreg cu declarația de bază și metoda=ch opțiune în declarația (codul este furnizat în materiale online). A fost generat graficul pericolelor cumulative estimate asupra reziduurilor față de reziduuri, în care se așteaptă o linie apropiată de 45 de grade dacă modelul (1) este adevărat.

Modelul (1) presupune că efectul covariatului este constant asupra funcției de pericol, dar de fapt poate fi generalizat la orice formă parametrică cunoscută care este posibil dependentă de timp., De asemenea, am considerat un model de pericol aditiv mai general care permite coeficienților covariatului să fie dependenți de timp și neparametrici, unde . Spre deosebire de modelul (1), noul model nu face nici o presupunere cu privire la forma . Teoria asimptotică a acestui model a fost studiată în . O macrocomandă SAS furnizată a fost utilizată pentru a se potrivi modelului, care oferă estimările și estimările standard de eroare. Estimările pentru cantități au soluții de formă închisă., este riscul cumulativ de bază și sunt pericolele cumulative în exces la timp, care sunt definite de la momentul 0 până la momentul maxim la care matricea de proiectare bazată pe covariabile și timpii observați este rangul complet . Dacă este un indicator (0/1) pentru unii , , estimarea dă estimarea riscului cumulativ suplimentar la timp pentru a fi în grup în timp ce ajustarea pentru celelalte covariabile. Modelul de pericol aditiv neparametric a fost ajustat pentru aceleași covariabile ca în modelul de pericol aditiv semiparametric., Un grafic rezidual Cox-Snell Similar modelului semiparametric a fost generat cu diferența că toate reziduurile pentru modelul aditiv neparametric au fost cenzurate la timpul maxim .modelele tradiționale de risc Cox proporțional pentru detectarea incidentelor oncogenice și a oricărui HPV, care încorporează aceleași covariabile ca cele menționate anterior, au fost rulate pentru comparație cu modelele aditive. Toate analizele statistice au fost realizate folosind SAS 9.1.3, iar parcelele au fost generate cu R 2.9.2. Codul computerului poate fi descărcat la https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1.

3., Rezultate

modelul Cox proporțional de risc pentru incidentul de detectare a HPV oncogene au arătat că femeile infectate cu HIV cu CD4 > 500 avut un hazard ratio (HR) 1.62 cu 95% interval de încredere (CI) 1.31 la 2.00 raport cu HIV-negative femei. Corespunzătoare Ore și 95% ic compararea femeile infectate cu HIV cu CD4 200-500 și CD4 < 200, folosind HIV-negativ femeile ca grup de referință, au fost 2.49 (CI: 2.04–3.03) și 3.82 (IÎ: 3.01–4.86), respectiv., Tendința for a fost calculată prin tratarea grupului HIV / CD4 ca o variabilă ordinală cu patru niveluri (0 până la 3) și a fost foarte semnificativă (). În plus, vârsta a fost asociată negativ, iar fumatul a fost asociat pozitiv, cu detectarea incidentelor de HPV oncogen. În modele de incidentul de detectare de orice HPV, Olc și 95% ic pentru femeile infectate cu HIV cu CD4 > 500, CD4 200-500, și CD4 < 200 au fost 1.65 (IÎ: 1.39–1.96), 2.76 (IÎ: 2.33–3.27), și 3.40 (IÎ: 2.66–4.34), respectiv. Tendința for a fost mai mică decât 0.0001., Similare semnificativ factori ca și în incident HPV oncogene au fost găsite cu următoarele constatări suplimentare femeile Afro-Americane au o incidență mai mare de orice HPV decât femeile Caucaziene, și numărul de parteneri sexuali de sex masculin în ultimele 6 luni a fost asociată pozitiv cu incidentul de detectare de orice HPV. cu toate acestea, aceste rate de risc nu au abordat numărul absolut de infecții noi cu HPV care ar fi detectate cu o scădere a numărului de CD4., Mai mult, verificarea proporționalității ipoteza pentru Cox modele arată că proporționalitatea pericol de funcția nu așteptați pentru HIV-pozitive cu CD4 < 200 în oncogene de HPV (analiza) și pentru numărul de sex masculin partener de sex în ultimele 6 luni ≥3, în orice HPV analiză (). Din aceste motive, am aplicat modelele additive hazards regresion la acest set de date.a fost montat modelul de risc aditiv semiparametric pentru HPV oncogen, iar rezultatele sunt prezentate în tabelul 1., Femeile infectate cu HIV cu CD4 > 500 avut un risc suplimentar de 0,03 decât HIV-negative femei, ceea ce presupune că, în medie, au fost 3 suplimentare oncogene de HPV infecție cazuri la 100 de femei infectate cu HIV pe an cu CD4 > 500 comparație cu HIV-negative femei; femeile infectate cu HIV cu CD4 200-500 avut o creștere de pericol 0.08; Femeile infectate cu HIV cu CD4 < 200 avut o creștere de pericol de 0.14., Toate creșterile relative la HIV-negative femei au fost semnificative statistic (), și tendința de creștere cu privire la HIV/CD4 grup a fost semnificativ cu valoarea < 0.0001. Efectele vârstei, rasei, fumatului și numărului de parteneri sexuali masculini în ultimele 6 luni au fost de acord cu cele din modelul Cox corespunzător.probabilitățile de supraviețuire estimate pentru cele patru straturi HIV/CD4 ajustate pentru alte covariabile din modelul aditivului semiparametric sunt prezentate în Figura 1(a). Aceasta arată că numărul mai mic de CD4 a fost asociat cu detectarea crescută a HPV oncogen.,/p>


(a)

(b)


(a)
(b)

Figure 1

Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., De sus în jos pentru fiecare rezultat și fiecare model se potrivesc: HIV−, CD4 > 500, CD4: 200-500, și CD4 < 200.

modelul de pericol aditiv neparametric a fost, de asemenea, montat pe date. Variabilele din modelul de regresie a hazardului aditiv neparametric au avut o semnificație statistică similară cu cele din modelul aditivului semiparametric și, de asemenea, cu cele din modelul de regresie a hazardului proporțional Cox cu aceleași covariabile., Figura 1(a) arată estimările de supravietuire de HPV oncogene pentru patru HIV/CD4 grupe: , , , pentru HIV-negative femei, femeile infectate cu HIV cu CD4 > 500, CD4 200-500, și CD4 < 200, respectiv, ajustat în funcție de alte variabile, în cazul în care este estimată cumulată de bază de pericol și este estimat excesul cumulativ pericolelor asociate pentru fiecare CD4 strat. Figura 1(a) arată că semiparametric model (modelul (1)) și modele neparametrice (modelul (2)) în general, a dat estimări similare pe cumulative pericole funcții., În special, distanțele dintre curbe sunt similare, indicând faptul că aceste două modele au dat estimări apropiate ale efectului CD4.

În această analiză bazate pe model (2), estimat de supraviețuire probabilitatea de HPV oncogene peste 5 ani de urmarire printre HIV-negativ femeile cu o vârstă < 30, de rasă Caucaziană, care au fost nefumatori, și a avut doar un singur partener sexual masculin în ultimele 6 luni, a fost de 0.80., Corespunzătoare incidența cumulativă a fost , ceea ce implică faptul că peste 5 ani de urmarire 20% din HIV-negative femei cu caracteristicile menționate anterior au avut cel puțin un test pozitiv pentru HPV oncogene; incidența cumulată a ratelor de 5 ani de urmărire au fost 0.33, 0.47, și 0,60 pentru CD4 > 500, CD4 200-500, și CD4 < 200 de grupuri, respectiv., Astfel, pentru fiecare 100 de femei cu CD4 < 200, au fost 40 de mai multe oncogene de HPV infectii de 5 ani, comparativ cu fiecare 100 de HIV-negative femei, care este o creștere semnificativă a numărului de infecții. Atât modelele de pericol aditiv semiparametric, cât și cele neparametrice se potrivesc bine datelor pe baza parcelelor reziduale Cox-Snell (Figura 2): curbele de pericol cumulative estimate urmează aproximativ liniile de 45 de grade.

aceleași analize au fost efectuate pentru orice HPV (Tabelul 1)., Efectul estimările pentru femeile infectate cu HIV cu CD4 > 500, CD4 200-500, CD4 < 200 au fost 0.09, 0.23, 0.30, respectiv, cu valori mai mici de 0.0001 ( pentru trend < 0.0001). Din neparametrice aditiv model (Figura 1(b)), diferența de supraviețuire de orice HPV CD4 între 200-500 și CD4 < 200 de grup nu a fost la fel de importantă pentru supraviețuirea oncogene de HPV. Incidența cumulativă a oricărui tip de HPV la 5 ani a fost de 0, 40, 0, 63, 0, 77, 0.,84 pentru HIV-negative femei, femeile infectate cu HIV cu CD4 > 500, CD4 200-500, CD4 < 200, respectiv. Modelele de risc aditiv pentru orice HPV se potrivesc, de asemenea, bine datelor (Figura 3).

4. Concluzia

Acest studiu aplicat două tipuri de aditiv pericol de regresie modele: semiparametric și neparametrice aditiv pericole modele de regresie și modelul Cox proporțional de risc analiza de HPV incidență de detectare a datelor în HIV-pozitive și HIV-negativ femeile și contrast efectul estimările obținute folosind fiecare abordare statistică., Toate modelele au găsit asocieri foarte semnificative între statusul imun gazdă și riscul detectării incidentului HPV. La semiparametric aditiv modelul a arătat că, în medie, au fost o suplimentare de 14 oncogene de HPV infecție de cazuri la 100 de ani-femei legate de numărul de celule CD4 < 200 relativă a HIV-negative femei; și neparametrice modelul arătat o suplimentare de 40 de HPV oncogene infecții la 100 de femei dupa 5 ani de urmarire.,

în Timp ce așa cum era de așteptat aditiv modele avut mult mai mic efect estimări decât de model Cox, cele două abordări adresa diferite întrebări; că este, de model Cox oferă estimări relative de avarie (la un coeficient de scară), întrucât aditiv de pericol modele oferă estimări aproximative pentru atribuibile riscului (de exemplu, diferența absolută în caz tarif pe unitate de schimbare în expunere variabilă) în eveniment rar adormirea maicii domnului., Riscul atribuibil poate fi utilizat pentru a determina creșterea absolută a numărului de cazuri, adică numărul de cazuri suplimentare de infecție cu HPV care au apărut din cauza expunerii de interes. Pericolele relative estimate de modelele Cox pot fi deosebit de utile în înțelegerea amplorii asocierii, care poate fi importantă din punct de vedere științific; adică atunci când riscul inițial al bolii este scăzut, numărul absolut de cazuri suplimentare legate de expunere poate fi mic, dar riscul relativ poate fi în continuare puternic., Cu toate acestea, riscul absolut poate fi util în special pentru planificarea și intervenția sănătății publice, atunci când numărul real de cazuri suplimentare de boală este de interes. am considerat modele de pericol aditiv semiparametric și neparametric. Comparativ cu semiparametric aditiv de pericol model de regresie, de neparametrice aditiv de pericol model permite covariate efecte variază în timp nonparametrically și, astfel, oferă o mai robuste de estimare a cumulat funcția de pericol decât semiparametric aditiv de pericol model., Cu toate acestea, modelele neparametrice utilizează, de asemenea, mai multe grade statistice de libertate. Prin urmare, dacă estimările efective covariate medii sunt de interes primar, ar putea fi utilizat modelul de pericol aditiv semiparametric, dar dacă se dorește să se examineze dacă unele efecte covariate variază sau nu în timp sau funcția de pericol cumulativ (sau rata de incidență cumulativă) este de interes primar, poate fi preferat modelul de pericol aditiv neparametric.observăm că modelul propus de Lin și Ying a fost extins pentru a include atât efecte covariate aditive, cât și multiplicative ., Acest model poate fi necesar, de exemplu, atunci când anumite covariabile dintr-un model de risc proporțional Cox satisfac ipoteza riscului proporțional, iar altele nu. Cu toate acestea, interpretarea acestui model nu este la fel de simplă ca modelul Cox sau modelele aditive. pe scurt ,deși fundamentul teoretic pentru modelele de pericol aditiv este bine stabilit și codurile de calculator pentru montarea acestor modele sunt disponibile, acestea au fost mai puțin frecvent utilizate decât alte metode de analiză timp-eveniment., Acest lucru poate reflecta parțial un grad de necunoaștere cu aceste modele în comunitatea generală de cercetare. Sunt necesare eforturi continue pentru creșterea gradului de conștientizare a acestor metode statistice și ar trebui luate în considerare de biostatiști și epidemiologi implicați în predarea următoarei generații de cercetători. această lucrare a fost parțial susținută de Granturile NCI 5r01ca085178, 1r21ca139388 și de un grant de la Lupus Foundation of America., Date în această lucrare au fost colectate de către Femei Inter HIV Studiu (WIHS); Colaborare Grup de Studiu cu centre principale (anchetatorii) la New York/the Bronx Consorțiu (Kathryn Anastos); Brooklyn, NY (Howard Minkoff); Washington DC Metropolitan Consorțiu (Mary Tineri); Connie Wofsy Studiu Consorțiu format din California de Nord (Ruth Greenblatt); Los Angeles/California de Sud Consorțiu (Alexandra Levine); Chicago Consorțiu (Mardge Cohen); Date de Centrul de Coordonare (Stephen Gange)., La WIHS este finanțat de către Institutul Național de Alergie și Boli Infecțioase (UO1-AI-35004, UO1-AI-31834, UO1-AI-34994, UO1-AI-34989, UO1-AI-34993, și UO1-AI-42590) și de la Eunice Kennedy Shriver National Institute of Child Health and Human Development (UO1-HD-32632). Studiul este cofinanțat de Institutul Național al cancerului, Institutul Național pentru Abuzul de droguri și Institutul Național pentru surditate și alte tulburări de comunicare. Finanțarea este asigurată și de Centrul Național de resurse pentru cercetare (grantul UCSF-CTSI nr. UL1 RR024131)., Conținutul acestei publicații este responsabilitatea exclusivă a autorilor și nu reprezintă în mod necesar punctele de vedere oficiale ale National Institutes of Health. Sprijin suplimentar a fost oferit de centrul Einstein-Montefiore pentru cercetarea SIDA (P30-AI-51519), Institutul de cercetare clinică și translațională (UL1RR025750) și Centrul de cancer Albert Einstein.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Sari la bara de unelte