Abstract
time-to-event analysisにはいくつかの統計的手法があり、その中でも最も一般的に使用されているCox比例ハザードモデル ただし、リスク比の代わりにリスクの絶対的変化が主な関心事である場合、またはCox比例ハザードモデルの比例ハザード仮定に違反する場合は、追加ハザード回帰モデルがより適切である可能性があります。, HIV陽性およびHIV陰性女性におけるヒトパピローマウイルス(HPV)の自然史研究からのデータセットに対して,このアプローチの概要を示し,セミパラメトリックおよびノンパラメトリック加法モデルを適用した。, セミパラメトリックモデルの結果は、平均して14人の女性あたり100人の癌性HPV感染を示し、CD4カウント<200人のHIV陰性女性に対して、ノンパラメトリック添加モデルの結果は、40人の女性あたり100人の癌性HPV感染を示し、5年のフォローアップにわたって、Coxモデルの推定ハザード比は3.82であった。 Coxモデルは曝露疾患関連のより良い理解を提供することができるが、加法モデルはしばしば公衆衛生計画および介入のためにより有用である。
1., はじめに
臨床事象の発生率に関連する危険因子を研究するために、イベントまでの時間分析が一般的に使用されています。 例えば、疾患発症までの時間、入院までの時間、再発までの時間/再発、および死亡までの時間はそれぞれエンドポイントとして頻繁に使用される。 ただし、パラメトリックモデル、セミパラメトリックモデル、ノンパラメトリックモデルなど、イベントまでの時間データとリスク要因の関係を測定するためのモデルはいくつかあります。 パラメトリックモデルでは、イベントまでの時間の分布が仮定されます(例:, さらに、イベントまでの時間の対数とモデル内の共変量との間に線形関係があると仮定されます。 次に,最尤法を用いて関連の強さを推定した。 セミパラメトリックモデル、特にCox比例ハザード回帰モデルでは、ハザード関数は、不特定のベースラインハザード関数を持つ共変量に乗算的に関連していると仮定され、パラメータを推定するために最大部分尤度法が使用される。, ノンパラメトリックモデル、特にKaplan-Meierアプローチでは、病気のリスクと共変量との関係に関する仮定は行われていません。 代わりに、共変量の各階層の生存関数が経験的手法で推定され、対数順位検定およびその他のノンパラメトリック検定は、通常、これらの共変量の効果をテストするために使用されます。
イベントまでの時間データを分析するためのよく知られているがあまり使用されていない方法は、加法的危険回帰モデルである。, ハザード比を推定する比例ハザードモデルとは異なり、加法モデルはハザードの違いを推定する:関心のあるエクスポージャーによるハザード関数の変化、またはエクスポージャー変数の変化単位当たりの瞬時故障率の絶対差をより簡単に述べる。 ハザードの差の推定値に基づいて、累積発生率の変化をさらに推定することができます。, 累積ハザードの変化は、曝露による疾患のリスクの差、すなわち曝露に起因するリスクに近似する。 したがって、帰属性リスクが主な関心事である場合、または比例ハザード仮定に違反している場合は、追加ハザード回帰モデルがより適切であり得る。 ノンパラメトリック加法モデルはもともとAalenによって提案されて以来、このトピックに関する広範な研究が行われてきた。, しかし、加法的危険回帰モデルは、主にモデルに精通していないことと、既存のソフトウェアを使用してモデルを実装する方法に関する知識の欠如のために、公衆衛生および医学研究において十分に活用されていない。 ここでは,既存の統計ソフトウェアを用いた二つの加法モデルの適用例を示した(プログラムコードを提供した)。
この論文の動機づけの例は、ヒト免疫不全ウイルス(HIV-)陽性およびHIV陰性女性におけるヒトパピローマウイルス(HPV)感染の自然史の研究であった。, このデータセットの前の分析は、HIV serostatusおよびCD4カウントによって測定されるように、インシデントHPV検出と宿主免疫状態との関係を評価するためにCox比例ハザードモデルを使用した。 免疫状態の変化に関連するHPV感染の帰因リスクを推定するために付加的なハザード回帰モデルを用いて,これらの結果をCoxモデルを用いた結果と対比した。
2. メソッド
2.1., データ
データは、HPV DNA検査およびPap検査のための剥離した子宮頸部細胞の収集を含む半年間の臨床フォローアップ訪問を伴う、女性の省庁間HIV研究(WIHS)、大 3766人の女性(2791人のHIV+、975人のHIV−)が在籍しており、そのうちの三分の二は1994-95年に、残りは2001-02年に在籍していた。 研究の登録および方法の詳細は、以前に報告されています。, フォローアップ中にHIV血清変換を持っていた、WIHSに登録する前に子宮摘出術を持っていた、フォローアップ中にHPVデータを欠いていた、またはベースラインで発癌性HPVの陽性検査を受けた女性を除いた後、発癌性HPVのインシデント検出の現在の分析のために利用可能な女性の数は2386人(1672HIV+、714HIV−)であった。 発癌性HPVタイプにはHPV16が含まれていました, 18, 31, 33, 35, 39, 45, 51, 52, 56, 58, 59, そして68, 我々はまた、より多くの女性がベースラインでHPVの任意のタイプの陽性が検出されるために除外された任意のHPVのインシデント検出を研究し、女性の対応する数は1733(1116HIV+、617HIV-)であった。 このデータセットは、8回の追加訪問(追加4年間のフォローアップ)からの更新を表します。
HPVのインシデント検出までの時間は、最後のHPV陰性訪問と最初のHPV陽性訪問の間の中間を使用して推定された。 発癌性または任意のHPVのインシデント検出までの時間を別々に分析した。, 一次暴露変数は、HIV状態およびCD4カウントによって特徴付けられる宿主免疫状態であった:HIV陰性、CD4カウントが500より大きいHIV陽性、CD4カウントが200と500の間で、およびCD4カウントが200未満である。 追加の共変量には年齢が含まれていました(<30, 30-34, 35-39, 40-44, ≥45 年)、人種(白、黒、ヒスパニック系、その他)、喫煙(決して、元、現在)、および過去6ヶ月の男性の性的パートナーの数(0, 1, 2, ≥3).
2.2. 統計的方法
二つの付加的なハザードモデルを考慮した。, 最初のモデルはセミパラメトリック加法ハザードモデルで、共変量を持つ特定の被験者の条件付きハザード率は共変量の数、未知のベースラインハザード関数、および未知の時間に依存しない係数です。 この研究では、時間に依存しない共変量のみを考慮し、すべてベースラインで考慮しました。 時間依存共変量を持つモデル(1)のより一般的な形式が研究されており、andの推定値が一貫して漸近的に正規であることが示されている。, モデル(1)は、Cox比例ハザード回帰モデルと同様の形式を持っていることに注意してください。Coxモデルは乗法スケールで定義され、加法ハザードモデルは加法スケールで定義されますが、両方のモデルは不特定のベースラインハザード関数と時間に依存しない係数を持っています。 回帰パラメータを推定する際に数値反復を必要とするCox比例ハザード回帰モデルとは異なり,前述のセミパラメトリック加法ハザード回帰モデルは回帰パラメータを推定するための閉形式の解を持っている。, このモデルでは、リスクの相対的変化ではなく、リスクの絶対的変化を推定することができます(1)。 SASコードinを使用してモデルを近似し、その推定値、その標準誤差、および分散共分散行列を生成しました。 値は通常の仮定の下で計算した。 累積ベースラインハザードとその標準誤差の推定値を計算するために追加のSASコードが書かれました。 累積ハザード関数推定値は、モデル(1)に基づいて推定されました。 Cox-Snell残留を、観察された生存時間における各被験者について評価した。, 具体的には、観察された生存時間、事象指標および共変量を有する被験体について、残差はにより推定される。 モデル(1)が正しければ、’sは右打ち切りで単位指数分布に従うべきです。 単位指数分布は、その累積ハザード関数が恒等関数であるという性質を持つため、この特性を使用して加法モデルの適合度をチェックできます。 したがって、すべての被験者のデータに対する累積ハザードのNelson-Aalen推定値を計算しました。, SASでは、これはproc phregをbaseline statementと共に使用し、method=chオプションを文中で使用することによって取得できます(コードはオンライン資料で提供されています)。 残差対残差に対する推定された累積ハザードのプロットが生成され、モデル(1)が真である場合に45度の線に近いものが期待されます。
Model(1)は、共変量の効果がハザード関数に対して一定であることを前提としていますが、実際には、時間依存の可能性のある既知のパラメトリック形式に一般化することができます。, また、共変量の係数が時間依存でノンパラメトリックであることを可能にする、より一般的な加法ハザードモデルも検討しました。 モデル(1)とは異なり、新しいモデルはの形式に関する仮定を行いません。 このモデルの漸近理論を研究した。 モデルを近似するために提供されたSASマクロを使用し、標準誤差推定値の推定値とその標準誤差推定値を与えました。 数量の見積もりは、閉じた形式の解を持っています。, は累積ベースラインハザードであり、時間における過剰累積ハザードであり、共変量および観測時間に基づく計画行列がフルランクである時間0から最大 いくつかの指標(0/1)である場合,,の推定値は、他の共変量を調整しながらグループにいる時間における追加の累積ハザード推定値を与えます. ノンパラメトリック加法ハザードモデルは、セミパラメトリック加法ハザードモデルと同じ共変量に対して調整されました。, セミパラメトリックモデルと同様のCox-Snell残差プロットを,ノンパラメトリック加法モデルのすべての残差が最大時間で打ち切られたという差で生成した。
従来のCox比例ハザードモデルは、前述のと同じ共変量を組み込んだ発癌性および任意のHPVのインシデント検出のために、加法モデルと比較するために実行されました。 すべての統計分析はSAS9.1.3を使用して行われ、プロットはR2.9.2で生成されました。 コンピューターコードは、https://sites.google.com/site/samxiepage/Additive_Model_Pkg.zip?attredirects=0&d=1でダウンロードできます。
3., 結果
発癌性HPVのインシデント検出のためのCox比例ハザードモデルは、CD4>500とHIV陽性女性は、ハザード比(HR)1.62 95%信頼区間(CI)1.31から2.00HIV陰性女性 対応するHRsと95%CIs CD4 200-500とCD4<200とHIV陽性女性を比較し、参照群としてHIV陰性女性を使用して、それぞれ2.49(CI:2.04-3.03)と3.82(CI:3.01-4.86)であった。, Forトレンドは、HIV/CD4群を四つのレベル(0から3)の順序変数として扱うことによって計算され、非常に有意であった()。 さらに、年齢は否定的に関連しており、喫煙は発癌性HPVのインシデント検出と正に関連していた。 任意のHPVのインシデント検出のモデルでは、HRsと95%CIs CD4>500、CD4 200-500、およびCD4<200 1.65(CI:1.39-1.96)、2.76(CI:2.33–3.27)、および3.40(CI:2.66–4.34)、それぞ Forトレンドは0.0001未満でした。, 事件の発癌性HPVのような同様の重要な要因は、アフリカ系アメリカ人の女性が白人女性よりもHPVの発生率が高く、過去6ヶ月の男性の性的パートナーの数がHPVのインシデント検出と正に関連していたという追加の知見で発見された。
これらのハザード比は、しかし、CD4カウントの減少と検出される新しいHPV感染の絶対数に対処していませんでした。, さらに、Coxモデルの比例仮定のチェックは、発癌性HPV分析()におけるCD4<200およびHPV分析()における過去6ヶ月の男性の性的パートナー数№3について、HIV陽性者に対してハザード関数の比例性が成立しなかったことを示している。 これらの理由から、このデータセットに加法的危険回帰モデルを適用しました。
発癌性HPVに対するセミパラメトリック添加ハザードモデルを適合させ、その結果を表1に示す。, CD4>500はHIV陰性の女性よりも0.03の追加のハザードを持っていた、これは平均して3つの追加の発癌性HPV感染症例があったことを意味する100CD4>500HIV陰性の女性と比較して、CD4 200-500のHIV陽性の女性はハザード0.08の増加を持っていた;CD4<200はハザード0.14の増加を持っていました。, HIV陰性女性に対するすべての増加は統計的に有意であり()、HIV/CD4グループに関する増加傾向は値<0.0001で有意であった。 過去6ヶ月における年齢、人種、喫煙、および男性の性的パートナーの数の影響は、対応するCoxモデルからのものと一致した。
セミパラメトリック加法モデルから他の共変量に対して調整された四つのHIV/CD4層の推定生存確率は、図1(a)に示されています。 これは、より低いCD4カウントが発癌性HPVの検出の増加と関連していたことを示している。,/p>
(a)
(b)
(a)
(b)
Estimates of survival probabilities of oncogenic HPV and any HPV for the HIV/CD4 strata from semiparametric and nonparametric additive hazard model fitting with the other covariates held at reference values: age < 30, race is white, never smoked, and one male sexual partner in past 6 months: (a) oncogenic HPV; (b) any HPV., 各結果と各モデルのフィット感について、上から下へ:HIV−、CD4>500、CD4:200-500、およびCD4<200。
ノンパラメトリック加法ハザードモデルもデータに適合しました。 ノンパラメトリック加法ハザード回帰モデルの変数は、セミパラメトリック加法モデルの変数および同じ共変量をもつCox比例ハザード回帰モデルの変数と同様の統計的有意性を持っていました。, 図1(a)は、hiv/CD4グループに対する発癌性HPVの生存確率の推定値を示しています:,,,HIV陰性女性、CD4>500、CD4 200-500、およびCD4<200は、それぞれ、他の共変量に対して調整されました。ここで、推定された累積ベースラインハザードと各CD4層に関連する推定された過剰累積ハザードです。 図1(a)は、セミパラメトリックモデル(model(1))とノンパラメトリックモデル(model(2))が一般的に累積ハザード関数について同様の推定値を与えていることを示しています。, 特に、曲線間の距離は類似しており、これら二つのモデルがCD4効果の近い推定値を与えたことを示している。
モデル(2)に基づくこの分析では、年齢のHIV陰性女性のフォローアップの5年にわたる発癌性HPVの推定生存確率<30は、非喫煙者であり、過去6ヶ月で唯一の男性の性的パートナーを持っていた白人のレースの0.80であった。, 対応する累積発生率は、前述の特性を持つHIV陰性女性の5年間のフォローアップ20%が発癌性HPVの少なくとも一つの陽性テストを持っていたことを意味し、5年間のフォローアップによる累積発生率は0.33、0.47、および0.60CD4>500、CD4 200-500、およびCD4<200グループであった。, したがって、CD4<200を持つすべての女性のために、40年までにより多くの発癌性HPV感染がありました5すべてのHIV陰性女性と比較して100 セミパラメトリックモデルとノンパラメトリック加法ハザードモデルの両方が、Cox-Snell残差プロットに基づいてデータを適切に適合させます(図2)。推定される累積ハザード曲線は、およそ45度の線に従います。
いずれのHPVについても同じ分析を行った(表1)。, CD4>500、CD4 200-500、CD4<200のHIV陽性女性の効果推定値は、それぞれ0.09、0.23、0.30であり、0.0001未満の値であった(傾向<0.0001)。 ノンパラメトリック付加モデル(図1(b))から、CD4 200-500とCD4<200群のHPVの生存の差は、発癌性HPVの生存の差ほど有意ではなかった。 5年で任意のHPVの累積発生率は0.40、0.63、0.77、0であった。,84HIV陰性女性の場合、CD4>500、CD4 200-500、CD4<200を有するHIV陽性女性。 任意のHPVの加法ハザードモデルもデータによく適合します(図3)。
4. 結論
本研究では、セミパラメトリックとノンパラメトリック加算ハザード回帰モデルとCox比例ハザードモデルをHIV陽性およびHIV陰性の女性におけるHPV発生率の検出データの分析に適用し、それぞれの統計的アプローチを用いて得られた効果推定値を対比した。, すべてのモデルは、宿主免疫状態と事件HPV検出のリスクとの間に非常に有意な関連を見出した。 セミパラメトリック添加モデルは、平均して14女性あたり100発癌性HPV感染例があったことを示した-CD4カウント<200HIV陰性女性に対する相対;とノンパラメトリックモデルは、追加の40発癌性HPV感染を示した100女性あたり5フォローアップの年後。,
予想通り、加法モデルはCoxモデルよりもはるかに低い効果推定値を有していたが、二つのアプローチは、異なる質問に対処する:Coxモデルは、(乗法スケールで)相対ハザードの推定値を提供し、加法ハザードモデルは、まれなイベント仮定の下で起因するリスク(すなわち、曝露変数の変化の単位当たりのイベント率の絶対差)の近似推定値を提供する。, 帰属性リスクは、症例数の絶対的な増加、すなわち関心のある暴露によって発生したHPV感染の追加症例の数を決定するために使用することができる。 Coxモデルによって推定される相対的な危険は科学的に重要であるかもしれない連合の大きさを理解するのに特に有用であることができる;すなわち、病気のベースライン危険が低いとき露出に関連している付加的なケースの絶対数は小さいかもしれないが相対的な危険はまだ強いかもしれない。, しかしながら、絶対的なリスクは、疾患の追加症例の実際の数が興味深い場合に、公衆衛生計画および介入に特に有用であり得る。
セミパラメトリックとノンパラメトリック加法ハザードモデルを考えた。 セミパラメトリック加算ハザード回帰モデルと比較すると、ノンパラメトリック加算ハザードモデルでは、共変量効果がノンパラメトリックに経時的に変化することができるため、セミパラメトリック加算ハザードモデルよりも累積ハザード関数のより堅牢な推定値が得られます。, ただし、ノンパラメトリックモデルでは、より統計的自由度も使用されます。 したがって、平均共変量有効推定値が主な関心事である場合は、セミパラメトリック加算ハザードモデルを使用できますが、いくつかの共変量効果が経時的に変化しているかどうか、または累積ハザード関数(または累積発生率)が主な関心事であるかどうかを調べたい場合は、ノンパラメトリック加算ハザードモデルが好ましい場合があります。
LinとYingによって提案されたモデルは、加法的および乗法的な共変量効果の両方を含むように拡張されていることに注意してください。, このモデルは、たとえば、Cox比例ハザードモデルの特定の共変量が比例ハザード仮定を満たし、他の共変量が満たさない場合に必要になる場合があります。 しかし、このモデルの解釈は、Coxモデルまたは加法モデルほど簡単ではありません。
要約すると、加法ハザードモデルの理論的基礎は十分に確立されており、これらのモデルを適合させるためのコンピュータコードは利用可能であるが、他の時間-イベント分析の方法よりもあまり頻繁に使用されていない。, これは、一般的な研究コミュニティにおけるこれらのモデルの不慣れさを部分的に反映している可能性がありま これらの統計的手法の意識を高めるための継続的な努力が必要であり、次世代の研究者を教えることに関与する生物統計学者および疫学者によって考慮されるべきである。
謝辞
この作品は、NCI助成金5R01CA085178、1R21CA139388およびLupus Foundation of Americaからの助成金によって部分的にサポートされました。, この論文のデータは、Women’s Interagency HIV Study(WIHS)、new York City/Bronx Consortium(Kathryn Anastos)、Brooklyn、NY(Howard Minkoff)、Washington DC Metropolitan Consortium(Mary Young)、Connie Wofsy Study Consortium of Northern California(Ruth Greenblatt)、Los Angeles County/Southern California Consortium(Alexandra Levine)、Chicago Consortium(Mardge Cohen)、Data Coordinating Center(Stephen Gange)によって収集されました。, WIHSは、国立アレルギー感染症研究所(UO1-AI-35004、UO1-AI-31834、UO1-AI-34994、UO1-AI-34989、UO1-AI-34993、およびUO1-AI-42590)およびユーニス-ケネディ-シュライバー国立子どもの健康と人間開発研究所(UO1-HD-32632)によって資金提供されている。 この研究は、国立がん研究所、国立薬物乱用研究所、および国立難聴およびその他のコミュニケーション障害研究所によって共同資金で行われている。 また、国立研究資源センター(UCSF-CTSI Grant no. UL1RR024131)。, この出版物の内容は、著者の責任のみであり、必ずしも国立衛生研究所の公式見解を表すものではありません。 追加のサポートは、Einstein-Montefiore Center for AIDS Research(P30-AI-51519)、Institute for Clinical and Translational Research(UL1RR025750)、およびAlbert Einstein Cancer Centerによって提供されました。