Cox の比例ハザード・モデルの実行
データと結果のExcel シートは、こちらをクリックしてダウンロードできます。このデータは、Kalbfleisch and Prentice (The Statistical Analysis of Failure Time Data, Wiley, 2002, p. 119) で取得されたもので、肺がん患者の生存時間での共変量効果を調査する臨床試験を表します。我々の目的は、どの共変量が製造時間に影響するかを明らかにすることです。
比例ハザード・モデル は Cox (1972) によって提案されたもので、それは古典的な回帰のスキームに基づき
ます。モデルの推定は部分尤度と呼ばれる最大尤度推定の特別なタイプで実行されます。モデルの係数の推定は、仮説の保持を仮定して得られます。
このデータ集合では、daysurv変数が時間のデータです;censoring変数が状態変数 (1 は死亡, 0は打ち切り)。 共変量は、調査の開始時点でのパフォーマンス状態(perfstatus)、調査の開始時点での患者の年齢 (age)、調査の開始時点での肺がん診断からの月数 (month)および事前治療の有無です。
XLSTATを起動して、XLSTAT/XLSTAT-Life/Cox Proportional hazardsモデルのコマンドを選択するか、 "XLSTAT-Life" ツールバーの対応するボタン(下図)をクリックします。

ボタンをクリックすると、Cox 比例ハザード・モデルのボックスが現れます。 Excel シート上でデータを選択します。 "時間データ" は患者が死亡するか打ち切られるまでの期間です。"状態指標" は、ある時間に患者が死亡(イベント・コード=1)したか打ち切られ(打ち切りコード=0)たかを記述します。共変量は、すべての量的変数で、量的変数ボックスで選択できます。

モデルの層化、個体の残差、手法選択の取り扱いなど、他のオプションは、ダイアログ・ボックスの他のタブで選択できます。
"OK"をクリックすると計算が始まります。そして、新しいExcelシートに結果が表示されます。最初の表は、データの要約を表示します。観察された時間の数(タイムステップ)が、オブザベーションの数とは異なることがわかります。そして、同値の取り扱い手法(デフォルトはブレスロウ法ですが、エフロン法も利用できます)を使用しなければなりません。

そして、各変数について記述統計量が表示されます(我々の事例では、すべてのの変数が量的変数ですが質的変数が選択されると別の表が表示されます。)。質的変数の取り扱いについては、XLSTATのヘルプでより詳しく参照してください。

次の表は、モデル品質(または適合度)のさまざまな指標です。これらの結果は、線形回帰やANOVAでの R2 や分散表の分析に相当するものです。注目すべき最も重要な値は、log ratioでのカイ2乗検定の確率です。これはフィッシャーのF検定に相当します : それは共分散の影響を持たないより簡単なモデルで定義されるので、我々は、モデルを比較することにより、変数が有意な情報をもたらすかどうかを評価しようとします。このケースでは、確率が0.0001よりも低いので、我々は有意な情報がその変数によってもたらされると結論づけることができます。

以下の表は、モデルの詳細です。この表は、さまざまな変数の効果を理解するのに役立ちます。

この表では、生存時間に最も影響する変数がperfstatusであることが、カイ2乗の確率を見てわかります。これは、調査の開始時点での患者のパフォーマンス状態が生存時間に有意な効果を持つことを示していま。ハザード比が、パラメータ推定の指数関数として得られます。
Finally, the cumulative hazard function is displayed:

この調査は、有意な影響を持つ共変量はパフォーマンス状態だけであることを示しました。負の係数は、患者が低いパフォーマンス状態を持つ場合、彼の生存時間がより大きいことを示します。
他の共変量は、生存時間に有意な効果を持ちません。
XLSTAT-Lifeには、その他の機能があります:
- モデルの層化;
- 共変量の平均でのハザード関数;
- 残差(デビアンス、シェーンフィールド、スコア);
- 変数選択手法(上り、下り)。
その他のチュートリアルはこちらです。