ROC曲線の作成と検出手法のための最適しきい値の同定
イントロダクション
この手法は、第二次世界大戦中に最初、日本の戦闘機を検出する効果的な方法を開発する目的で開発されました。そして、信号検出や現在広く使用されている医学など、より一般的いに使用されるようになりました。i
問題は次のようなことです: 我々はしばしばバイナリ(たとえば、病気があるかないか)の現象を調査し、正確なイベントの発生(たとえば、病気の存在)を効果的に検出するテストを開発したいのです。
テストがたとえば分子の濃度のような量的(あるいは順序)の場合、我々はある濃度から患者が病気であると決定しようとするでしょう。ROC曲線と指標が計算されて、最適な決定をなすように支援します。
アプリケーション
このチュートリアルで使用するデータと結果のExcelシートは、こちらをクリックしてダウンロードできます。データは、50人の患者中20人が病気である医学実験であり、ウィルス分子の濃度が測定されるスクリーニング・テストに提出されます。
XLSTAT を起動すると、XLSTAT-Life / ROC 曲線 コマンドを選択するか、 XLSTAT-Life ツールバーの対応するボタン(下図)をクリックします。

ボタンをクリックすると、ダイアログ・ボックスが現れます。 "イベント・データ" に対応するデータを選択し、陽性のケースに関連づけられたコードを入力します。そして、我々が評価している診断テストに対応するデータを選択して、それより上または下でテストが陽性であると考えられるしきい値を同定するために使用するべきルールのタイプを指定します。ここでは、濃度が決定されるべき値以上の場合、テストが陽性であることを考慮するように選びます。

"オプション" タブでは、信頼区間を計算する方法を指定できます。 XLSTATは最も広い選択を提供するソフトウェアです。デフォルトは、最もよく推奨される設定です。このタブでは、さまざまなケースにコストを割り当てることもできます。我々は、診断エラーに強いペナルティを与え、とくに病気の患者が検出されないケースにはより強いペナルティを与えたいのです。.

"チャート" タブで、我々は、コストに基づくディシジョン・プロットを表示することを選びます。

"OK"をクリックすると、計算が行われ結果が表示されます。最初の表は、テスト変数、ここではconcentration(濃度 )、そしてイベント変数、ここでは disease(疾患)についての統計量を表示します。標本で観察された有病率は、0.4に等しいです。

そして ROC が表示されています。それぞれの小さな四角形は、オブザベーションに対応します。

次の "ROC 分析" は、それぞれの可能はしきい値、さまざまなパフォーマンス指標の値を表示します。たとえば、濃度が0.98以上のときに患者が病気であると宣言することを決定する場合、感度は0.95で、特異度は0,733、そちてコストは61です。さまざまな指標の詳細については、感度と特異のチュートリアルで確認できます。

そして、この表を用いて生成されたグラフが表示されます。しきい値の選択によるTP (真陽性), TN (真陰性), FP (偽陽性) および FN (偽陰性) のカウントの推移がわかります。

ディシジョン・プロットは、コストが最小化されるしきい値を選ぶことを可能にします。チャート上で最小しきい値を見るには、対応するポイントにマウスを置くだけです。この値は、前の表分析 ROCで同定されたように、0.98の濃度です。.

結果の最後の系列は、曲線の下側の領域 (AUC)を調査することができます。AUCとその信頼区間が計算されます。AUC を 0.5 と比較する検定は、診断テストが単なるランダム・ルールよりも強力であるかどうかをチェックすることを可能にします。我々のケースでは、テストがとても強力でAUCが 0.5から有意に異なります。

AUC の比較は、異なる診断テストを比較するための方法でもあります。XLSTATは、必要なだけの数のテストを比較できます。
その他のチュートリアルはこちらです。
