エビデンス感度分析 (SE 分析) は、確信度の更新(エビデンスのプロパゲーション)の結果が、エビデンスの集合での変動(オブザベーション、尤度、その他)にどれぐらい敏感であるかの分析です。
意思決定者が仮説変数の確率分布に基づいて意思決定を行わなければならないような状況を考えます。たとえば、 疾患変数の確率分布を前提として、患者の治療を決定する医師を考えることができます。治療の決定に先立って、医師には、仮説変数の事後分布で収集された情報の影響度を調査するというオプションがあるでしょう。 どの知見(findings)の集合が好ましいか、 逆に、仮説と無関係か、 どの知見の集合がその仮説を対立仮説から判別するか、ある変数が1つの観測より異なる値で観測されたらどうなるかなど、知見(findings)の集合と仮説を仮定します。 これらの質問は、SE 分析で答えられます・
あるベイジアンネットワーク・モデルと仮説変数を仮定します。そのタスクは、仮説変数での確信度がエビデンスの変動にどれぐらい敏感であるかを決定することです。 離散確率変数での近視眼的仮説駆動SE分析を考えます。
エビデンス感度分析は、離散確率ノードに利用できます。離散確率ノードが選択されているか、 ノード・リスト・パネル内の離散確率ノード上で右クリックしたときに、この機能が使用できます。
X を状態(ステート)空間 x1,…,xn を持つ仮説変数とし、ε={ε1,…,εm} をエビデンスの集合 (知見:findings)とします。 εにおける εY は、 X(ε)中の変数Yでの知見(findings)を意味します。
pがゼロでない場合、2つの確率pとqの間の距離 d(p,q) は、次式で表せます:
この測度は、たとえば、エビデンスεを仮定した仮説xの確率P(x|ε)とエビデンスε\{εi}を仮定した仮説xの確率P(x|ε\{εi})の間の距離を測定するのに役立ちます。
確率 p と q の対の距離 d(p,q) が所定のしきい値 δより低い、すなわち d(p,q)<δの場合、それらの確率は、ほとんど等しいと言えます。
εiの切り捨てコスト c(P(X|ε), P(X|ε\{εi})) は、次式で定義されます:
この式は、値 P(x|ε)=0 および P(x|ε\{εi})=0の場合は定義されていません。これらの2つのケースでは、切り捨てコストをそれぞれ 0 および無限と定義します。距離測度と切り捨てコスト測度の違いに留意してください。距離測度が確率値の間の距離を計算するのに対して、切り捨てコスト測度はエビデンスεから特定のfinding εi を除外するときの2つの事後確率分布の間の距離を計算します。切り捨てコスト測度は、 確率分布 P とPの近似 P′の間のより一般的なクロス・エントロピー距離(またはKullback-Leibler 距離)測度の特殊なケースです:
切り捨てコスト測度は、たとえば、エビデンスεを仮定した仮説変数Xの事後確率分布 P(X|ε) とエビデンスε\{εi}、すなわち、 εi が εから除外されるところのエビデンスの集合を仮定した仮説変数Xの事後確率分布P(X|ε\{εi})P(X|ε\{εi})の間の距離を測定するのに役立ちます。
SE分析の実行の一部として、ある変数ですべての可能なオブザベーションを仮定した仮説変数の各可能な状態での事後確信度の最小値と最大値を調べることがあるでしょう。
図1のダイアログを用いて、各 情報変数 について、仮説変数の各ステートの事後確率の最小値と現在値、最大値を決定できます。最小値と最大値は、情報変数の各ステートを入力・伝播して決定されます。この分析は、各可能情報変数の各ステートについて1回の伝播を必要とします。
![]() |
|
図 1: 仮説変数 B のエントロピーは、 H(B)=0.562658. |
図 1 は、エビデンスの全集合を仮定した Has bronchitis の事後確率、Has bronchitisのエントロピー H(Has bronchitis)=0.562658 、Smoker?での知見(findings)上の変動を仮定したHas bronchitisの事後確率についての最小値と現在値、最大値を示します。.
仮説変数上のMin-max SE 分析は、情報変数の集合に関係して実行されます。情報変数の集合は、図6に示すように選択できます。
![]() |
|
図 6: 情報変数の集合の選択 |
情報変数の選択は、d-分離パネルのインスタンス化のターゲットの選択と同様な方法で進められます。
仮説変数の各ステート上のエビデンスのさまざまな部分集合の影響度の調査は、SE分析の有用な一部です。仮説のステート上のエビデンスのさまざまな部分集合の影響度の調査は、各可能な仮説に賛成する、または反対するエビデンスの部分集合を決定するのに役立ちます。
仮説変数のあるステート上のエビデンスの部分集合の影響度は、仮説を仮定したエビデンスの正規化尤度を計算して決定されます。
この分析は、選択されたエビデンスの各部分集合について1回のプロパゲーション(伝播)を必要とします。
図2に示すダイアログを用いて、仮説変数の各ステート上の選択されたエビデンスのすべての部分集合の影響度を調査できます。
![]() |
|
図 2: 仮説変数の各ステートを仮定したエビデンスのさまざまな部分集合の正規化尤度 |
図 2 は、Has bronchitis = falseを仮定した場合のSmoker? と Dyspnoea?でのエビデンスの正規化尤度は1.363であることを示しています。これは、(正規化尤度が1より大きいので)その患者がbronchitis(気管支炎)に苦しんでいないという仮説をエビデンスが支持することを暗示します。Smoker?上のエビデンスがこの仮説に反対するのに対して、Dyspnoea? 上のエビデンスはさらに一層この仮説に賛成します。
SE分析によって考慮される中心的問題は、さまざまなエビデンスの部分集合がどのように競合する仮説を判別するかの問いです。課題は、競合する仮説でのエビデンスの部分集合の影響度を比較することです。
2つの異なる変数のステートとして表現される2つの異なる仮説の間の判別を考えます。競合する仮説の対の判別は、選択されたエビデンスのすべての部分集合についてのベイズ因子の計算に基づきます。.
これは、各部分集合について1回のプロパゲーションを必要とします。
図3に示すダイアログを用いて、選択されたエビデンスの部分集合がどのように2つの競合する仮説を判別するかを調査できます。
![]() |
|
図 3: 仮説 Has bronchitis = true と対立仮説 Has lung cancer = true の判別 |
図 3 は、選択されたエビデンスの部分集合についての仮説 Has bronchitis = true と対立仮説 Has lung cancer = true の間のベイズ因子を示します。すべての部分集合(空集合を除く)が対立仮説(すなわち、患者は肺がんに苦しんでいる)を支持しています。
what-if SE 分析では、次のような問いが考慮されます。 観測離散確率変数が、実際に観測された値から異なる値で観測されたとしたらどうなるか。 what-if 分析への仮説駆動アプローチを考えます。仮説駆動what-if 分析は、観測変数の各可能ステートについての仮説変数の事後分布を計算して実行されます。
図4に示すダイアログを用いて、 エビデンス変数の観測ステートを変更した結果を調査できます。
![]() |
|
図 4: 仮説変数 Has bronchitis の事後分布が Smoker?.の観測ステートの関数を持つ |
図4 は、仮説変数 Has bronchitis の事後分布が、 Smoker? の観測ステートの関数としてどのように変化するかを示します。
仮説の確率での各 知見(finding) の影響度は、仮説の事前確率、エビデンスの全集合を仮定した仮説の事後確率、およびその知見(finding)を除くエビデンスの全集合を仮定した仮説の事後確率を計算・比較して決定されます。
重要な知見(finding)の発想は、エビデンスの十分な集合であり、冗長な(余分な)知見(finding) がfindings SE 分析の中心課題です:
各finding の影響度は、仮説変数の各ステートまたは特定のステートについて考えることができます。 十分性と重要度のしきい値は、ユーザが指定します。
図5に示すダイアログを用いて、仮説変数の事後分布での知見(finding)の重要度を調査できます。
![]() |
|
図 5: 仮説変数の B のエントロピーは、 H(B)=0.6876. |
図5 は、仮説 Has bronchitis = false (ステート false でのHに対応、すなわち h=false)でのSmoker?の知見(finding)の重要度を説明しています。