情報の価値分析

情報の価値分析は,インフルエンス・ダイアグラムとベイジアンネットワークの両方で実行できます.ただし,インフルエンス・ダイアグラムでの情報の価値分析のアプローチは,ベイジアンネットワークでの情報の価値分析のアプローチとは少し異なります.したがって,以下の2つの節で,我々はインフルエンス・ダイアグラムでとベイジアンネットワークでの情報の価値分析を順に見ていきます.以下の2つの節のそれぞれは自己完結です.これは,各節を別々に読むことができますが,またいくつかの重複があります.

インフルエンス・ダイアグラム

オブザベーションのある集合が与えられて,意思決定者が意思決定をしなければならない状況を考えます.たとえば, 医師が,特定の疾患に関係した症状とリスク要因に関するオブザベーションから患者の治療を決定するということが考えられます.たとえば,その決定は,患者を直ちに手術するかどうかということかもしれません.決定の前に,医師は,検査の結果を持つか,さらに質問をするかなど,患者に関する追加の情報を収集するオプションを持つことができます.与えられたオプションの範囲で,医師はどのオプションを次に選択するべきか? つまり,与えられたオプションのどれが,最も情報を生み出すか? これらの問いは,情報の価値分析によって答えることができます.

あるインフルエンス・ダイアグラム・モデル,決定変数および決定の情報の親でのオブザベーションを仮定して,タスクは,どの変数が決定変数に関して最も情報量があるかを識別することです.

我々は,離散決定変数に関係する離散確率変数での情報価値分析に駆動される近視眼的な仮説を考えます.その機能は,離散決定ノードが選択されているとき,または ノード・リスト・パネルの離散決定ノード上で右マウス・ボタンを押しているときに使用可能です.

最大期待効用

追加の情報を獲得する主要な動機は,考慮中の決定の最大期待効用を増大することです.次に観察する変数の選択(たとえば,次にする質問) は,期待効用の最大化の原則に基づきます.期待効用は,決定変数に関連する決定オプションの有用性の測度です.

情報の価値分析

情報の価値は,決定分析の中核要素です.我々は,決定問題のインフルエンス・ダイアグラム表現を用いて決定分析を行います.インフルエンス・ダイアグラムの構造は,決定の順序に対する各オブザベーションの半順序を指定します:


インフルエンス・ダイアグラムでの情報の価値分析は,ある決定に関係するオブザベーションの半順序の変更の影響を考慮します.

D が次に考慮するべき決定であると仮定して, ε がオブザベーションの集合であるとして,決定 Dに対する決定がなされなす.最初に,決定D を行う基盤は,Dによってコードされるオプション上の期待効用関数 EU(D|ε) です.

Xi=x は,決定Dが行われる前に観察されていると仮定します.決定 D を行うための修正された基盤は,期待効用関数 EU(D|ε,x)になります:



Xi のステートwp観察する前の Xi の確率分布は P(Xi|ε) です.したがって,Xi が観察されたあとのDにおける最適決定の期待効用EUO(Xi,D|ε)を次のように計算できます:



この数は, XiでのオブザベーションなしでのDでの最適決定のの最大期待効用と比較されるべきです. 決定Dの前にXi を観察することの価値 VOI(Xi,D|ε)$ は次式になります:


情報の価値分析の実行

選択された決定変数での情報の価値分析 は,ネットワーク・メニュー, ノードリスト・パネルのいずれから,または右クリックで起動できます.情報の価値分析を起動するには,決定変数が選択されていなければならないことに注意してください.

情報の価値分析は,離散決定変数に関係する離散確率変数に対してサポートされます.

図 1 は,Operate上で情報の価値分析を起動すると現れる情報の価値パネルを示します.このパネルでは,情報の価値分析の結果が示され(図3),情報変数の集合が定義できます(図2).

図 1: 決定変数 Operate の最大期待効用は,iMEU(Operate)=0.3079.

図 1 は,決定変数 Operate の最大期待効用が MEU(Operate)=0.3079 であることを示します.

決定変数での情報の価値分析は.情報変数の集合に対して実行されます.情報変数の集合は,図 2 に示すように選択できます.

図 2: 情報変数の集合の選択

情報変数の選択は, d-分離パネルでのインスタンス化ターゲットを選択するのと同じ方法で進められます.

カスタム・グループ( custom group)については,可能な情報変数の集合が,決定の子孫,次の決定の子孫,決定の情報親,または先行決定の情報親を含まないように制限しています.

情報変数を選択すると,Perform(実行)を押して,情報の価値分析を実行できます.事例での結果は,図3に示されています.

図 3: 選択された情報変数に対する情報の価値分析の結果

結果は,決定に対して選択されたそれぞれの情報変数の情報の価値を示します.各情報変数に1つのバーがあります.決定に対する情報変数の名前と情報変数の情報の価値が,各バーに関連づけされています.バーの長さは,決定の最大期待効用の大きさに比例します.

各オブザベーション・ノードについて表示された値は,決定前に観察されたノードがある場合とない場合の決定ノードの最大期待効用の差です.

ベイジアンネットワーク

ある仮説変数の確率分布に基づいて決定をしなけげばならない意思決定者の状況を考えます.たとえば,疾患変数の確率分布を仮定して,患者の治療上の決定を行う医師が考えられます.たとえば,疾患に苦しむ患者の確率があるしきい値よりも高い場合,患者は直ちに治療を受けるべきです. 治療上の決定に先行して,医師は検査を行うか特定の質問をするなどして,患者についての追加情報を収集するオプションを持つことができます.オプションの範囲があったとして,医師が次にどのオプションを選ぶべきか? つまり,仮定されたどのオプションが最も情報を生み出すか? これらの問いは,情報の価値分析によって答えることができます.

あるベイジアンネットワークと仮説変数を仮定し,タスクは,仮説変数に関してどの変数が最も情報量があるかを識別することです.

離散確率変数に関係する離散確率変数の情報価値に駆動される近視眼的な仮説を考えます.この機能は,離散確率ノードが選択されている場合か,ノード・リスト・パネルで離散確率ノード上で右マウス・ボタンを押しているときに使用可能です.

エントロピーと相互情報

追加情報を獲得する主要な動機は,考慮中の仮説に関する不確実性を減少させることです.次に観察する変数(たとえば,次にする質問)の選択は, エントロピーの考えに基づくことができます.エントロピーとは,変数のステートの周辺にどれだけの確率量が分布しているかの測度です(変数の分布でのカオスの度合い).エントロピーは, ランダム静の測度です.よりランダムは変数は,そのエントロピーがより高くなります.

X が n 個のステート x1,…,xn と 確率分布 P(X)を持つ離散確率変数とすると,X のエントロピーは,次式で定義されます:



確率分布 P(X) が一様のとき最大エントロピー log(n) が得られ,すべての確率量が単一のステートに置かれているとき最小エントロピー 0 が得られます.したがって, H(X) の値は,[0,log(n)] の範囲に入ります.

エントロピーは,変数の文王での不確実性の測度として用いられるので,観察がなされることによって,ある変数のエントロピーがどのように変化するかを決定できます.とくに,もっとも情報量の多いオブザベーションを識別できます.

Y が確率変数である場合,Yにおけるあるオブザベーションを仮定した X のエントロピーは,次式となります:



ここで I(X,Y) は, X と Y の相互情報(クロス・エントロピーとしても知られる)です.条件付きエントロピー H(X| Y) は, Y上のオブザベーションを仮定したXの不確実性の測度で,一方,相互情報 I(X,Y) は,X と Y で共有される情報の測度(すなわち,Y の観察からのエントロピーの低減)です.X が目的の変数とすると, I(X,Y) は,Yの観察の価値の測度です.相互情報は,次式で計算されます:.



原則的に, I(X,Y) は, P(X)P(Y) と P(X,Y)の間の距離の測度です.エビデンス ε の集合を仮定した条件付き相互情報が,利用可能なエビデンス ε での確率分布の条件付けによって計算されます:



したがって,我々は,可能なオブザベーション Y のそれぞれに対して I(X,Y) を計算します.次に観察する変数は,Xとの最高の非ゼロ相互情報, すなわち,もしあれば I(X,Y), を持つ変数 Y として選択されます.

情報の価値分析

情報の価値分析は,情報の欠片の価値を識別するタスクです.ベイジアンネットワークで情報の価値分析に駆動された仮説を考えるとき,我々はある情報シナリオの価値を決定するために,価値関数を定義する必要があります.エントロピーが価値関数として使用できます.

情報の価値分析に駆動された仮説では,情報シナリオの価値が仮説変数の確率分布の観点から定義されています.T が仮説変数であるとすると,価値関数は次式のように定義されます:



エントロピーの否定(マイナス)を使用する理由は,事例を用いてよく説明できます.ステートfalse および true を持つバイナリの仮説変数Tを考えます.ゆえに,T の分布は,単一のパラメータ pで完全に指定されます.すなわち, P(T)=(false,true)=(p,1-p).図4 は,エントロピーをf pの関数として説明し,一方,図 5 はエントロピーの否定を pの関数として説明します.

図 4: Tのエントロピー.

図 4 からわかるように,エントロピーは一様分布で最大値となり,極端なケース (p=0 および p=1)で最小値となります.価値関数は,極端なケースで最大値をとり,一様のケースで最小値をとるべきなので,図5に示すように,エントロピーの否定が価値関数として使用されます.

図 5: Tのエントロピーの否定.

変数 X の観察の後の情報シナリオの価値は:



したがって,ベイジアンネットワークでの情報の価値分析に駆動される近視眼的仮説は,初期情報シナリオの価値 V(H) とX が観察された場合の情報シナリオの価値,すなわち V(H| X) を計算することとなります.そのタスクは,情報の価値が最も増大する変数を識別することです.観察することに最も情報量の多い変数は,仮説変数によって最高の相互情報を持つ変数です.

情報の価値分析の実行

l選択された仮説変数での情報の価値分析は,ネットワーク・メニュー, ノード・リスト・パネルから,または,右クリックによって起動できます.情報の価値分析を起動するためには,仮説変数が選択されなければならないことに注意してください.

情報の価値分析は,離散確率変数に関係する離散確率変数についてサポートされています.

図 6 は,B 上で情報の価値分析を起動すると現れる情報の価値分析パネルを示しています.このパネルでは,情報の価値分析の結果が示され(図 8),情報変数が定義できま(図 7).

図 6: 仮説変数 B のエントロピーは H(B)=0.6876.

図 6 は,B のエントロピーが H(B)=0.6876 であることを示しています.

仮説変数での情報の価値分析が,情報変数の集合に対して実行されます.情報変数の集合が,図 7に示すように選択できます.

図 7: 情報変数の集合の選択.

情報変数の選択は,d-分離パネルでのインスタンス化のターゲットの選択と同様な方法で行われます.

情報変数の集合の選択のあと,実行を押すことによって情報の価値分析が実行できます.事例の結果は,図 8に示されています.

図 8: 選択された情報変数に対する B 上の情報の価値分析の結果.

結果は,ターゲット・ノードと選択された情報変数のそれぞれとの間の相互情報I(T,H) を示します.各情報変数ごとに1つのバーがあります.情報変数の名前とターゲット・ノードと情報変数との間の相互情報が,各バーで関連づけられています.バーのサイズは,相互情報とターゲット・ノードの間の比に比例します.


Back