Hugin 開発環境でのベイジアンネットワーク・テクノロジー

このテキストは,ベイジアンネットワーク,インフルエンス・ダイアグラム,および条件付きガウス型変数を持つネットワーク(ベイジアンネットワークとしても知られる)の概観を提供します.これらの詳細な情報とその他の問題は、特化されたセクションおよび チュートリアルにあります。

確率的グラフィカル・モデル(ベイジアンネットワークやインフルエンス・ダイアグラムがそのよい例です)は,とくに不確実性が内在するドメインに最適です.ベイジアンネットワーク・テクノロジーに基づくドメイン・モデルは,Huginディベロッパー・パーケージで提供されているJava API上に構築された使いやすいグラフィカル・ユーザー・インタフェースであるHugin グラフィカル・ユーザー・インタフェースを用いて作成できます.ネットワーク・テクノロジーを用いたスタンドアロン・アプリケーションは,アプリケーション・プログラマ用のHugin Decision Engine (HDE)の機能へのアクセスを提供するC,C++、Javaライブラリ,およびActiveXサーバーのシリーズである Hugin APIを用いて構築できます.

ベイジアンネットワーク

ベイジアンネットワークは,しばしば内在的な不確実性によって特徴づけられたドメインをモデルするために使用されます.(この不確実性は、ドメインの不完全な理解,タスクが実行されるべきのドメインの状態の不完全な知識,ドメインの振る舞いを支配する確率的なメカニズム,などのいずれか,または,その組み合わせに起因すると考えられます.)

正式には、ベイジアンネットワークは下記のように定義されます:

定義(ベイジアンネットワーク) ベイジアンネットワーク(Bayesian network)は,下記の特性を持つ有効非巡回グラフ(directed acyclic graph )である:

ノードは確率変数を表し,そしてエッジは変数間の確率的従属性を表します.これらの従属性は,条件付き確率表(CPT)の集合によって定量化されます:各変数は,その親を仮定して,その変数のCPTが割り当てられます.親を持たない変数では,これは無条件分布(またはに周辺分布とも呼ばれる)です.

事例 1

図 1:

肺の疾患に関する医学知識の構造的観点を表現するグラフ.

図 1 は,下記の擬似的な医学知識のピースに関するモデルを示します:

"Dyspnoea(呼吸困難) [d] は,tuberculosis(結核) [t], lung cancer(肺がん) [l] または bronchitis(気管支炎) [b], またはそれらが無い,またはそれらの1つ以上に起因すると考えられる. Visit to Asia (最近アジアを訪問した)[a] は tuberculosis(結核)のリスクを高め,一方, smoking(喫煙) [s] は,肺がんと気管支炎の両方のリスク因子であることが知られる. X-ray (単一の胸部X線の結果)[x] は,dyspnoea(呼吸困難)があろうとなかろうと,肺がんと結核の区別をしません" (Lauritzen & Spiegelhalter 1988).

最後のことは,グラフ中において,中間の変数 e で表現されています.この変数は,その2つの親 (t and l)の logical-or です.; それは,1つの疾患または両方の疾患の存在,または両方の不在を要約します.

ベイジアンネットワークの重要なコンセプトは,条件付き独立です.2つの変数の集合 AB は,第3の変数の集合C の値が既知の場合,Cを仮定して(条件付き)独立であると言います. すなわち,変数 B の値に関する知識は,変数 Aの値に関するさらなる情報を提供しません:

条件付き独立は,以下のようにしてグラフから直接読み取れます:A, B, および C が互いに素な集合であるとして,

ここで,A 内のある変数から B 内のある変数へのすべてのパスが C 内のある変数を含む場合,AC を仮定してB の条件付き独立である,といいます.(Lauritzen et al. 1990).

事例 2

もし患者が喫煙者だとわかった場合,我々は肺がんと気管支炎に関する信念を修正(リスクが増大)するでしょう.しかしながら,結核に関する我々の信念は変更されません(すなわち, t は,変数の空集合を仮定してs の条件付き独立).ここで,患者のX線の結果が陽性であったと仮定します.これは,結核と肺がんに関する我々の信念に影響しますが,気管支炎に関する信念には影響しません(すなわち,bsを仮定したx の条件付き独立).ただし,患者が呼吸困難であることもわかると,X線の結果は,気管支炎に関する信念にも影響します(なわち,b は,sd を仮定して,x の条件付き独立でない).

これらの独立/従属は,上記の方法を用いて,図1のグラフからすべて読み取れます.

この他,条件付き独立のステートメントを読むための同等でとても一般的な基準は,d-分離 (Pearl 1988)です.

推論

ベイジアンネットワークでの推論は,いくつかの変数の情報(エビデンス)を仮定して,その他の変数の条件付き確率を計算することを意味します.

これは,すべての利用可能なエビデンスが,興味対象の変数の先祖である変数上にある場合は簡単です.しかし,エビデンスが興味対象の変数の子孫で利用可能な場合は,我々はエッジの方向と反対方向に推論を実行しなければなりません.これを達成するために,我々はベイズの定理を採用します:

Hugin の推論は,本質的にベイズの定理の賢明な応用です;詳細は,Jensen 等(1990(1))の論文に書かれております.

インフルエンス・ダイアグラム

インフルエンス・ダイアグラム は,決定ノードと効用ノードで拡張されたベイジアンネットワークです(インフルエンス・ダイアグラムの確率変数は,しばしば,チャンス変数と呼ばれます).決定ノードへのエッジは,時間順位を示します.確率変数から決定変数へのエッジは,決定がなされたときに確率変数の値がわかることを示し,1つの決定変数から他の決定変数へのエッジは,対応する決定の時間的順序を示します.ネットワークは非巡回でなければならず,ネットワーク中のすべての決定ノードを含む有向パスが存在しなければなりません.

我々は,我々のアプリケーションについて最も可能な決定をすることに興味があります.したがって,我々は効用をネットワークのステート・コンフィギュレーションに関連づけます.これらの効用は,効用ノードで表現されます.各効用ノードは,その親のステートの各コンフィギュレーションに効用を関連づける効用関数を持ちます.(効用ノードは子を持ちません).決定をすることにより,ネットワークのコンフィギュレーションの確率を操ります.したがって,我々は各決定代案の期待効用を計算します(グローバル効用関数は,すべてのローカル効用関数の合計です).我々は,最も高い期待効用によって代案を選択できます;これは最大期待効用原理(maximum expected utility principle)として知られています.

インフルエンス・ダイアグラム内の最初の決定ノードの親である変数の値を観察すると,我々はこの決定の代案の最大期待効用を知りたくなります.Hugin Decision Engine は,未来のすべての決定が(各決定のときにすべての利用可能なエビデンスを用いて)最適な方法でなされることを仮定して,これらの効用を計算します.同様な考慮が,残りの決定にも適用されます.

Hugin Decision Engine でのインフルエンス・ダイアグラムの実装の基礎となる計算方法は, Jensen, Jensen & Dittmer (1994)で説明されています.

事例 3

図 2:

石油試掘者問題のインフルエンス・ダイアグラム:T は試験を行うかどうかの決定を表現; D は掘削を行うかどうかの決定;S は(石油試掘者が試験を行うと決定した場合)地震探査試験の結果を表現;H は穴の状態を表現;C は地震探査試験に関係するコストを表現;そして P は掘削の関係する期待利得を表現している.

石油試掘者は,掘削を行うかどうかの決定をしなければなりません.彼は,穴が dry(乾燥しているか), wet(湿っているか),あるいはsoaking(浸漬しているか)確かではありません.その場所の潜在的な地質構造の決定を助ける自信探査には $10,000のコストがかかります.探査は,地形が閉構造(good:良い),開構造(so-so:まあまあ),無構造(bad:悪い)のいずれであるかを明らかにします.

掘削のコストは $70,000です.石油試掘者が掘削を決定した場合,その期待利得(発見された石油の価値マイナス掘削のコスト)は,もし穴がdry なら$-70,000,もし穴がwet なら$50,000,そして穴がsoakingなら$200,000 で,もし石油試掘者が掘削を決定しなければ(もちろん)$0です.

専門家は,穴の状態について下記の確率分布を推定しました: P(dry)=0.5, P(wet)=0.3, そして P(soaking)=0.2. さらに,地震探査試験は完全ではありません;穴の状態を仮定した試験の結果の条件付き確率は次のようになります:

  dry wet soaking
closed structure 0.1 0.3 0.5
open structure 0.3 0.4 0.4
no structure 0.6 0.3 0.1

図 2 は,石油試掘者の意思決定問題に関するインフルエンス・ダイアグラムを示します.確率変数は楕円で描かれ,決定変数は四角で描かれ,効用はひし形で描かれます.

このインフルエンス・ダイアグラムをもとにして,Hugin Decision Engine は,試験を行う場合の効用を$22,500であると計算し,試験を行わない場合の効用を$20,000であると計算します.したがって,最適な戦略は,地震探査試験を実行することで,そして,試験の結果に基づいて掘削を行うかどうかを決定します.

[この事例は, Raiffa (1968)によるものです. この事例のより詳細な説明は,事例 の節にあります.]

条件付きガウシアン変数によるネットワーク

Hugin Decision Engine は,離散と連続の両方の確率変数を持つネットワークを取り扱えます.連続確率変数は,親の値に条件づけられるガウス型(または正規)分布を持たなければなりません.

離散親 I連続親 Z を持つ連続変数 Y の分布は,親の値に条件付けられる(1次元の)ガウス型分布です: 

平均値は連続親変数に線形的に従属し,分散は連続親変数に従属しないことに注意してください.ただし,その線形関数と分散は,離散親変数に従属することが可能です.これらの制約は,正確な推論が可能なことを保証します.

離散変数は,連続親を持つことができないことに注意してください.

事例 4

図 3 は,廃棄物焼却炉のネットワークを示します(Lauritzen 1992):

"廃棄物焼却炉からの(粉塵と重金属の)排出は,投入廃棄物 [W]の組成的差異によって異なります.もうひとつの重要な因子は,廃棄物の燃焼管理 [B]で,それは排出 [C] におけるCO2 の濃度測定でモニタされます.フィルタ効率 [E] は,電子フィルタの技術的状態 [F] と廃棄物の量と組成 [W] に従属します.重金属の排出 [Mo] は,一般的に,投入廃棄物の金属濃度 [Mi] と粉塵の排出 [D] に従属します.粉塵の排出 [D] は,光の透過性 [L] でモニタされます."

図 3: 廃棄物焼却炉モデルの構造的観点: B, F, およびW は離散確率,一方,残りの変数は連続.

条件付きガウシアン変数を含むネットワーク・モデル内の推論の結果は, - 通常どおり - エビデンスを仮定した個々の変数の信念(すなわち,周辺分布)です.離散変数では,それはその変数のステート上の確率分布になります. 条件付きガウシアン変数では,2つの測度が提供されます:

  1. 分布の平均値と分散;
  2. 一般的に分布が単純なガウス型分布ではなく,ガウス型の混合(すなわち,重み付き合計)なので,各ガウス型のパラメータ(重み,平均,分散)の一覧が利用可能である.

事例 5

図3に示すネットワークから(離散変数 B, F, W がすべてバイナリであると仮定して),次のことがわかります.


Back