制限記憶インフルエンス・ダイアグラム

制限記憶インフルエンス・ダイアグラム( limited memory influence diagramは、決定機能(決定ノード効用ノード)で拡張されたベイジアンネットワークです。 制限記憶インフルエンス・ダイアグラム (LIMID) は,2つの基本的な仮定(非忘却意思決定者と決定の完全順序)の緩和によって従来のインフルエンス・ダイアグラムを拡張します。LIMID では、意思決定者にとって利用可能なすべての情報が、情報 リンク と非順序による決定を用いて指定されなければならない。

意思決定者の非忘却仮定の除去により、LIMIDでは、意思決定者にとってどの情報が利用可能であるかを各決定で正確に指定することが重要です。 決定をなす前に観察されている各変数は、決定に向かうリンクを持ちます。 あるノードにステートが意思決定の時点で既知であるなら、それは(たぶん)意思決定者がすべきことに影響を持つでしょう。したがって、そのノードから決定ノードへのリンクを追加しなければなりません。 

ノード X が決定 Di の(情報の)親であるが、後続の決定 Dj の親ではない場合、X は、決定 Di に先立ってわかっており、後続の決定 Dj の時にはわかっていないことを含意します。 これは、2番目の決定で、その観察が意思決定者にはあかっていないことを含意します。 

LIMID の解は、各決定で1つのポリシーからなる戦略です。 ポリシーは、既知の変数から決定のステートへの関数です。意思決定者は、落葉に関する直近の観察のみがわかっているので、過去のすべてのオブザベーションの関数ではありません。これは、意思決定者が非忘却であることを仮定して、ポリシーが過去のすべてのオブザベーションと決定の関数である従来のインフルエンス・ダイアグラムとは異なります。決定について完全順序があるとは限りません。

LIMID での各決定は、手入力または数式を用いてユーザーによって定義できる初期ポリシーを持ちます。初期ポリシーは、決定の親の配置から決定のステートへのマッピングを指定する表です。この初期ポリシーは、LIMIDを解く過程で更新されます。

LIMID の解は、単一ポリシー更新を用いて決定されます。

インフルエンス・ダイアグラムは、連続確率ノードを含むことはできません。


Back

翻訳者:多田くにひろ(マインドウェア総研