分析ウィザード

分析ウィザードは,ネットワーク上でさまざまな種類の分析を実行します;ケースの集合に基づいて,ウィザードはzard will calulate the AIC-, BIC- および log-尤度スコアを計算し,さまざまなデータ従属性や正確さの分析を実行します.

分析ウィザードは,ウィザード・メニューの"分析ウィザード" を選択すると起動できます. 分析ウィザードを起動するには,ネットワークが実行モードになっていて,離散確率ノードのみで構成されていなければならないことに注意してください.

分析ウィザードが起動されると,"データ・ソース" パネルを表示しているウィンドウが現れます.図 1 参照. このウィンドウには5つのタブがあります: "データ・ソース",, "AIC/BIC/ll", "従属性", "データの正確さ" および "サンプリング".

図 1: 空のデータソース・パネル; 分析ウィザードを起動すると表示されるウィンドウ.

データソース・パネル

分析を実行するには,ウィザードがまずケースの集合を必要とします.ケースは,次のようにしてインポートできます:

  • hugin データ・ファイルを読み込み,
  • ネットワークから(もしあれば)ケースをコピーして,
  • または多数のケースを無作為抽出して.
  • hugin データ・ファイルを読み込むには"ファイルを選択(データソース)"ボタン,ネットワークからケースをコピーするには "ネットワークからケースを使用" ボタン,多数の無作為ケースを使用するデータソースとして抽出するには"サンプリング" タブをクリックします.

    ケースの集合をインポートすると,データソース・パネルはインポートしたケースを表に表示します.図2参照.インポートしたすべてのケースを破棄するには "データをクリア"ボタンをクリックします.

    図 2: データソース・パネル.ケースの集合がインポートされたところ.

    サンプリング・パネル

    "サンプリング" をクリックすると,サンプリング・パネルが前に出てきます.サンプリング・パネルは,図3に示されています.

    図 3: サンプリング・パネル.

    ケースは,2種類の方法で生成できます: MCAR (Missing Completely at Random) または MAR (Missing at Random). MCARは,生成されるケース中のいくつかのノードの値をランダムに消去して,いくつかの値を N/A に設定します(すなわち,MCAR は,1度に1ケースではなく,生成されるケースのすべての値を考慮します).

    MAR は,自動生成されるテンプレートに基づいて,ケース中のいくつかの値を N/A に設定します.これらのテンプレートは,いくつかのノードが特定の値を持つなら,そのノードの部分集合の値をランダムにN/Aに設定します.テンプレートの仕様は,ランダムに生成されることに注意してください.

    両方とも,オブザベーションの特定の集合で生成されたケースの数への要因として,条件付き確率分布が考慮されます.また MCAR も MAR も欠損値のパーセンテージを指定することができます.

    生成されるケースは, "標本のコンフィギュレーション"コンボボックスで選ばれたシナリオで与えられる条件付き確率分布に基づいて生成されます.

    生成されたケースが,現在インポートされているケースの集合に追加されます.

    AIC/BIC/ll パネル

    "AIC/BIC/ll" タブをクリックすると,AIC/BIC/ll パネルが前に出てきます.図 4. このウィザードは,ケース・データが与えられたモデルのAIC, BIC およびlog-尤度スコアを計算します.

    図 4: AIC/BIC/ll パネル.

    従属性パネル

    "従属性" タブをクリックすると,データの従属性パネルが前に出てきます.図 5.

    図 5: データの従属性パネル.

    従属性パネルは,ノードの相互情報を調査することを可能にします.スライダーによるしきい値の設定に基づいて,ノード間の相互情報によってエッジが隠されます. "完全なグラフ"チェックボックスをクリックして,すべてのノードの相互情報の調査と有向エッジを持つノードの相互情報の調査の間でトグルします.相互情報は, "ケース入力" ドロップ・ダウン・ボックスで選択したケースに基づいて計算されます.

    パネル上部のボタンは,ネットワークの表示をズーミングしたり,できるだけスライダーのスケールに合わせたりすることを可能にします.

    データの正確さパネル

    "データの正確さ" タブをクリックすると,データの正確さ分析パネルが前に出てきます.図 6. ノードとケースの集合が与えられて,このパネルはネットワークがケースにどれぐらいよく整合するかの情報によって分析レポートを生成します.

    図 6: データの正確さパネル.

    このパネルは,どのノードを分析するかを選ぶ上部のドロップ・ダウン・ボックスと,分析レポートと,ケースを表示する表の3つのパネルからなります.
    分析レポート
    分析レポートは,分析に用いたケースの数を一覧します(現在のノードのオブザベーションがないケースのみが無視されます). 観察されたステートが予測にどれぐらい整合するかを示す混合行列(confusion matrix)が生成されます(あるノードが同じ最大確率を持つ複数のステートを持つ場合,それらの1つが予測されたステートとしてランダムに選択されることに注意してください).どれだけのケースが実際に予測と整合しているかを示す誤差率が計算されます.平均のユークリッドおよび対数距離もレポートされます.
    ケースの表
    この表は,分析に使用するケースを示します.分析のために選択されたノードは,常にこの表の最後から2番目の列に置かれます.表中の最後の列は,そのノード自身のステートについての情報なしでケースを与え,ケース中で観察されたステートにあるノードの確率をレポートします. 整合しているケースあ緑色,整合していないケースは赤,無視されたケースは青で色づけされます. 整合とは,そのノードについて予測されたステートが,ケース中で観察されたのと同じステートである場合のことです.


    Back