特徴選択アナライザー

特徴選択は,たとえばクラス分類のためのベイジアンネットワークの開発での重要なタスクです.HUGIN Graphical User Interface は,特徴選択アナライザーで特徴選択をサポートします.特徴選択アナライザーは3つのステップを持ちます:

  • 特徴選択のためのデータを読み込み
  • 特徴選択のターゲット変数の選択(たとえば,クラス分類変数)
  • 特徴選択
  • 各ステップを以下に説明します.

    データ・ファイルの読み込み

    どのような分析を実行するにも,ウィザードはますケースの集合を必要とします. ケースは,hugin データ・ファイルを読み込むか,データベースに接続してインポートできます.データをインポートするには,"データ・ソース"ボタンをクリックしてください.ケースの集合をインポートすると,データ・ソース・パネルが,インポートされたケースの表を表示します(図 1).インポートされたすべてのケースを破棄するには, "データ・クリア"ボタンをクリックします.

    図 1: データ・ソース・パネル.ケースの集合がインポートされたところ.

    ターゲット・ノードを選択

    特徴選択は,ターゲット・ノードに関して実行されます.ターゲット・ノードが,このパネルで選択されます.

    図 2: セットアップ・パネル.

    特徴選択は,離散確率ノードにのみサポートされています.すなわち,ターゲット・ノードと特徴ノードは,すべての離散確率ノードであるはずです.

    特徴選択

    特徴選択は,選択されたターゲット・ノードと可能な各特徴ノードとの間の周辺独立に関する検定の p-値の計算に基づきます.

    図 3 は,事例のネットワークとデータ集合での特徴選択の結果を示します.

    図 3: 実行パネル.

    特徴選択をサポートするため,周辺独立の検定の p-値が計算されます.p-値は,独立性の仮定での末端確率(tail probability)です. 値が高いほど,ノードが独立でありそうです(pは,帰無仮説 -独立性の仮定- においてデータから計算されたQ値以上の Q 値を獲得する確率.Q 値は,特徴とターゲットの結合分布と特徴とターゲットの周辺分布の積の間の距離の測度).

    したがって,小さい値(たとえば,有意水準アルファより小さい)については,そのノードが関係しないという帰無仮説は棄却され,故に,その特徴がターゲット・ノードに関係しているとみなします.

    リスト中のノードの集合を選択すると,ウィザードを閉じるときに,それらのノードが選択されたままになります.これは,最も高いスコアの特徴を選択するのに便利です.

    Back