特徴選択は,たとえばクラス分類のためのベイジアンネットワークの開発での重要なタスクです.HUGIN Graphical User Interface は,特徴選択アナライザーで特徴選択をサポートします.特徴選択アナライザーは3つのステップを持ちます:
各ステップを以下に説明します.
![]() |
|
図 1: データ・ソース・パネル.ケースの集合がインポートされたところ. |
特徴選択は,ターゲット・ノードに関して実行されます.ターゲット・ノードが,このパネルで選択されます.
![]() |
|
図 2: セットアップ・パネル. |
特徴選択は,離散確率ノードにのみサポートされています.すなわち,ターゲット・ノードと特徴ノードは,すべての離散確率ノードであるはずです.
図 3 は,事例のネットワークとデータ集合での特徴選択の結果を示します.
![]() |
|
図 3: 実行パネル. |
特徴選択をサポートするため,周辺独立の検定の p-値が計算されます.p-値は,独立性の仮定での末端確率(tail probability)です. 値が高いほど,ノードが独立でありそうです(pは,帰無仮説 -独立性の仮定- においてデータから計算されたQ値以上の Q 値を獲得する確率.Q 値は,特徴とターゲットの結合分布と特徴とターゲットの周辺分布の積の間の距離の測度).
したがって,小さい値(たとえば,有意水準アルファより小さい)については,そのノードが関係しないという帰無仮説は棄却され,故に,その特徴がターゲット・ノードに関係しているとみなします.
リスト中のノードの集合を選択すると,ウィザードを閉じるときに,それらのノードが選択されたままになります.これは,最も高いスコアの特徴を選択するのに便利です.