平行座標とは
データ中の各変数軸を平行な垂直座標として横に並べ、軸の下端を最小値・上端を最大値として、各データ・レコード(データ項目)を折れ線で表現する。
変数の従属性
隣り合う変数軸の間で折れ線が交わっていない場合は、正の相関・交わっている場合は負の相関を意味する。クエリーを用いることによって、データのローカルな相関を発見することができる。
クエリー
- 区間クエリー; 変数の指定された区間に属する部分集合の識別
- 角度クエリー; 指定された角度の正の相関を持つ部分集合の識別
- ピンチ・クエリー; 負の相関を持つ部分集合の識別
が可能で、さらにこれらのクエリーをブール演算子で組み合わせることができる。クエリーで識別されたデータ項目の数とその全体での比率(%)が表示される。
ラッピング技法(ルール学習)
指定されたカテゴリの部分集合をデータ空間中で"包む"凸曲面を考えて、それをできるだけシンプルに近似する各変数での条件を"ルール"として生成する。
変数並べ替えと散布図
クラス分類ルールへの寄与度の高い順番に変数を並べ替え、寄与度の高い変数同士の散布図を見ることができる。
|