SOMデータマイニング・プロジェクトの進め方

SOMデータマイニングのプロジェクトは、基本的に以下の4つの部分からなります。

  1. データマートの作成(データ獲得・データ準備)
  2. モデルの作成
  3. モデルの適用
  4. モデルの評価

これらのワークフローをスパイラル上にぐるぐる回していくことで、より良いモデルへと近づいて行きます。もちろん、言うまでもなく、最初のデータマートの作成の前には、問題の定義がなされているべきであり、問題に関する基本的な理解が必要です。そして、データマートを作成する段階で基本的な統計解析がなされ、モデルの作成の段階で初期的なマップが可視化されることなどを通して、データの理解が徐々に深まっていきます。

データマイニング・プロジェクト

 

作成するモデルは、セグメンテーション・モデル予測モデルの2つに大別されます。したがって、これらのモデルの類型によって、プロジェクトの詳細が異なります。前ページで述べた(1)多次元データの可視化、(2)クラスタリング、(3)プロファイル分析、(4)クラス分類は、すべてのセグメンテーション・モデルの作成および適用に関する事柄です。分析の目的が何であれ、基本的に上記の4つのステップを繰り返して、スパイラルにプロジェクトを進めるのが基本です。

市販の書籍の影響で、クラスタリングのツールとしてSOMを使用したいという学術ユーザー様がとても多く、それは良いところに目をつけておられるのですが、あと一歩のところで、上手い使い方ができない場合が多いです。クラスタリングのページで再度説明しますが、クラスタリングを1回やっただけで、それだけが唯一の客観的で正しいクラスタリングであるはずだと決めつけて、それに沿って論文を書いてしまうのは、あまりに安直すぎると言わざる得ません。

クラスタ分析(クラスタリング)は、有用な新しいセグメンテーション(分類法)を発見するための道具です。クラスタの検証を行う計算があるにはありますが、そういうものを絶対視するのは危険です。それよりもクラスタごとの統計的特徴を精査(プロファイル分析)して、自分の目的に適したセグメンテーションを定義することが重要です。

クラスタリングは、変数選択・重みづけでいくらでも変化させることができます。それらのどれか1つだけが正しいのではなく、すべて正しいクラスタリングだと受け入れるべきです。そして、クラスタリングとプロファイル分析を通してセグメンテーションを定義して、それを実際的な判断に適用して、その結果によって、セグメンテーションの有効性を実証するのが、科学的方法ではないかと思われます。

予測モデルは、セグメンテーション・モデルとは異なる手法/ツールが必要とはなりますが、通常の総合的なデータマイニングとは異なり、どちらも共通してSOMの表現基盤を使用しているところに、SOMデータマイニングの強みがあります。セグメンテーション・モデルで作成したマップを予測モデル用のマップの最適化プロセスの初期マップとして用いたり、予測モデルで作成したマップをセグメンテーション・モデル用のツールで、さらに可視化・クラスタリング・プロファイル分析を行うことができます。

通常のデータマイニング・システムでは、分析の目的ごとにさまざまなツールがあって、それらを組み合わせて分析プロセスを構築することはできますが、それぞれにツールはそれぞれ異なる手法を用いていますので、SOMデータマイニングのように統合されたアプローチでモデルを解釈することができません。通常のデータマイニングを完璧に使いこなすには、たくさんの手法に精通しなければなりませんが、SOMデータマイニングでは、とにかくSOMの使い方の基本さえをマスターすれば、あらゆる問題に応用できる柔軟さがあります。

次ページ >

back to top

©2000-2014 Mindware Inc. All rights reserved.