自己組織化マップへのラベリングについて

投稿者:

自己組織化マップへのラベリングについて

立場上SOMの活用法について質問を受けることが多いのですが,驚くほど多くの人が1つのパターンに陥っています.
それはSOMのマップにオブザベーションのラベルを貼って,その並び方を分析しようというものです.(しかも,その考察の仕方が非論理的でぐずぐずな場合すら少なくありません.)
確かにこういう使い方もできますが,これはSOMの使い方のほんの一部でしかありません.

もとを辿ればSOMアルゴリズムを考案したKohonen先生が,SOMの意味を説明するために動物マップという簡単なオモチャの事例を使ったことが始まりです.その説明の本義は,「SOMは概念形成モデルの1つのアプローチである」ということを示すことでした.
ところが皮肉なことに,それよりも,マップ上にラベルが配置されている表面的なイメージだけが定着してしまって,SOMの本格的な活用を阻む結果となってしまいました.
たくさんの書籍が前例に倣って同じ説明をしているために,SOMのイメージはますますこういうものだいうことになってしまっています.市販の本のほとんどすべてで,本格的なデータマイニングにおけるSOMの有効性を説明することには成功していません.
個々のオブザベーションのラベルを貼るというのは,ユーザーが個々のオブザベーションの違いをはっきり認識できている場合に限り有効です.つまり,ごく少数のオブザベーションしか分析の対象にならないということです.多くても数100個まででしょう.それ以上のラベルを貼っても人間の認識能力では把握できません.
つまり,この方法では,ごく小規模なデータしか取り扱えません.
SOMの真価はこんなものではありません.もっと大規模,たとえば数万件から数10万件のデータで,変数の数も数100とか,場合によっては数1000もあるようなデータを効率よくクラスタリング,セグメンテーションできるのです.(もっとも,そのためにはコアのSOMアルゴリズムだけでなく,より本格的なソフトウェアの実装が必要です.)
たとえば,これによって消費者の購買行動から新しいセグメンテーションを発見するということにつながります.さらには使い方によっては,5年後の消費者のニーズ/ウォンツの構造をシミュレーションする,ということさえできます.
弊社のコンサルティングを受けている,ごく一部の大企業ではこのような使い方に気づき始めていますが,それはまだまだ一部に限られています.
大規模なデータマイニング・プロジェクトで,SOMにラベルを貼るとしたら,それはマップの解釈を助けたり,チームで知識を共有するために,クラスタやセグメントに「名前をつける」ということに使います.あるいは,戦略的に重要な場所にカギとなる数値を貼りつける場合もあります.
というわけなのですが,あえて小規模なデータをもとにしたSOMにオブザベーションのラベルを貼るという使い方の利点を挙げるとすれば,それは従来のポジショニング・マップの欠点を補うというあたりだと思います.
つまり,それは「従来のポジショニング・マップは単純すぎる」という点です.よくある間違いは,分析者が「エイ,ヤー」とばかりに2つの軸を直観的に決めてしまうというやり方です.
ポジショニング・マップは,たいへんわかりやすく訴求力が高いので,ビジネス分野のあらゆる場面で使用されますが,根拠の乏しい軸を使ったポジショニング・マップは「騙しのテクニック」にもなりかねません.
したがって,ポジショニング・マップを作成するときは,主成分分析や多重コレスポンデンス分析,あるいは多次元尺度法などを使用するべきです.その中でSOMという選択肢もあるにはあります.もちろん,他手法と比較してSOMの利点もあります.
詳しくは弊社のコンサルティングを受けられることをお勧めします.
SOMデータマイニングの方法
*市販の本の中には,SOMの出力例として掲載されている図が,明らかにSOMではなく主成分分析か多次元尺度法のような平面への投影になっているような本も平気で出版されていますのでご注意ください.

投稿者について