SOMローカル回帰モデル
自己組織化マップは、データを可視化するだけでなく、非線形モデルの足場を提供するところに、その利用価値があります。
現実世界の複雑な現象は、非線形の性質を有しています。従来の統計的手法の多くは、このような非線形のモデルを作ることはできないのです。あるいはニューラルネットワークなどで非線形モデルを作成しても、人間が解釈することができないという問題がありました。
「非線形」というのは、簡単に言えば、「何らかの法則性は認められるのだけれども、それが全くの一定ではなくて、条件が変わると法則性も変動する」というようなことです。つまり、変数どうしの関係をグラフにすると「曲線」になるということです。また、それはたくさんの変数が複雑に影響しあっていることを暗示しています。
上図のようにオブザベーションの分布が全体に曲がりくねっている場合、曲線(または曲面)でモデルを作成するのが自然です。直線(または平面)でモデルを作成するとモデルとオブザベーションとのギャップが大きくなりすぎるところができてしまいます。しかしながら、多変量データについて、解釈可能な非線形モデルを作成するのが難しいのです。
このような場合、自己組織化マップの各ノードにローカルな線形モデルを作成すると、従来の統計モデルの記述性を活かしながら、非線形性に対応したモデルを構築できるのです。Viscovery
Predictorでは、マップのノードごとにローカルな線形重回帰モデルを作成しますので、通常の要素マップのほかに、回帰係数やF危険率、修正済み決定係数のマップも作成されます。(1)
これにより通常の線形重回帰モデルと比べて、確実に説明される分散の割合が増え、残差が減少します。CRMにおける潜在顧客の抽出(アップセリング/クロスセリング)や取引リスクの予測などに、これを利用すると統計ソフト系の他社データマイニング・システムを採用した場合と比べて、マーケティングの効率を確実に約7%向上させることができます。(データマイニングを採用しない場合と比べると、さらに大幅に数10%向上します。)
 |
SOMによるローカル線形モデルは、ディジタル技術によるアナログ表現と同様な原理です。今日、CDやDVD、パソコンなどでリアルな映像や音声を楽しむことができるようになったのは、上図(a)のように、ディジタル信号の解像度をぐっと高めて、アナログ信号を近似しているからです。これと同様に線形モデルも空間を分割して、解像度を高めると非線形モデルを近似することができます。そのときの空間分割の足場を提供するのがSOMなのです。(2)
えてして世の中では、解釈可能な論理的モデルを優先するあまり、現実の複雑さを無視した単純すぎるモデルを採用し、しかもそれを頑なに「科学的・客観的である」と主張して譲らないということが起きてしまいます。その結果、多くの人が現実から乖離した誤判断に苦しめられることになります。たとえば原爆被害者の認定や介護保険の認定の問題などがその典型例です。
役所の非効率さを「お役所仕事」と言って揶揄しますが、その根本原因は「単純すぎるモデル」にあったのです。また役所に限らず大企業などの組織でも同様な問題があります。非線形への対応とは、融通の利かないガチガチの論理に柔軟性を与えることです。SOMローカル回帰モデルは、これまで解決が難しかった多くの問題の解決に役立ちます。(3)
(1) SOMローカル回帰手法は、Eudaptics社によって特許を取得されております。
(2) 原理は単純ですが、ディジタル機器がそんなに単純なものではないのと同様、実用のSOMローカル回帰(Viscovery
Predictor)には、モデルの自動最適化やモデル検証などの機構が含まれますので、きわめて高度なシステムです。
(3) この場合の柔軟性は「いい加減」ということではなく、合理性を保ちながら複雑な現実に適応するということです。
|