日別アーカイブ 2014年12月4日

投稿者:

潜在クラス分析(クラスタ・モデルおよび回帰モデル)とは

XLSTATの潜在クラス分析のWebページを翻訳し終えました。
機能紹介:
潜在クラス・クラスタ・モデル
潜在クラス回帰モデル
チュートリアル:
潜在クラス・クラスタ・モデル
潜在クラス回帰モデル
これはかなり使えそうな強力なツールです。
XLSTAT-LGは、Statistical Innovations Inc. Latent Gold® という製品に基づいて開発されました。
じつは国内では先行して、2009年にExcelアドインの潜在クラス分析が他社から出ているのですが、今回はExcelアドイン統計解析としては世界的に本家本元として認知されているXLSTATへの搭載ということで、実装レベルが優れています。とくに潜在クラス回帰モデルでは、Excelから利用できる初の製品になるはずです。
潜在クラス・クラスタ・モデル
他社のWebページでは、すでに潜在クラス・クラスタ・モデルを「潜在クラス分析」として解説しているようです。
弊社では、常々「クラス分類とクラスタリングを混同してはいけない」と口酸っぱく言っているわけですが、このネーミングはユーザーを惑わせてしまいそうです。結論から言うと、これはクラスタ・モデルです。
ただし、従来のクラスタ分析とは異なるアプローチなので、区別するために「潜在クラス」という用語が使用されているようです。大きな違いは、ケースが完全にどれかのクラスタに割り当てられるのではなく、ケースごとに各クラスタへのメンバーシップ確率が計算されることです。このほか、説明変数に量的変数と質的変数のみでなく、順序変数が使用できるというところが違います。
統計的に有意なクラスタ数の決定ができるようにもなっています。かなり完成度の高い手法なのですが、そうなってくると、ユーザーがこの結果を「絶対的客観的な分析結果」として素朴に取り扱ってしまいそうだという心配も出てきます。ごく当たり前のことなのですが、利用可能な変数が多数存在する場合、クラスタリングは、どの変数を使用するかで結果が異なります。とても厄介な問題ですが、それこそが創造の源なので、そこから目をそらされることがないことを願います。
潜在クラス回帰モデル
潜在クラス回帰モデルは、線形重回帰モデルの改良版です。つまり、目的変数(従属変数)がある場合の手法です。データからたった1つの重回帰モデルを生成するのではなく、均質なクラスタを生成しておいて、クラスタごとに線形重回帰モデルを作成します。
説明変数(予測変数)には、量的変数と質的変数(名義変数)が使用でき、目的変数(従属変数)には、名義、順序、数値の応答タイプが選べます。
ちなみに、弊社が販売しているViscovery Predictorという製品では、SOMローカル回帰という手法を使っていて、それもこれと似たような考えで重回帰モデルを作成します。ただし、SOMローカル回帰ではSOMのノードごとに回帰モデルを作成しますので、全体的にほぼ曲面を近似するモデルとなります。
潜在クラス回帰モデルでは、データ空間を数個程度のクラスタに分割するところまでしかできません。なぜなら、あまりにデータを小さく分割しすぎると、1個1個の回帰モデルがあまりに少ないデータから作成されることになるので、モデルの信頼性が落ちるからです。
Viscovery Predictorではなぜ1000個とか多数のノードごとに回帰モデルが作成できるのか、そこには、もう一ひねり、二ひねりのアイデアがあるからです。詳細は割愛しますが、Viscovery Predictorのマニュアルを読めば目からウロコが落ちます。ただし、Viscovery Predictorでは基本的に目的変数を数値タイプとして取り扱います。
半歩先を行くお買い得商品
XLSTAT-LGがどれぐらいの規模までのデータに耐えられるのかは、まだこれからテストするところですが、超多次元データからセグメンテーション・モデルを作成するにはViscovery Profiler、超多次元データから回帰モデルを作成するには Visvovery Predictorがお薦めです。ただし、価格が高価です。
XLSTAT-LGは、XLSTAT-Proと同じ価格設定になっており、XLSTAT-Proは基本モジュールで必須ですので、結果として価格はXLSTAT-Proの2倍となりますが、それでもViscoveryに比べると、1/60ぐらいの価格です。
人間の認識能力の限界を突破して、多次元のデータ空間をビジュアルなマップで見ることのできるViscoveryの強みには及びませんが、とても安価な価格で、従来手法よりも半歩先を行くクラスタ・モデルと回帰モデルを入手できるという点では、XLSTAT-LGはかなりお買い得商品だと思います。