手術用メスで鯨を解体!?

投稿者:

手術用メスで鯨を解体!?

金融とか経済とか、社会のさまざまな複雑な現象について、統計手法を適用する際、場合によっては、手術用メスで鯨を解体する(もし大げさなら、「果物ナイフでマグロを解体」でもいいですが)ようなことになりそうなことが、ときどき見られます。
統計学は「科学の文法」と言われますが、やみくもに統計手法を使えば、何でも科学的になるわけではなく、「科学的方法」の中で使用するべきかと考えます。
科学の常とう手段として、まずは不要なものを取り除いて、できるだけ問題を単純化・理想化してから理論を構築するとか、複雑な全体を分解して、より単純になった要素について議論をするとか、あるいは限定された特殊な条件のもとで初期の理論を構築して、そのあとで段階的に一般化していくといったようなことをやります。
大抵のモデル(または理論、仮説)は、適用される範囲を注意深く限定することによって成り立っています。万能なモデルを作成するのは不可能です。
たとえば、金融機関の顧客について分析する場合、そこにはさまざまな人々がいます。「人生いろいろ」です。人それぞれ境遇も異なり、能力も異なり、考え方も異なります。そんな多様な人々の行動をたった1つの線形モデルで表現できると考えるほうがおかしい、ということに<早く!>気づいてください。
このような場合、従来の回帰分析でも「層別化」というテクニックがあります。単純な言い方をすれば、男性と女性では、異なる回帰式をあてはめたほうが精度がよくなるというような話です。
しかしながら、これにも限界があります。連続値(たとえば年収)で層別化しようとする場合、つまり、高所得者と低所得者をどこで分ければよいかがわかりません。その区分の仕方によって、結果がコロコロ変わるのです。
たとえば、都会で単身や核家族で生活するのと、田舎で年老いた両親(家付き・年金付き)と生活するのでは、同じ所得額でも生活の余裕というものが違います。諸条件によって、所得額の意味が違ってきます。
つまり、変量ごとに別々に離散化(カテゴリ化)をするのは危険だということです。弊社のHPでも説明しておりますが、それでは多変量空間でのデータの分布を無視して区割りをしてしまっているので、本来は一緒にするべき集団を分けていたり、別々の集団であるはずのものを同じ集団としてカウントしていることになります。

したがって、経済分野のような複雑な現象を扱う分野では、多変量でクラスタ分析をして、より均質なグループを作り出して、それぞれのグループについて、それぞれ分析を行うというステップをとられるのが、より良いアプローチです。ただし、一般的な統計ソフトで、それをやるのは、これまた困難がつきまといます。それに気づいた一部の人たちは、自己組織化マップを高度な統計解析の基盤(足場)として利用できるViscoveryを採用し始めているわけです。

投稿者について