月別アーカイブ 9月 2010

投稿者:

XLSTATチュートリアル更新しました

商品企画・マーケティング関連での応用が期待されるXLSTAT-MXおよびXLSTAT-PLSPMに関する以下のチュートリアルを更新しました.
XLSTAT-MX
官能分析の実験計画法
TURF分析(市場ポテンシャルの分析)
XLSTAT-PLSPM
REBUS法によるセグメンテーション
REBUS法は,PLSパス・モデリング(構造方程式モデル)に適合させてセグメントを検出する手法で,たとえば,アンケート調査データに基づいて消費者セグメントを分析する新しい方法として期待されます.
PLSパス・モデリングは,共分散構造分析に代わる新しい構造方程式モデルのアプローチです.

投稿者:

自己組織化マップへのラベリングについて

立場上SOMの活用法について質問を受けることが多いのですが,驚くほど多くの人が1つのパターンに陥っています.
それはSOMのマップにオブザベーションのラベルを貼って,その並び方を分析しようというものです.(しかも,その考察の仕方が非論理的でぐずぐずな場合すら少なくありません.)
確かにこういう使い方もできますが,これはSOMの使い方のほんの一部でしかありません.

もとを辿ればSOMアルゴリズムを考案したKohonen先生が,SOMの意味を説明するために動物マップという簡単なオモチャの事例を使ったことが始まりです.その説明の本義は,「SOMは概念形成モデルの1つのアプローチである」ということを示すことでした.
ところが皮肉なことに,それよりも,マップ上にラベルが配置されている表面的なイメージだけが定着してしまって,SOMの本格的な活用を阻む結果となってしまいました.
たくさんの書籍が前例に倣って同じ説明をしているために,SOMのイメージはますますこういうものだいうことになってしまっています.市販の本のほとんどすべてで,本格的なデータマイニングにおけるSOMの有効性を説明することには成功していません.
個々のオブザベーションのラベルを貼るというのは,ユーザーが個々のオブザベーションの違いをはっきり認識できている場合に限り有効です.つまり,ごく少数のオブザベーションしか分析の対象にならないということです.多くても数100個まででしょう.それ以上のラベルを貼っても人間の認識能力では把握できません.
つまり,この方法では,ごく小規模なデータしか取り扱えません.
SOMの真価はこんなものではありません.もっと大規模,たとえば数万件から数10万件のデータで,変数の数も数100とか,場合によっては数1000もあるようなデータを効率よくクラスタリング,セグメンテーションできるのです.(もっとも,そのためにはコアのSOMアルゴリズムだけでなく,より本格的なソフトウェアの実装が必要です.)
たとえば,これによって消費者の購買行動から新しいセグメンテーションを発見するということにつながります.さらには使い方によっては,5年後の消費者のニーズ/ウォンツの構造をシミュレーションする,ということさえできます.
弊社のコンサルティングを受けている,ごく一部の大企業ではこのような使い方に気づき始めていますが,それはまだまだ一部に限られています.
大規模なデータマイニング・プロジェクトで,SOMにラベルを貼るとしたら,それはマップの解釈を助けたり,チームで知識を共有するために,クラスタやセグメントに「名前をつける」ということに使います.あるいは,戦略的に重要な場所にカギとなる数値を貼りつける場合もあります.
というわけなのですが,あえて小規模なデータをもとにしたSOMにオブザベーションのラベルを貼るという使い方の利点を挙げるとすれば,それは従来のポジショニング・マップの欠点を補うというあたりだと思います.
つまり,それは「従来のポジショニング・マップは単純すぎる」という点です.よくある間違いは,分析者が「エイ,ヤー」とばかりに2つの軸を直観的に決めてしまうというやり方です.
ポジショニング・マップは,たいへんわかりやすく訴求力が高いので,ビジネス分野のあらゆる場面で使用されますが,根拠の乏しい軸を使ったポジショニング・マップは「騙しのテクニック」にもなりかねません.
したがって,ポジショニング・マップを作成するときは,主成分分析や多重コレスポンデンス分析,あるいは多次元尺度法などを使用するべきです.その中でSOMという選択肢もあるにはあります.もちろん,他手法と比較してSOMの利点もあります.
詳しくは弊社のコンサルティングを受けられることをお勧めします.
SOMデータマイニングの方法
*市販の本の中には,SOMの出力例として掲載されている図が,明らかにSOMではなく主成分分析か多次元尺度法のような平面への投影になっているような本も平気で出版されていますのでご注意ください.

投稿者:

XLSTAT 2010.5 日本語メニューの修正

XLSTATの日本語メニューを一部修正しました.
最新版(ソフトウェア)は下記からダウンロードしてください.
Windows版
Mac版

投稿者:

Hugin GUIマニュアル

更新しました。
ver 7.3に対応しています。
ダウンロード

投稿者:

XLSTAT 2010.5 リリース

XLSTAT 2010.5がリリースされました。
新バージョンには下記の機能が追加されました:
– 多項適合度検定 (XLSTAT-Pro / パラメトリック検定)
– 1/2群の比率検定の新オプション(XLSTAT-Pro / パラメトリック検定)
– TURF分析 (XLSTAT-MX)
– ARIMAアルゴリズムの改善 (XLSTAT-Time)
– 検出力分析と標本サイズ最適化 (XLSTAT-Power)
また、ピアソン・エデュケーション社が米国およびカナダで出版している教科書”Introductory statistics”の付録としてXLSTATのlightバージョンを添付して配布することで同社と合意しました。これにより年間10万人以上の新ユーザーにXLSTATを提供することになります。
*XLSTATに興味のある日本の出版社も、ぜひマインドウェア総研にご相談ください。

投稿者:

XLSTAT日本語マニュアル

XLSTATの日本語マニュアルが,「データ準備」,「データ記述」に関する機能に加えて,「データ解析」の機能に関する部分まで一通り翻訳できました.
以下のデータ解析機能についての説明が加えられました.
因子分析(FA)
主成分分析(PCA)
判別分析(DA)
コレスポンデンス分析(CA)
多重コレスポンデンス分析(MCA)
多次元尺度法(MDS)
K-meansクラスタリング
凝集型階層クラスタリング(AHC)
単変量クラスタリング
ダウンロード
これでデータ準備からデータ解析まで一般的な作業についてはカバーできました.たとえば,ビジネス・ユーザーのほとんどのデータ分析ニーズには,ここまでの機能で対応できます.
残るは,回帰分析や分散分析,各種検定,さらに各追加モジュールの高度な手法に関する部分です.