月別アーカイブ 10月 2010

投稿者:

価格改定

為替調整のためViscovery製品・Hugin製品の価格を改定しました.
大幅に値下げされていますので,今がチャンスです.

投稿者:

XLSTAT日本語マニュアル

XLSTATの日本語マニュアルが,「データ準備」,「データ記述」,「データ解析」の機能に関する部分に加えて,「データモデリング」の機能に関するところまで翻訳できました.
データモデリングについては,以下の機能の説明があります:
分布の適合
線形回帰
ANOVA
ANCOVA
反復測定ANOVA
混合モデル
ロジスティック回帰
ノンパラメトリック回帰
非線形回帰
クラス分類木および回帰木
PLS/PCR/OLS回帰
ダウンロード

投稿者:

プロクラステス分析

官能評価分析で「プロクラステス分析」という用語が出てきます.
専門家が製品を何段階かの尺度で評価するときに,専門家によって,尺度のより広い範囲を使って評価する人と狭い範囲しか使わない人,さらに尺度の高い部分を中心に使う人と低い部分を使う人がいます.つまり,同じ評点でも,人によってその意味が違うということになります.このような不都合を補正して,より共通した尺度で評価結果のデータを分析するのが,一般化プロクラステス分析(GPA: Generalized Procrustes Analysis)です.
それで,どうして「プロクラステス」という聞きなれない言葉が出てくるのか?という疑問が湧いてきます.何かとんでもなく難解な専門用語という感じがします.
インターネットでちょっと調べるとわかりました.語源は,ギリシャ神話に登場する巨人・プロクルーステースです.ギリシャ語では「伸ばす人」という意味らしいです.
以下,ウィキペディアからの引用ですが:

プロクルーステースはエレウシースの外側の丘にアジトを持っていた。そこには、鉄の寝台があり、通りがかった人々に「休ませてやろう」と声をかけ、隠れ家に連れて行き、寝台に寝かせた。もし相手の体が寝台からはみ出したら、その部分を切断し、逆に、寝台の長さに足りなかったら、サイズが合うまで、体を引き伸ばす拷問にかけた。

教育問題では,Procrustes Bed(プロクルステスの寝台)という用語が使われているそうで,つまり,それは「画一化」という教育の負の側面を指しているようです.
話を統計に戻すと,GPA以外にも,因子分析で「プロクラステス回転」という用語もあります.「プロクラステス」という用語は,異なる複数のデータ集合や,異なる複数のモデルを共通の視点から比較しようとするときに使われるようです.
と,いうことで,プロクラステス分析という用語に,何となく茶目っけすら感じられて,より一層身近になった気がします.
プロクラステス分析(GPA)は,XLSTAT-MXで利用できます.

投稿者:

Handbook of Partial Least Squares 入手しました


Springerから出版されたV.Esposito Vinziらによる”Handbook of Partial Least Squares”が今日手元に届きました.高額な本で入手経路によって価格がまちまちですが,ドイツの業者から2万円ちょっとで買いました.
PLS手法の総合的なハンドブックです.PLS回帰からPLSパス・モデリングまで,手法から応用まで,ソフトウェアから結果の解釈までカバーされています.
それで,この本の一番最後の論文として掲載されているのが,XLSTATを用いて自動車のエアコンに対する顧客の嗜好を分析した論文です.使われている手法は,GPA(一般プロクラステス分析)とPLS回帰の組み合わせです.
ほかにも多数のPLS関係の論文が集められており,PLS手法の全体を見渡して,実務ユーザーとしては応用のヒントを得るのに好都合です.手法に関するタイムリーなトピックとしては,REBUSアルゴリズムによるセグメンテーションの発見について,その動作をつぶさに見ることができます.
全体で800ページ弱のボリュームで言語は英語です.これまではPLSに関してはフランス語の本はあっても,英語でもあまり情報がなかった時期もありましたので,かなりの進展だと言えます.数式は,もちろん,なくはありませんが,全体的にそれほど多くない印象です.多数の著者の論文を集めたものなので,すべて同じトーンではないでしょうが,とくに事前の知識がなくても苦労なく読めそうです.

投稿者:

Viscovery社の近況

世界的な金融危機にもかかわらず,2009年のデータマイニングおよび予測分析に関するオーストリアの専門家による報告書では,Viscovery社が国際的な領域で売上,収益,マーケットシェアで成長し続けていることを証明しています.
このレポートの期間内に獲得された新しい顧客には,
 -ノースロップグラマン情報システム(米国),
 -Deloitte & Touche Forensic & 調査サービス(カナダ)
 -テルストラ・コーポレーション(オーストリア)
などが含まれます.さらにオーストリアで大口の顧客との最終交渉に入っています.
この期間には,Viscovery Suite version 5.2のリリースもあり,これは新しいライセンシング・システムとハンドリングとユーザービリティに関するさらなる改良,さらにマイクロクラスタ予測と高次元データ分析のための強化された機能が含まれます.とくにテキストマイニングや遺伝子発現データのクラスタリングには不可欠な機能が提供されています.

投稿者:

HUGIN 7.4 リリース

New Release – HUGIN 7.4
2010年10月11日,HUGIN softwareの新バージョン (v7.4)をリリースしました.このリリースの主な新機能は,プリミティブ・テーブルの集合からベイジアンネットワークの仕様をインポートするためのHUGINグラフィカル・ユーザー・インタフェースの機能です.それに加えて,インフルエンス・ダイアグラムを解くためのサポートが新しい機能で改良されました.
プリミティブ・テーブルの集合からベイジアンネットワークをインポートする新しい機能は,ベイジアンネットワーク・モデルを指定する従来のHUGINネットワーク仕様言語の使用の代替方法を提供します.
プリミティブ・テーブルの集合からのベイジアンネットワークのインポートに関係する機能(HUGIN 7.4で導入)の開発は,デンマークの抵当信用機関NykreditRealkredit (www.nykredit.dk)によって出資されました.
HUGIN Graphical User Interface v7.4
HUGIN グラフィカル・ユーザー・インタフェースは,下記の新機能で改良されました:
-ジョイント・ダイアログがLIMID用に可能になり,決定をサポート.
-相関ダイアログがLIMID用に可能になり,決定をサポート.
-実行モードで決定ノードのポリシーを初期化できるようになった.これは,たとえば,さまざまなエビデンス・シナリオでシングル・ポリシー更新を実行しているとき,編集モードに戻らずにポリシーを初期化することを可能にする.
-決定ノードの必須な先祖を表示することが可能.つまり,たとえば,決定および効用関数を持つネットワークを従来のインフルエンス・ダイアグラムと同じように解くのに便利である.
-ノードのクラスの切り替え(たとえば,決定から確率へノードのクラスを切り替え,またはその逆).
-適応ウィザードが,特別な記録およびログ機能で拡張された.
-適応ウィザードでデータ・ファイルのケース・カウントが可能.
-エビデンスへの感度ダイアログを,分析ウィザードのケース/信念タブから開けるようになった.これは,分析ウィザードで信念更新の結果を説明するために便利である.
-追加の最適三角化パラメータを指定するための新しいオプションを導入.
-Unix系システム(たとえば, Linux, Solaris, Mac)でlpstat/lpr および PostScriptを用いたネーティブ・プリンティングをサポート.
-確率,経験表,減退表のリセット,正規化,ランダム化のスピードを改善.
-HUGIN グラフィカル・ユーザー・インタフェースの国際化(ボタン/メニューが現在は,英語,フランス語,日本語をサポート).
-HUGIN グラフィカル・ユーザー・インタフェースが,ランタイム・モデルのためのC, C# および Java コードを生成するコード・ウィザードで拡張された.これは,対応するHUGIN APIを用いてモデルを構築するコードを生成することを可能にする.
-その他の改良.
その他,HUGIN グラフィカル・ユーザー・インタフェースの性能の改善にさまざまな努力がなさました.

投稿者:

アンケート・データからの消費者セグメントの発見

顧客の実際の購買履歴データから購買行動のパターンをセグメント化するには,ViscoveryのSOM(自己組織化マップ)テクノロジーをお薦めします.
また大企業が定期的に行っているな大規模なアンケート調査データから消費者のセグメントを発見するということにもSOMは役に立ちます.
しかしながら,アンケート調査データというのは,なかなか曲者です.よくある問題は,(1)「良い」(2)「まあま良い」(3)「普通」(4)「やや悪い」(5)「悪い」というような段階的な尺度で回答する場合にあります.このような場合,回答者によってクセが出ます.ある人は,おもに(1)から(3)のポジティブな範囲で,ほとんどすべての設問に回答していたり,別の人は(2)から(4)の中間の範囲であったり,また別の人は(3)から(5)のネガティブな範囲だったりします.
結果として,多くのアンケート調査データは,普通に集計すると,ある設問にポジティブな回答をする人は,別のどの設問にもポジティブな回答をしているし,また逆も真なりの結果となります.このようなデータをもとにして「○%の人が「良い」と答えました」という調査結果をまとめることにどれだけの意味があるのか?という疑問が出てきます.さらに,クロス集計をやって,さらにコレスポンデンス分析をやってマップを描いたとしても,推して知るべし,です.
こういうことに疑問を持つ人は,至極まともな感覚の持ち主です.もし,まったく疑問を感じないとしたら,あまりに鈍感だと言わなければならないでしょう.いわゆる「お役所仕事」というのは,そういう人たちによって推進されているわけです.実際,お役所に限らず,多くの大企業,場合によっては専門の調査会社でさえ,こういうレベルの分析でお茶を濁しているのが実態ではないでしょうか.
つまり,分析の方法をもっと工夫しなければならないのです.
構造方程式モデルによるセグメンテーションの発見は,こういう問題の1つの解決策になりそうです.構造方程式モデルには,大別すると共分散構造分析(LISREL)とPLSパス・モデリングがあります.前者の方は,すでにメジャーな統計ソフト・ベンダーが販売しています.したがって,現在のところ,市場では「構造方程式モデルといえば,共分散構造分析」という状態になっております.
歴史的には,共分散構造分析の方が,PLSパス・モデリングよりも少し早く提案され,実用化・商業化も先に進んできたわけですが,近年,PLSパス・モデリングの開発が進んできて,かなり使えるものになってきました.その先頭を走っているのが,XLSTATを開発・販売しているAddinsoftです.
共分散構造分析とPLSパス・モデリングを比べると,それぞれ長所短所はあるあるわけですが,PLSパス・モデリングを推し進める最も基本となっている理由は,共分散構造分析がハード・モデリングである(すなわち,分布の仮定が厳しく,より多くのデータを必要とする)のに対して,PLSパス・モデリングは,ソフト・モデリングである(分布の仮定がゆるく,ごくわずかのデータでモデルが作れる)という点です.
今年の夏に,XLSTAT-PLSPMにREBUSというセグメンテーションの機能が追加され,PLSパス・モデリングの実用的価値が飛躍的に拡大しました.これの結果を弊社がお薦めしているViscoveryのSOMで可視化して見ると,見事に上記のようなアンケート調査データの問題を克服して,より有用なセグメンテーションの発見ができていることが,手に取るようにわかります.
その結果はまた改めて,論文形式のコンテンツとしてまとめる予定です.