XLSTATによるコレスポンデンス(対応)分析

demoCA.xls

データと結果のExcelシートはこちらか らダウンロードできます。 データは、映画ファンに彼らが見たばかりのフィルムについての意見を聞き取り調査したものです。観衆は年齢のカテゴリも聞かれました。

XLSTAT を開いて、XLSTAT|データ解析|コレスポンデンス分析コマンドを選択するか、"データ解析" ツールバー(下図)の対応するボタンをクリックしてください。

barca1.gif

barca2.gif

ボタンをクリックすると、コレスポンデンス分析ダイアログ・ボックスが現れます。そしてExcelシート上のデータを選択してください。 もしデータが(下図の事例のように)クロス表の形式であれば、ピボット・テーブル 形式を選択してください。もしデータがオブザベーション/変数形式であれば、対応するオプションを選択 してください。 ピボット・テーブルのカテゴリー名が含まれているので、ラベルを含むオプションも選択するといいです。結果のレポートの左上隅として、 $J$4 が選択されました。別のシートたワークブックに結果を書き出すように選ぶこともできます。

ca1.gif

チャート タブでは、行と列の対称プロットを表示するように選択しました。

ca11.gif

プロットがどの軸に表示されるべきかをユーザが選択して、それが検証されると、結果が表示されます。

行と列が独立であるかどうかを検定するために、カイ2乗検定が計算されます。p値が有意水準(0.05)よりも低いので、我々はは行と列が独立ではないと結論づけます。それは、行と列の間の関係性があることを意味します。

固有値の表または対応するスクリュー・プロットを見ることによって、分析の品質が評価できます。2つ(または数個)の最初の固有値の和が合計に近ければ、分析の品質がとても高いことになります。最初の2つの固有値の和が全体の97%に達するので、この事例のコレスポンデンス分析の品質はとこても高いです。

ca3.gif

コレスポンデンス分析における最も興味深い結果は、行と列の両方を含むカテゴリーのマップです。もし分析の品質が良いならば(この事例では 97%)、マップはデータの解釈に役立ちます。我々は、調査された人々の間で、16歳から24歳の間が、他のカテゴリーに属する人々よりも、よりフィルム を好む傾向があることがわかりました。 55-64 歳のカテゴリーの人々は、最もそれを好むのが少ないグループです。

ca4.gif

コレスポンデンス分析は、クロス表を分析するための最も効果的なテクニックです。調査に2つ以上のカテゴリ カル変数が使われた場合は、多重コレスポンデンス分析(MCA:Multiple Correspondence analysis)を使用するのが最善のテクニックです。

その他のチュートリアルはこちらです