主成分分析をより解釈しやすくするグラフの作成
このチュートリアルで使用するデータと結果のファイルは、こちらからダウンロードできます。 このチュートリアルは、PCAのチュートリアル (Principal Components Analysis)で得られた結果に基づいています。我々の狙いは軸 F1 とF2のグラフィカル表現の読みやす さを改善することです。
まず、グラフをコピーして拡大します。グラフの拡大の際中、いくつかのラベルが対応するポイントからずれるのが見えます。これを修復するには、グラフを選択して、それから”データ可視化”ツールバーの”ラベル再配置”ツールを使用して、下記のオプションを選びます:

因子得点の表の右側に、各オブザベーションの最初の2軸上のsquared cosines の総和を格納する列を作成します。ちなみに、ある軸とあるオブザベーションについて、cosineは、その軸と原点からのベクトルの間の角度のcosineです。 したがって、 cosineが大きいほど、そのポイントは、主成分分析から得られた多次元空間内で、軸により近くなります。あらゆるオブザベーションについての、最初の2つの因子軸 F1 と F2 上のcoaineの総和は、そのオブザベーションについての、F1 とF2で定義される平面の精度の見当を与えます。あるオブザべ-ションについて、すべての軸での squared cosines の総和は 1になります。したがって、あるポイントについて、総和が1に近いほど、グラフの 解釈可能性が大きくなります。
さまざまなポイントについての2次元グラフの解釈可能性のレベルを示すために、我々は、squared cosinesの総和の値によって、ポイントのサイズを増やしたいわけです。これは、どのポイントが誤差なく解釈できるのかを知ることを可能にするでしょう。.
さらに、 国勢調査局が決定した州の5つのグループ(North East, South, Midwest, West およびPacific)を区別するために、異なる形状を使用します。
形状を変更するために、Excel が提供する形状の順序にしたがってXLSTATで定義されたコードを使用する必要があります(下図のダイアログ・ボックスを参照): 1が正方形、 2がひし形、3が三角形、 4が x、5が星型、6 が点、7 が -、 8 が+ 、9が円です。4つの形状だけが効果的に使用できるので、Pacific 地域に属するHawaï と Alaskaは、western の州と同じ円に黒の輪郭をつけて表示されます。
そして、各州に対応するコードを格納する列を作成します。
チャートの読みやすさを増すために、squared cosinesの総和が0.8より大きいポイントを赤に色づけしようとしています。 ポイントの色を変更するために、形状が定義されたセルに、その色を適用しなければなりません。まず、cosinesの全部の列を青に色づけします。そして、 "ツール"のツールバー中にあるデータフラッガー・ツールを用いて、 総和が0.8以上のセルを赤に色づけします。
Hawaii と Alaskaに対応するポイントを黒で囲うために、 そのセルに黒い下側の境界線が追加されました。それから、セルのフォーマットがコピーして、形状の列に貼り付けて、 squared cosinesの列のフォーマットをクリア (Excel / 編集 / クリア)します。
そして、グラフィックを選択して、"データ可視化" ツールバーにあるイージーポイント・ツールを立ち上げます。 下記のオプションが選択されました:

結果として、下図のチャートが得られました:
より簡単な解釈では、このチャートは、近似的に解釈できる州を識別することを可能にします。たとえば、 West Virginia と Pennsylvania は近いですが、一方、Pennsylvania とAlaska は、とても異なっていると結論づけることができます。さらに、グラフの右上と右下には、ほとんど Westernの諸州があることに気付きます。
他のチュートリアルは、こちらをクリックしてください。