XLSTATによる任意の分布でのサンプリングと正規性検定の実行

このチュートリアルの目的

このチュートリアルでは,最初に,正規分布から標本を生成する方法を示し,次に一様分布から標本を生成する方法を示します.そして,両標本での正規性検定の実行の方法を示します.

分布をサンプリングし,正規性検定を実行するためのデータ集合

データと結果のExcelシートは, こちらをクリックしてダウンロードできます.

我々は,2つの標本を生成しようとしています.1番目は,正規分布 N(2,4) (平均 = 2, 分散 = 4)で,2番目は一様分布 -1.5 から 5 (平均 = 2, 分散 = 49/12 =4.08)です.これをするには, "データ準備" メニューにある "分布サンプリング" ツールを使用します.

任意の分布でのデータのサンプリングのセットアップ

XLSTATを起動して,XLSTAT / データ準備 / 分布サンプリングコマンドを選択するか,データ準備 ツールバーの対応するボタン(下図)をクリックしてください.

barnorm.gif

ボタンをクリックすると,ダイアログ・ボックスが現れます.

使用する分布と,対応するパラメータをを選択してください.

そして,生成する標本のサイズを入力してください.

下に表示されているダイアログ・ボックスは,1000 ケースの正規分布 N(2,2) の標本の生成に対応します.

norm1.gif

OKボタンを押すと計算が始まり,標本が表示されます.

2番目の標本は, 一様分布 -1.5 から 5を用いて生成されます.

正規性分布のセットアップ

そして,我々は,2つの標本の正規性を検定しようとします.XLSTAT / データ記述 / 正規性検定を選択するか,データ記述ツールバーの対応するボタンをクリックしてください.

barnorm2.gif

ボタンをクリックすると,ダイアログ・ボックスが現れます..

2つの標本を選択して,2つの標本が独立であることを確認するために独立列 オプションを有効にします.

標本の正規性を視覚的に確認できるように Q-Q プロットオプションを有効にします.

norm2.gif

OKボタンをクリックすると計算が始まり,新しいシートに結果が表示されます

正規性検定の結果の解釈

結果は,まず1番目の標本について表示され,次に2番目の標本について表示されます.

表示される最初の結果は,1番目の標本についてのQ-Q プロットです. Q-Q プロットは,標本の累積分布関数 (cdf) (横軸)を,それと同じ平均値と標準偏差を持つ正規う分布の累積分布関数(縦軸)を比較することができます.正規分布に従う標本の場合,第1分割線に沿った配置が観察されるはずです.それ以外の場合は,分割線からいくらかの偏差が観察されるはずです.

norm3.gif

ここでは,経験 cdf が分割線にきわめて近いことがわかります.Shapiro-Wilk検定とJarque-Bera検定は,標本の正規性の仮定が棄却できないことを確認します.Shapiro-Wilk検定では,帰無仮説を棄却する際に誤りのあるリスクが,Jarque-Bera検定によるよりも高いことがわかります.

norm4.gif

続く結果は,2番目の標本についての結果です.1番目の標本で観察されたのとは異なり,おそらく分布が正規分布ではないことを示す2つの強い偏差が,Q-Q プロット上にあります.

norm5.gif

このギャップは,正規性検定(下記)によって確かめられ,標本が正規分布であるという仮説を棄却する必要があるということをためらいなく断言できます.

norm6.gif

結論

結論として,このチュートリアルでは,1つが正規分布に従い,2つめが一様分布に従う2つの標本を生成しました.そして,これらの標本で,Shapiro-Wilk検定とJarque-Bera 検定の妥当性を確認しました:これらの検定は,1番目の標本について正規性の仮定を確認し,2番目の標本についてそれを企画することができました.

他のチュートリアルはこちら です.