XLSTAを用いて分布での標本抽出をして、正規性検定を実施するにはどうしますか?
このチュートリアルで使うデータと結果を含むExcelシートはこちらからダウンロードできます。この チュートリアルではまず初めに正規分布から、次に一様分布から標本を作成する方法を実演します。その後2つの標本に対して正規性検定を実施する方 法を実演します。
2つの標本を作成しようとしています。1つ目は、正規分布N(2,4)、 (平均値 = 2、分散 = 4という意味)の標本であり、2つ目は -1.5~5の一様分布(平均値 = 2、分散 = 49/12 =4.08)の標本です。これをするために、”データ準備”セクションにある”分布サンプリング”ツールを使用します。
XLSTATを開き、XLSTAT / データ準備 / 分布サンプリング コマンドを選択するか、または"データ準備”ツールバー(下図参照)の”分布サンプリング”ボタンをクリックします。

ボタンをクリックするとダイアログ・ボックスが表示されます。使用する分布とそれに対応するパラメータを選びます。作成する標本のサイズを入力 します。下のダイアログボックスは1,000件の正規分布N(2,2)標本の作成に対応するものです。

”OK”ボタンをクリックすると計算が始まり、標本が表示されます。次に2つ目の標本が-1.5~5の一様分布を用いて作成されます。
では2つの標本の正規性を調べてみましょう。XLSTAT / データ記述 / 正規性の検定 を選択するか、または”データ記述”ツールバーの”正規性の検定”ボタンをクリックします。

ボタンをクリックするとダイアログ・ボックスが表示されます。2つの標本を選択し、2つの標本が独立していることを確認するために”独立の列” オプションを有効にします。標本の正規性を視覚的に調べられるように、Q-Q プロットオプションを有効にします。

”OK”ボタンをクリックすると計算が開始され、結果が新しいシートに表示されます。まず1つ目の標本の結果が表示され、次に2つ目の標本の結果が表示されます。
まず初めに表示される結果は、1つ目の標本のQ-Q プロットです。Q-Q プロットでは、標本の累積分布関数 (cdf) (横軸)を、それと同じ平均値と標準偏差を持つ正規分布の累積分布関数 (縦軸)と比較することが可能です。正規分布に従った標本の場合、分割線に沿った配置が観察されるはずです。その他の場合には、分割線からの偏差がいくらか見られます。

ここでは経験累積分布関数が、分割線に極めて近いことがわかります。Shapiro-Wilk検定とJarque-Bera検定は、標本の正規性の仮説を棄却できないことを証明しています。Shapiro-Wilk検定では、帰無仮説を棄却する際に誤りがある危険性が、Jarque-Bera検定より も高いことがわかります。

下に示すのは2つ目の標本の結果です。1つ目の標本の結果とは異って、2つの大きな偏差があり、Q-Q プロットはおそらくこの分布が正規分布ではないことを示しています。

このギャップは正規性検定 (以下を参照)によって実証されており、これによって標本が正規分布であるという仮説をためらうことなく棄却しなければならないと言えます。

結果として、このチュートリアルではまず正規分布の標本、次に一様分布の標本という2つの標本を作成方法を見ました。次にこれらの標本でShapiro-Wilk検定とJarque-Bera検定の妥当性を実証しました。結果、1つ目の標本が正規分布であるという仮説が実証され、また2つ目の標本が正規分布であるという仮説を棄却することができました。
