データ標本に分布をあてはめるにはXLSTATをどのように使いますか?

データと結果のExcelシートは、こちらからダウンロードできます。このデータは、ANCOVAのチュートリアルで得られた残差に対応します。

我々のゴールは、残差の正規性の仮定が有効かどうかを検定することです。構成によりこれらの残差は、中心化(平均=0)され、縮小(分散=1)され ます。我々は Distribution Fittingツールによって、残差がN(0, 1)に従って分布するかどうかを確認します。

XLSTATを開いて、XLSTAT|Modeling data|Distribution Fitting コマンドを選択するか、"Modeling Data"ツールバー(下図)の対応するボタンをクリックしてください。

../../../bardfit1.gif

ボタンをクリックするとダイアログ・ボックスが現れます。Excelシート上のデータを選択してください。"Data"はB列にあります。我々はXLSTAT の正規分布のパラメータを"推定"させますが、我々はすでにこれらのデータの特徴を知っていますので、それらを0と1に固定することもできます。我々は、 我々の仮定を検定するのに必要なKolmogorov-Smirnov オプションとChi-square goodness of fit testsオプションを有効にします。Chi-square検定については、我々は一定幅の10クラスでそれを行うことにしました。

../../../dfit1.gif

"OK"ボタンをクリックすると計算が始まります。そして結果が表示されます。1番目の結果の表は、正規分布関数の4つの記述統計を示します。まず サンプル上の推定、それから理論に基づく計算です。もし平均と分散がそれぞれ同じなら(正規分布による通常のケース)、我々はSkewness(歪度)と Kurtosis(尖度)に違いを見つけます。

../../../dfit2.gif

Kolmogorov Smirnov 検定は、 経験と理論の累積分布関数の最大差が棄却限界値の上にあるかどうかを検定することができます。この検定は、正規分布の場合である連続分布関数についてのカ イ2乗検定よりも適切であることが知られています。この結果は、0.05の有意水準によって結論づけており、我々は残差が正規分布関数N(0,1)に従う という仮説を棄却することはできません。

カイ2乗適合度検定は、経験と理論の分布関数の間のカイ2乗距離が、棄却限界値の上にあるかどうかを検定することができます。我々の事例では、観測 された値は棄却限界値より上にあることがわかります。これはこの結論が前の検定が示すものに反していることを意味します。しかし、もしカイ2乗に最も寄与 するクラス(区間)を削除するなら、棄却限界値と観測値がとても接近していることがわかります。

下記の表と図を見て、カイ2乗に最も寄与する区間が、ANCOVAの残差分析で識別した極値に対応するものだとわかります。これは、対応するオブザ ベーションの削除によって単純に、残差の正規性が改善されることを示します。

../../../dfit3.gif

../../../dfit4.gif

結論として、我々はit seems that we can accept the normality assumption of the residuals 残差の正規性の仮定(Kolmogorov-Smirnov)を採択できるでしょう。そして、高い残差の絶対値がカイ2乗検定による棄却の原因でしょう。 対応するいくつかのオブザベーションを削除して(もし可能であれば、オブザベーションの深い分析のあと)、初期の正規性の課程により良く対応するより適合 の良いモデルを得ることができます。