交互作用を伴う二元配置unbalanced ANOVAはXLSTATでどのように実行しますか?

データと結果のExcelシートはこちらを クリックしてダウンロードできます。農作物の栽培についての4つの異なる方法の実験データは、4つの異なる土地(同じ土ですが、日照が異なります)でテス トされました。収穫が取り入れの後に測定されました。なぜなら第3の方法は、(種の不足のため)第4のタイプの土地ではテストされませんでした。また (ひょうを伴うあらしのため)第2の方法は第4のタイプの土地でテストされませんでした。この実験は典型的なunbalanced ANOVAの事例です。用いられた方法と土地のタイプの間の交互作用を決定するために、我々は交互作用を伴うANOVAを実行しました。

XLSTATのANOVA機能を用いて、栽培方法が土地のタイプの制御による収穫上の有意な効果を持つかどうかと、栽培方法と土地のタイプの間の交 互作用を発見できます。

XLSTATを開いて、XLSTAT|Modeling data|ANOVA コマンドを選ぶか、"Modeling Data"ツールバー(下図)の対応するボタンをクリックしてください。

../../../barano1.gif

ボタンをクリックすると、ANOVAダイアログ・ボックスが現れます。Excelシート上のデータを選択してください。 "Dependant variable"(従属変数または目的変数)は、ここではYield(収穫)です。我々の目的は、栽培方法の効果、土地のタイプの効果、及び収穫のバラ ツキの上でのこれらの2つの交互作用を決定することです。変数の列タイトルを選択したので、"Column labels" を有効のままにしておきます。データが ANOVAの正規性の仮定にしたがっているかどうかを知るために、"Residuals"オプションも有効にしておきます。"interactions" と "Type I, III SS"オプションも有効にします。それは交互作用を考慮に入れたモデルが欲しいからであり、またType I SSとType III SS (SSは平方和の略)の表で与えられるF値を分析したいからです。

../../../ano2w1.gif

ANOVAオプションにおいて、我々はconstraint(強制)オプションを"a1=0"にしておきます。その意味は、我々はモデルが, 方法 "1" が収穫において標準の効果を持つという仮定の上で構築されることを望むということです。理論的な理由によりANOVAではモデルにconstraintを 適用するべきですが、それは結果(適合や予測の良さ)に影響しないでしょう。それが生じるただ1つの違いは、モデルの実際の記述の中です。

"OK"ボタンをクリックとすると計算が始まります。 そして結果が表示されます。

XLSTATによって表示される1番目の結果は、適合の良さの係数です。: R(相関係数)、R2(決定係数)及び修正R2です。決定係数(0.92)は、モデルされた変数(Yield)のバラツキは、説明変数(Method, Type of field, 及びそれらの交互作用)によって説明できる範囲についての公正な見解を与えます。この事例では、バラツキの92%が説明されました。残りの8%は、モデル が”ランダム”効果として分類する他の変数の中に隠されています。

分散分析表(下記)の結果を検討することは重要です。その結果は、説明変数がモデルに有意な情報(帰無仮説H0)をもたらすかどうかを決定すること を可能にします。言い換えれば、それは母集団を記述するために平均を用いることが有効かどうか、あるいは、説明変数によってもたらされた情報が重要かどう かを、あなた自身で確かめる方法です。

../../../ano2w2.gif

FisherのF値の対応する確率は、0.0003より低く、それは帰無仮説(2つの説明変数、及びそれらの交互作用の効果がない)は正しくないと いう仮定が0.03%のリスクを取ることを意味します。したがって、我々は2つの変数とそれらの交互作用は、有意な効果を持っていると確信を持って結論づ けることができます。我々はまた2つの変数とそれらの交互作用が、同じ量の情報を提供するかどうかを知りたいです。これを行うために、我々はType I SS とType III SS の表を検討しなければなりません。

../../../ano2w3.gif

Type I SSの表は、モデルで変数を1つずつ追加して、モデル平方和(Model SS)でそれぞれのインパクトを評価することによって構築されます。その結果として、Type I SSでは、変数が選択された順番が結果に影響します。Type III SSの表は、 各変数のモデルのクォリティに与えるインパクトを評価しながら1つずつ変数を削除することによって計算されます。これは変数が選択される順番が、Type III SSにおける値にそのような効果もないことを意味します。Type III SSは、通常、モデルの一部に交互作用がある場合の結果を解釈するために用いる最善の方法です。

注意: Model SS(モデル平方和)が高いほど、Residual SS(残差平方和)はより低く、したがって、変数の影響がより大きいということです。

Type III SSの表に表示された結果から、我々は、変数 "method"がモデルにおける最高のインパクトを持つことがわかります。モデルのパラメータ(下記)を見ると、methods 2と3は収穫に正のインパクトを持つことがわかります。"type of field"(土地のタイプ)の収穫への効果は低いですが、土地のタイプと方法の間の交互作用の影響は、見逃してはなりません(信頼区間は95%であり、 5%のリスク要因があることを意味します。)

../../../ano2w4.gif

上記の表は、収穫における説明変数のインパクトを分析するため、また第3の方法と第4の土地のタイプのように実験でカバーされなかった状況での収穫 を予測するために用いられます。この事例では、交互作用の影響が未知だという事実が与えられている平均収穫は48.5でしょう。

我々は標準化残差も見ることができます。これらは、正規分布のはずだというANOVAモデルの仮定が与えられている残差です。すなわち残差の95% は、区間 [-1.96, 1.96]の中に入っているはずです。この区間の外側のすべての値は、潜在的なはずれ値であるか、正規性の仮定が正しくないことを示唆しています。すべて の値が[-1.96, 1.96]の範囲の入っているので、はずれ値はないようです。

../../../ano2w5.gif