XLSTATによる非線形回帰はどのように実行しますか?
データと結果のExcelシートは、こちらをクリックしてダウンロードできます。データはRatkowsky D.A. (1983). Nonlinear Regression Modeling. New York, Marcel Dekkerのもので、NISTから取得されました。
非線形回帰を使ってする我々のゴールは、玉ねぎの乾燥質量は、成長時にどのように変わるかを知ることです。もし3パラメータのロジスティック回帰が 適当であろうことが直観されるなら、Ratkowsky によって示唆されたモデルは複雑すぎます。
2パラメータ・ロジスティック・モデル
![]()
3パラメータ・ロジスティック・モデル
![]()
4パラメータ Ratkowskyモデル
![]()
3パラメータのロジスティック・モデルはXLSTATの中で直接利用可能ですが、XLSTATの能力を示すために、我々はこの事例でユーザは、どの ようにして自分で新しい関数を作成して利用可能な関数に追加できるかを示します。
はじめに、XLSTATの非線形回帰は、あらかじめプログラムされた関数の中にRatkowskyのモデルを含んでいないので、我々は4パラメータ のそれぞれについてのモデルの導関数を書く必要があります。下記の表に4つの導関数と XLSTATの取り決めを使ったそれらの書き直しを示します。:Excelのシンタックスとパラメータiの "pri"及び、変数jの"Xj"。注意:もし導関数が "-" で始まるなら、Excelがエラーを検知するのを避けるために、最初に引用符 ' を付け加える必要があります。
数学的表記
![]()
XLSTATシンタックス
(pr3/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)
数学的表記

XLSTATシンタックス
(pr3*X1/pr4)*exp(-pr1-pr2*X1)/(1+exp(-pr1-pr2*X1))^(1+1/pr4)
数学的表記
![]()
XLSTATシンタックス
1/(1+exp(-pr1-pr2*X1))^(1/pr4)
数学的表記
![]()
XLSTATシンタックス
(pr1/pr4^2)*ln(1+exp(-pr1-pr2*X1))/(1+exp(-pr1-pr2*X1))^(1/pr4)
最後に、関数が複雑な構造を持つ場合、開始点を指定することを薦めます。我々のケースでは、それは [0, 0, 725, 1] がよいようです。725は従属変数(乾燥質量)の最大値に対応します。開始点と導関数は、Excelの中に垂直に入力されるはずです。これで分析が開始で きます。
XLSTATを開いて、XLSTAT|Modeling data|Nonlinear regression コマンドを選択するか、"Modeling Data"ツールバー(下図)の対応するボタンをクリックしてください。

ボタンをクリックすると、Nonlinear regressionダイアログ・ボックスが現れます。Excelシートの上でデータを選択してください。 "Dependant variable" (従属変数また目的変数)は、我々の事例ではDry weight.です。量的な説明変数は、Timeです。我々はTimeによって、Dry Weightの変数を説明したいのです。 我々は列タイトルを選択したので、"Column labels included" オプションを有効のままにしておきます。"Residuals"オプションも有効のままにしておきます。 それは予測と残差を分析したいからです。"More"ボタンをクリックすることによって、 ダイアログ・ボックスの高度なオプションの部分をXLSTATに表示させることができます。開始点は、ダイアログ・ボックスのこのセクションの中で選択で きます。

第2のダイアログ・ボックスが、"Next"をクリックしたときに表示されます。このボックスはモデルに関係します。Ratkowsky'のモデル は、プログラムされた関数の中に一覧されていないので(7行目に3パラメータのロジスティック回帰を見つけることはできますが)、我々は、"Add"をク リックしてRatkowsky'のモデルを入力する必要があります。そして、我々は、Excelシート上の導関数を選択します。この関数をユーザー関数ラ イブラリーに追加するために、"Save"をクリックします。関数はこうして自動的に追加され選択されます。

"OK"ボタンをクリックすると計算が始まります。そして結果が表示されます。第1の表は、適合の前と後のモデルの式です。第2の表(下記)は、適 合の良さの係数を示します。:R(相関係数) R2(決定係数)、及びSSR(残差平方和)、後者はモデルの最適化のため用いた基準です。R2は、説明変数(Time)によって説明された従属変数 (Dry weight)のバラツキの%に対応します。R2が1に近いほど良い適合です。

我々のケースでは、Timeによって説明されたDry weightのバラツキは99%で、すばらしい結果です。
次の表は、モデル・パラメータについての詳細な結果を示します。見てのとおり、初期値が725だったパラメータ pr3は、適合の後、699.64になりました。標準偏差は、各パラメータについて得られた結果の信頼性のいくらかの知見を与えます。パラメータ pr4の値は、1に近づいていて、それは3つのパラメータのロジスティック回帰がほとんど良い結果を与えるであろうことを想像できます。この関数はプログ ラムされた関数の一覧の中に利用可能なので、仮説が容易に検定できます。

次の表(Excelシートを参照)は、残差の分析を示します。このモデルは、オブザベーション11と14について、あまり良い適合ではないというこ とがわかります。
1番目の図(下図)は、データと適合された曲線の可視化を可能にします。3つの他の図は、残差の視覚的な分析で、データの数が多いときに役立ちま す。

結論として、この分析及びモデル選択の文脈において、成長時間は玉ねぎの乾燥質量をとてもよく説明できます。
