XLSTATによるロジスティック回帰はどのように実行しますか?

ロジスティック回帰やProbit法などの関連する手法は、バイナリの反応変数(response variable:たとえば0/1やYes/Noのような2値をとる変数)の系列の効果を理解したり予測したいときにとても役立ちます。ロジスティック回 帰は、医薬や農業などの投与効果をモデルすることや、ダイレクトメールへの顧客レスポンスの可能性を予測すること、銀行で顧客がローンの返済をしないリス クを評価することなどに役立つかもしれません。

XLSTATによって、生データ(0と1として与えられた反応)、もしくは集計されたデータ(反応が"成功"の合計か、またはいくつかあり、そして 繰り返しの数が利用可能であるはず)でロジスティック回帰を実行することができます。

../../../log1.gif
生データの例 - (抵抗素子の温度効果)

../../../log2.gif
集計データの例 - (特定の昆虫の種における殺虫剤の効果)

Addinsoftが投与分析用の特別なモジュールを開発していることに留意してください。このモジュールは、XLSTAT-Dose と呼ばれ、別途注文ができます。

ロジスティック回帰の方法論は、カテゴリカルまたは量的な変数である説明変数の値によって、成功の確率をモデリングすることを狙っています。ここで 扱う事例は、オンライン・スポーツ情報の定期購読を更新しそうな顧客を探したいというマーケティング事例です。データと結果のExcelシートは、こちらからダウンロードできます。

データは、60人のユーザのサンプルを示しており、彼らの年齢のカテゴリ、週あたりの平均閲覧ページ数、そして先週の閲覧ページ数からなっていま す。これらのユーザは、2週間後に期限が切れる定期購読の更新の確率を提供されました。我々のゴールは、なぜある人は更新して、他の人は更新しなかったの かを理解することです。

ロジスティック回帰を用いて、我々が得た結果を説明し、そして定期購読を更新しないであろうユーザを識別するために、母集団の上でこのモデルを用い たいのです。これらのユーザは、ターゲットであり、更新のためのインセンティブ(たとえば、追加サービス)が提供されます。

Logistic regressionダイアログ・ボックスを有効にするために、XLSTATを起動し、そして、 XLSTAT|Modeling data|Models for binary response data コマンドを選択するか、"Modeling Data" ツールバー(下図)の対応するボタンをクリックしてください。

../../../barlog1.gif

ボタンをクリックすると、Logistic regressionダイアログ・ボックスが現れます。Excelシート上でデータを選択してください。"Response"は、バイナリ変数または正の ケースのカウントが格納された列に対応します(注意:集計されたデータを用いる場合、"Weights"が選択されるはずです)。この事例では、我々は3 つの説明変数を持ちます。1つのカテゴリカル変数 - the age group -、および2つの量的変数:ページのカウントです。すべての変数の列タイトルを選択したので、"Column labels included"オプションを選択します。

 

../../../log3.gif

"OK"ボタンをクリックすると、計算が始まります。下記の表は、モデルの詳細です。この表は、さまざまな変数の影響度と年齢カテゴリの相対的影響 度を理解することに役立ちます。

../../../log4.gif

この表で、更新に最も影響する変数は、前月の閲覧ページ数であることが、カイ2乗の確率を見ることからわかります。切片(intercept)は有 意であり、40-49歳の顧客は、定期購読の更新に強い正の影響を持つ事実もわかります。この最後の点は、 この特定の集団に正しいアクションをとるようにマーケティング担当者が解釈するために必要です。

 

次の表は、モデルの品質(または適合の良さ)の複数の指標を与えます。これらの結果は、線形回帰やANOVAでのR2と分散 分析表に相当します。見るべき最も重要な値は、log比でのカイ2乗検定の確率です。これはFisherのF検定に相当します。:一定の変数のみを持つよ りシンプルなモデルで定義されるので、モデルを比較することにより、変数が有意な情報をもたらすかどうかを評価しようとします。 この事例では、確率は0.0001よりも低いので、有意な情報が変数ににってもたらされていると結論づけることができます。

../../../log5.gif

最後のステップは、母集団でのモデルの適用です。この事例ではモデルは次のように書きます。:
Y = Exp( L(x) ) / [ 1 + Exp( L(x) ],
ここで、
L(x) = -2.3567 + 0.0235.AvPage/Week + 0.0893.Page/Week + Factor
そして、Factorは顧客が属する年齢グループに対応するパラメータの値をとります。

 

来月に定期購読の更新を必要とする600人の顧客にモデルを適用するとき、我々はたった40%だけが更新するであろうことを知りました。正しいマー ケティング・アクションをとることにより、結果を85%に押し上げることができました!