数量化I類はコンジョイント分析と同じなのか?

投稿者:Kunihiro TADA

数量化I類はコンジョイント分析と同じなのか?

昨日、ある方からお電話を頂き、「調査会社に調査を依頼して1300件ぐらいのデータがあるので、それでコンジョイント分析をやろうと思うのだけど、XLSTAT-Basicでいいですか?」というご質問を頂きました。

こちらの回答としては「コンジョイント分析はXLSTAT-Markeringに含まれます。ただし、コンジョイント分析を行うには調査票の設計の段階から同じ統計ソフトを使用するべきです。XLSTAT-Basicではコンジョイント分析ではなく分散分析(ANOVA)ならできますよ」とお答えするしかありませんでした。しかし、それでもその方は「いやいや数量化I類はコンジョイント分析であって、XLSTAT-Basicに回帰分析が含まれるなら、それでできるんじゃないですか?誰かわかる人はいないのですか?」とのことでした。

いやまあ、そう言われるのでしたら、それでもいいのですが、ちょっと勘違いがあるかと思いますので、ここで補足させて頂きます。

数量化I類というのは、日本の統計数理研究所の所長を務められた林知己夫氏が考案したとされる数量化理論の1つです。数量化理論とは、つまり、質的データ(カテゴリ値)を使用した統計手法の拡張です。当時、海外でも同様な研究が行われていて、林氏は海外の研究とは独立に(当時、第二次世界大戦で日本は世界から孤立していました)、この研究を成し遂げたとされています。

—-この話に触れるたびに、私は関孝和を思い出してしまいます。関孝和は、和算と呼ばれた日本版数学の研究者で、代数の発明や円周率の計算を行ったとされています。かつては、関孝和がニュートンらよりも先んじて、微分・積分まで発明していたということがまことしやかに語られたものですが、どうやらその事実はなかったようです。関孝和が天才であったことには間違いがなく、もし彼が日本ではなく西洋に生まれていたら、もっと素晴らしい業績を残したことでしょう。残念ながら、和算は西洋式の数式の記述法と比べて、とても使いづらいものだったようです。昭和の日本人は、西洋へのコンプレックスの裏返しで、「日本が世界初で○○を成し遂げた」とか、「○○は日本が起源」などという話を作るのが大好きでした。そういうコンプレックスの塊のような国が他にもありますね。—-

数量化理論で提案されたことは、海外でもすでに開発され普及しており、数量化理論でなければできないということは1つもありません。海外では数量化〇類という呼び方はまったく通用しませんので、我々日本人はそのことをしっかりと理解しておくことが必要です。

数量化I類というのは、世界標準の統計学では、分散分析(ANOVA)に対応します。これは回帰分析の説明変数が質的変数(カテゴリ)で、目的変数が量的変数(数値)の場合を指しています。したがって、これを既存の(すでに調査が実施されてしまった)アンケート調査データに使用するなら、各設問への回答を説明変数として、何かの量的変数を目的変数とする場合に適用できます。たとえば、購入金額とか来店回数、あるいはウェブサイトの滞在時間などです。これは分散分析であり、コンジョイント分析ではありません。

コンジョイント分析というのは、消費者の好みを調べるための調査とその結果の分析です。消費者に、いくつかの製品(またはサービス)を例示して、その好ましい順位(順序測定値)を回答して貰う調査です。各製品は、いくつかの特性の(カテゴリ値の)組み合わせとして提示されます。分散分析では、このときの特性を「因子(factors)」と呼び、カテゴリのことを「水準(levels)」と呼びます。数量化I類では、それぞれ「アイテム」、「カテゴリ」となります。

ここで、因子と水準の数によって、その組み合わせの数が多くなってしまい、そのすべてを消費者に提示するには無理が出てくるという問題に直面します。そこで実験計画法という手法を使って、できるだけ偏りが生じないように、提示する数を減らす努力を行います。そして、目的変数が順序測定値なので、数量化I類や分散分析の代わりにMONANOVA(単調回帰)という特別な回帰手法を用います。これが本当のコンジョイント分析というものです。

MONANOVAは、まず、①通常の回帰分析(OLS)を行って、回帰係数βを得る。②目的変数Yの予測値(Y)を計算。③予測値(Y)と実測値Yが近くなるように単調変換(Kruskal, 1965)を用いてYの値を変換。④変換値Ytransを新しい目的変数にして新しいβを得る。⑤決定係数の変化が収束するまで①から④を繰り返す。ということを行います。つまり、回帰分析と目的変数の値を最適な連続値に変換する操作を交互に繰り返す方法です。

つまり、仮に順位が1位から10位まであったとして、それらを連続値の得点に変換したときの間隔が単純な9等分とは限らないので、得点を適切な値に修正することを意味します。

残念ながらこうした手法は高額な統計ソフト(XLSTATならXLSTAT-Marketing)にしか含まれません。順序値を連続値に変換する方法としては、このほか、指数関数的減衰曲線などを用いて強制的に連続値に変換する方法があります。これは、どのような曲線を当てはめるかによって変換後の値が異なります。

世間でよく解説されているコンジョイント分析では、回答者に順位を回答して貰う代わりに、直接、評価点を回答して貰うという方法が採られています。これは本当のコンジョイント分析ではなく、簡便法というべきかと思います。この場合、尺度効果という問題が生じます。たとえば、0から9点までの評点を与えるとしても、人によってその尺度の使い方が異なってきます。0から7あたりを中心に使用する人もいたり、3から9あたりを使用する人もいたりします。同じ5という得点でも、その意味するところは、人によって異なるかも知れないのです。これではいくら数理的モデルを使用していても、まったく正確な分析にはなっていないことを容易にご想像頂けるかと思います。

「安物買いの銭失い」という言葉どおり、道具(ツール)を購入するときはお金をケチるべきではありません。機械の性能は、誰が使ってもその性能を発揮します。自動車で言えば、限りなく自動運転に近いような運転支援機能や安全装備のついた自動車は高額です。そこで「初心者だから使いこなせるだろうか?」という心配をする必要はないでしょう。初心者ならなおさら必要な機能もあります。中古の軽自動車にはそんな機能はついていません。性能の良い製品は価格も高くなります。安い製品を買って、高いパフォーマンスを得ようとしても、それは絶対的に無理なのです。ソフトウェア製品の場合も、それはまったく同じことです。

わざわざ調査会社に大金を支払ってデータを収集するのなら、最初から適切な統計ソフトを使用して、しっかり調査票を設計し、調査データをしっかりした手法で分析されることをお勧めします。分析のところは、ほとんどお金をかけずに簡便な方法でお茶を濁すというのはバランスが悪く、とてももったいないです。

 

投稿者について

Kunihiro TADA administrator

マインドウエア総研株式会社・代表取締役。テクニカル・ライター、技術翻訳家、技術評論家。1982年より理工学出版社で情報通信/ニューメディア等の技術者向け先端技術セミナーの企画・運営に従事。LANをはじめ今日のITの基礎となる技術テーマの多くを取り扱った。1985年より大手コンサルティング会社で、先端技術分野の技術動向分析業務に従事。1986年に開催したAIチップ・セミナーは、ファジィ推論チップ等の当時の最先端のAI技術を国内に紹介して、国内のファジィ・ブームのトリガーとなった。1990年から技術評論家として、マルチメディアおよびCG関連の解説記事を執筆。1994年からはインターネットに活動基盤を移し、海外とのビジネスを開始。2000年よりViscovery、2003年よりXLSTAT、およびHuginのパートナーとなる。現在は東京を離れ、岡山に拠点を置いている。かつては産業界のブームを次々とビジネスのネタにしたが、現在はソフトウェアのライセンス販売に注力して、スローライフを決め込んでいる。                               これまでの経験から痛感することは、「人間のやることは、よくて3割程度しか当らない。ブームに寄り集まる人々はほぼ間違いなく成功しない。ビジョンがないからだ。彼らを相手に商売をすると、一時的に成功したかに見えるときもあるが、気づかないうちに自分も同類になっているだろう。流行を追ってはならない。他人がやらないことをやれ。腹の底から『本物だ』と思えることに専念するのが本望だ」

コメントを投稿するにはログインしてください。