KJ法とデータマイニング

投稿者:

KJ法とデータマイニング

自己組織化マップ(SOM)が仮説創造のツールでもある、ということを述べましたが、それについてもう少し詳しく述べます。
類比的には、SOMによる「セグメンテーション」と「プロファイル分析」は、KJ法の「グループ編成」と「はらわた出し」のステップに対応します。
また、敢えていうと、ベイジアンネットワークは、KJ法のA型図解に対応させて捉えることができますが、実際にはそれ以上です。
もちろん、SOMなどのデータマイニングは定量データ(定型データ)を対象とし、KJ法は定性情報(非定型な情報)を対象とする、という違いはあります。もう少し平たく(?)言うと、数字の世界と自然言語の世界です。(ただし、2つとも別世界のことではなく、この世で起きていることを異なる方法で表現しているに過ぎません。)
調査業界では、定性調査と定量調査というのがあります。定性調査には、インタビューやグループインタビューなどの方法があります。あるいは、新聞や雑誌などの2次情報の収集などもそれに含めてよいと思います。一方、定量調査の代表的な方法は、アンケート調査ということになります。
それで一般的には、「定性調査によって仮説を構築して、定量調査によって仮説を検証する」というのが教科書的な調査のあり方なのであります。
ところが、これが実際にはうまくいくことが少ないわけでして、世の中で行われる大部分の調査では、マスコミなどですで一般化しているような関心事が仮説として取り上げられ、それを検証する調査が行われて、当然のことながら、最終的な結論は既知の情報をなぞるだけ、ということになりがちなのです。
と、まあ、これは一昔前までの話であって、現在では定性情報にインターネットでの書き込みなども利用でき、定量データには、Webサイトのアクセス・ログや店舗のPOSデータ、カード会員の取引データなどが利用できるようになっています。さらにアンケート調査も、電話・郵送・訪問などの従来方法に加えて、最近ではネット調査が一般化しております。
分析手法に注目すると、近年テキストマイニングが登場するまでは、定性情報の分析というのは、人間の頭を使って行うしか方法がありませんでした。それで企業など複数の人間で共同して行う場合、お互いの頭の中が見えませんので、それを可視化する方法として(日本では)KJ法というのが普及した時期もありました。KJ法の効力には賛否両論ありまして、評論家のような個人で仕事をする人から見ると「二人三脚のように効率の悪い方法」としか見えないのでした。
定量データの分析は、パソコンが普及する以前は、一部のシンクタンクのようなところを除いては、もっぱら単純集計で「何%の人が○○と答えました」という結果を円グラフなどにしてまとめるのがせいぜいでした。それが、80年代にはビジネス・パソコンの普及によってクロス集計ができるようになりました。そして90年代ぐらいから徐々に多変量解析が広まりました。ただし、分析方法が高度化してくると、その分析結果を理解できる人がぐっと少なくなってしまう、という問題が新たに出てきてしまいました。
そして90年代の終わりから2000年頃に、テキストマイニングやデータマイニングというものが脚光を浴びるようになってきました。ますます手法が高度化しており、それらの分析結果を厳密に理解するには相当高度な統計数理の知識が必要になってくるわけですが、商業的にはそんなことは言ってられません。
それでベンダーは、「ビジネス知識でモデルが適切かどうかを判断すればいい」としています。それは大筋で間違いでもないのですが、ほとんどの場合、技術的にそのような使い方がサポートされているという意味ではなくて、単なる営業トークだとして聞かなければなりません。実際には、かなりの統計知識がなければ正しく使いこなせないデータマイニング・システムがほとんどです。しかし、それを正直に言うと売れないので、「どんな分析技術よりも、ビジネスでのあなたの経験・知識が重要です」と言って、ユーザーの自尊心を利用しているのです。
広告や展示会、セミナーなどに投資して、ブランド・イメージを作り上げ、営業力で売る、というビジネスが、現在のデータマイニングやテキストマイニングの主流になっています。(弊社はそこから取り残されてますが。グスン)それは、コンシューマー・ビジネスのやり方と同じです。企業の生産財の一部として利用されるべきものを採用する際の意志決定が、「消費行動」になりさがっている現状は、情けない限りです。
「テキストマイニングやデータマイニングにユーザーの経験・知識を融合させる」ということを本当に可能にするには、自己組織化マップやベイジアンネットワークなどのソフトコンピューティング・テクノロジー(柔軟な情報処理技術)を利用しなければなりません。商業的なベンダーは、そのことに真剣に取り組んでいるとは言えません。
自己組織化マップとベイジアンネットワークがKJ法とよく似ている、ということは、とても重要なことなのです。人間が頭でものを考えるときに、いつでも同じように頭を働かせているはずです。あるときはナントカ法を使い、またあるときはカントカ法を使い…なんてややこしい頭の使い方をしているでしょうか?創造性技法かなんかのインストラクターならそんなことを推奨しかねませんが(笑)。
KJ法というのは、結局のところ、
(1)物事をグルーピングしてみる
(2)グループ内の共通特性を抽出する
(3)グループおよび特性間の関係性を調べる
ということに尽きます。それはいたって普通のことをやっているだけす。世間では、カワキタジロー大先生が考案したことになっていますが、そんなことを教わらなくても誰でも頭の中で同じことをやっているのです。逆にいうと、それを定式化したところが、大先生の偉大さであります。
自己組織化マップとベイジアンネットワークを用いると、つまり、人間が普通にやっている思考のままで数値データを分析できる、ということなんです。
そのなかで、とくに自己組織化マップの役割は大きいです。なぜなら、KJ法のカワキタジロー大先生が教えるように、グルーピングを変えることで、新しい創造・発見につながるからです。
————————————————————–
2009年7月8日、文化人類学者の川喜田二郎先生が永眠されました。
ご冥福をお祈り申し上げます。

投稿者について