探究のリテラシー

投稿者:

探究のリテラシー

データマイニングは、探究のプロセスです。
そこで(世の中で科学の有効性がまだ十分には認められていなかった)19世紀以前の科学者なら、大上段に構えて「真理の探究」と真顔で言いだしそうなところだが、21世紀の我々は、もうそんなプロパガンダを信じるわけにはいかないです。
「無限大の遠い未来においては、人類が真理に到達する日がくるだろう」と想像するのは自由ですが、それは現実のことではありません。現実の我々人間はというと間違ってばかりなのです。科学的知識にも「絶対」はあり得ません。科学が「権威」になってしまうと、もはやそれは「科学」ですらありません。「権威ある科学的分析結果」によって、無実の善良な市民が殺人犯に仕立て上げられることだってあり得るのです。
「権威ある○○○社のデータマイニングの結果なら間違いないだろう」という姿勢でデータマイニングを採用しているとしたら、それはとても危ないことです。すぐに見直すべきです。
もし行政機関がそんなデータマイニングの使い方をしたら、それをもとにいろいろな判断をされる一般市民はたまったものではありません。民間企業の場合、間違った判断を妄信して損をするのは、一応、その会社だけです。しかし、「社会の公器」と呼ぶにふさわしい大きな会社の場合、やはり従業員や消費者などたくさんの人々に迷惑をかけることになります。
どのような高度なデータマイニング技術を用いたとしても、それから得られるモデルは、その時点、その時点での暫定的な「仮説」でしかありません。どのようなモデルも、常に新しいより良いモデルに取って代わられる可能性を残しています。
じつは、これと同様なことが、過去100年以上もの間に、認識論哲学や科学哲学の分野で議論され尽くされてきています。21世紀の我々が理解して身につけなければならない情報リテラシーは、単に新しい情報技術の使い方を覚えるということではなくて、「我々は何を知りえるか?」という哲学を含まなければなりません。
哲学というと大げさに聞こえてしまうのですが、簡単なことです。科学だろうとデータマイニングだろうと所詮人間のやることだ、ということに尽きます。
データマイニングはコンピュータが計算するので、その部分がクローズアップされて「コンピュータが計算したのだから間違いない」となりやすいのですが、そこが落とし穴です。確かにインプットされたデータに対しては、それぞれのアルゴリズムが規定している範囲に関しては正しい結果を出しているはずです。しかしながら、「どんな目的を持って、どんなデータを入力して、結果をどう活用するか」というプロセス自体は、人間が主体になって行うべきことです。人間はそこで必ずミスをやらかします。
野球でも3割打てたら一流プレーヤーなわけですが、ビジネスにしても何にしても、人間のやることは大部分的外れです。それが現実です。とくに不案内な状況では、たいてい何か失敗をやらかします。物事の最初は失敗から始まり、試行錯誤を繰り返しながら、より良い方向に探索の範囲を絞り込んでいき、何か当たりに出くわすまで努力を続ける。それが人の生きる道でしょう。
データマイニングでも同じです。プロフェッショナルが作成したデータマイニング・ツールを使えば、一応計算自体は正しく行えます。しかし、その計算が的を射ているかどうかは、ツールの問題ではなく使う人の問題なのです。つまり、データマイニング・ユーザーは、「探究のリテラシー」を持たなければなりません。

投稿者について