道具は大事

投稿者:

道具は大事

データマイニング・ユーザーは、「探究のリテラシー」を持たなければならない、のですが、だからと言って、ツールはどうでもいいということにはなりません。念のために言っておきますが、どんな仕事でも道具は重要な要素です。道具の良し悪しで結果が左右されます。
たとえば自作のプログラムでデータマイニングをするなんてことは、小さなボートで太平洋を渡るようなものです。データマイニング技術の学術研究を目的とする以外は、商用のデータマイニング・システムを導入することをお薦めします。
したがって、それを前提にすれば、アルゴリズムの詳細は、すでにソフトウェア製品に実装されているわけですから、ユーザーがそれについて何かをすることはありません。「データマイニングを習得するには、機械学習アルゴリズムの詳細を理解しなければならない」という誤解が根強いわけですが、どんなにその詳細に精通したところで、データマイニング・システムの開発者にならない限りは、その知識を生かす場面はありません。
データマイニング・ユーザーは、アルゴリズムの詳細な部分ではなく、広くあらゆるデータマイニング技術について、そのコンセプトを大づかみに理解して、そこから自分の目的に合致したより高度な(より本質的な)技術をより少なく選定するべきです。あまりたくさんのツール、アルゴリズムを駆使しようとするのはお薦めではありません。
アソシエーション・ルール、決定木、クラスタ分析、時系列分析、重回帰分析、ニューラルネットワーク、自己組織化マップ…あれやこれやと使って、果たしてすべて完璧に使いこなせるものでしょうか?はっきり言って無理です。これら1つ1つが研究対象になるほど奥の深いものです。通常の人間が、これらのすべてを完璧に使いこなせるということはほぼあり得ないことなのです。
細かなことをたくさん覚えようとするよりも、より広く応用が利く、より本質的な原理に基づくツールを採用するのがお薦めです。弊社がViscoveryを推奨する理由は、まさにここにあります。
ユーザーが探究のプロセスに意識を集中させるためには、できるだけテクニカルなことは気にしないで済む方法をとるべきです。そのためには、統一的なアプローチが必要です。
Viscoveryでは、あらゆる分析の基盤を自己組織化マップ(SOM)に置いています。SOMがさまざまな分析の共通基盤になっています。
Viscovery以外のデータマイニング・システムでも、SOMが搭載されてはいますが、Viscoveryのようにはなっていません。たとえばクラスタ分析と重回帰分析は、まったく別々の分析であって、通常は共通の表現基盤は持ちません。
一方、ViscoveryではSOMのマップ表現の上で、クラスタ分析や(統計的検定を含む)プロファイル分析、さらに(非線形に対応した特別な)重回帰分析などを行い、分析結果を解釈できます。ユーザーは、Viscoveryのマップの読み方さえマスターすれば、統計や各種アルゴリズムに関する知識レベルにはかかわらず、マップ上で行うどのような分析も理解できます。

投稿者について