自己組織化マップが考案されてもう30年

投稿者:

自己組織化マップが考案されてもう30年

今年2012年は、Kohonen先生が自己組織化マップ(SOM)を考案してから30年目にあたります。もう30年です。
Kohonen先生の業績の偉大さは、さまざまな亜種を考案することが可能なSOMの大元のアイデアを考案したことにあります。
その10年後の1992年にSOMのバッチ学習アルゴリズムが発表され、統計的応用の可能性が出てきて、Kranner氏とSixt氏が統計的見地からSOMを再構築して、1994年から資本投入してEudaptics(現在のViscovery)社を設立し、本格的な規模でSOMineの開発を開始しました。
1997年頃には、その技術がほぼ完成しており、私がSOMineを日本語化して国内で売り出したのが2000年のことでした。それからでも、もう干支が一回りしたことになります。
それにしても「自己組織化マップ」というネーミングは(良い意味でも悪い意味でも)強烈です。
もう何年も前のことですが、サポートベクターマシンのある著名な開発者と会ったときに、彼が”I don’t believe SOM!”ときっぱりと断言したことは、今でも印象深く記憶に残っています。
たぶん、彼が言いたかったことは、「SOMのアルゴリズムが、自己組織化やっているなんて俺は信じていないよ」ということだと思います。また、その背後には、SOMに関わる人々の中には、SOMを宗教のように崇拝していてあまり科学的とは言えない状況がある(たとえば統計学的にはトンデモだったりすることがある)ことへの批判が込められていたように感じます。そういうことなら、私もまったく同感です。
90年代に複雑系のブームがあり、ごく一部のまじめな研究のほかに、便乗組のトンデモ研究がはびこった時期がありました。そこから派生して「自己組織化」というキーワードも、魅惑的な言葉の魔術として、トンデモ研究によく利用されたものでした。残念ながら自己組織化マップの周辺にも、胡散臭い研究が散見されます。「自己組織化」というネーミングがそういう人たちを寄せつけやすくしたことは否めません。
しかし、考えてみれば、それは人工ニューラルネットワーク全般にも、同じようなことがあります。人工ニューラルネットワークを利用した予測システムというのは、大企業でもやっていたりするのですが、それを宣伝するときに必ず「人間の脳を模した」という修飾がついていたりします。作っている人たちは、百も承知のはずなのですが、現実には、その言葉通りの人工ニューラルネットワークは1つも存在しません。
人工ニューラルネットワークは、データを学習して入力に対して適切な出力を行えるものです。入力に対して出力を返すという機能は、一種の関数だと言えますが、その関数を明確な数式で表さなくてもよいようにできるのが、人工ニューラルネットワークです。(もちろん、計算には数式を使用していますが、数式によって入力と出力の関係を直接記述するのではありません。)
自己組織化マップは、多変量データを学習して、データの分布を多数のノード(参照ベクトル)で、離散的に要約するものです。学習の際にノードがばらばらに動く場合は、K-meansというよく知られたアルゴリズムと等価であり、近傍関数によってノードが格子状に結束されて、ノード間の値の変化がスムージングされているものが自己組織化マップです。
良質なデータマイニング(Viscovery)では、自己組織化マップがデータ分布のトポロジーを保持していることを利用しています。「位相保持マップ」という専門用語もあるのですが、こちらはあまり知られていません。本当は、この用語を使ったほうが誤解が少なくなるはずなのですが、「自己組織化マップ」というネーミングが通りが良いことと、大元のアイデアを作ったKohonen先生へのリスペクトの意味もあって、今でも「自己組織化マップ(Self-Organizing Maps)と呼ぶことになっています。
データマイニングでは、「自己組織化」だから何か良いことがある、ということはまったくありません。そもそも自己組織化マップが「自己組織化」と呼べるのであれば、主成分分析でもK-meansでも全部「自己組織化」です。
要するに、人工ニューラルネットワークにせよ、自己組織化マップにせよ、機械学習アルゴリズムであることには違いがありません。ある種の機械学習アルゴリズムを考案するとき、または学生に教えるときに、発想の拠り所として、つまり、ヒントとして、脳機能とか神経細胞網のメタファーを使用しているだけだとも言えます。
人工知能やニューラルネットワークの研究から、私はよく中世の錬金術を思い出します。錬金術は科学的には間違いでした。どのような物質を混ぜ合わせても金は作れません。しかし、結果としては、錬金術が現代の化学の礎になったとも言えるでしょう。
同様に、コンピュータで人間の知性を表現しようという目論見は、たぶん間違いなのでしょう。しかし、錬金術から化学へと同様、怪しげなところから何か役に立つ新しいものが生まれてきたりします。データマイニングや意思決定支援システムなどは、結局、そういうところから生まれて来たんだなあ、と感慨に耽る次第です。

投稿者について