月別アーカイブ 7月 2018

投稿者:Kunihiro TADA

見直されるViscovery SOMine

ここ数年吹き荒れたディープラーニング&AIブームで、弊社が推しているViscoveryは影の薄い存在になっておりましたが、ここにきて再評価されつつあります。

結局のところディープラーニングもそう簡単なものではありません。たくさんのパラメータ設定を試行錯誤しなければならず、それでいて、ディープラーニングで生成されるモデルを人間が理解できないという致命的な欠点があることに、多くの人が気づきはじめたようです。

もちろんGoogleのようなシステム開発力のある企業にかかれば、ディープラーニングを使って、これまでに存在しなかったようなアプリケーションやサービスを産み出すことも夢ではないでしょう。しかし、多くの企業が必要としているのは、そんなことばかりではありません。ほとんどの企業が解決するべき課題は、伝統的な機械学習や統計手法でとっくに実現されていたことばかりなのです。

すでに2000年頃には、そうした技術が出そろっていたのですが、そのユーザーとなるべき企業の人々の頭の中がそれに追いついていなかったので、せっかくの技術が有効に産業利用されるには至らなかったわけです。そこにディープラーニング&AIブームが起きて、人々の意識がこちらに向いてきたことは、結果的に良いことでした。

ディープラーニングを使えば、いわゆる「特徴エンジニアリング」と呼ばれるデータ加工を経ずにモデルを構築できるとされるのですが、一方、SOMに代表されるような従来的な手法では、その工程が欠かせないばかりか、それこそが成功のカギになります。

SOMを使ったデータ・モデリングの過程は、ユーザーにとっては「データ理解」そのものです。人間が人間である限り、多次元データを把握することは不可能です。SOMによる多次元データの可視化も一種の方便のようなものではありますが、他のどの手法よりも、多次元空間の様子を人間が理解するのに強力な方法です。

ディープラーニングの限界から、最近では説明可能AI(XAI: explainable AI)という議論もされているようです。ユーザーの「なぜ?」という問いに、自然言語で回答してくれるような(まさにドラえもんのような)AIが理想形でしょう。

しかしながら、そこで「待った!」がかかります。そもそも知識(knowledge)というものが言葉で表現できるものばかりではないからです。それは60年代のパターン認識の研究(今日の機械学習アルゴリズムの先駆け)の段階からわかっていたことなんです。AIでなくても、人間でも、たとえば、人の顔を見て誰の顔か判断できたとしても、その方法を言葉で説明することなんてできないのです。

そのような言語以前の判断力を、マイケル・ポランニーはtacit knowledge(暗黙知)と呼んだのですが、残念ながら日本のマネジメント界では90年代にこれを大きく曲解して、似非科学的ナレッジ・マネジメントを流行させてしまった罪深き過去があります。

SOMは、人工ニューラルネットワークの観点から見ると、あるいはディープラーニングと比較すると、それほど高度なものではないのですが、この非言語的なナレッジを可視化して、人間が理解するにはとても理に適った手法です。

ほとんど企業の実践的な問題解決には、ViscoveryのSOMテクノロジーが役に立ちます。

 

 

 

投稿者:Kunihiro TADA

Viscovery SOMine 7.2 Data Mining Suiteの新機能

Viscovery SOMine 7.2では、下記の機能が追加されました。さらに、バージョン 7.1.1. から発見されたエラーが修正されました。

全般

– テキスト・ファイルからのデータ・インポートがかなり速くなりました。
– 属性の定義ステップで名義変数が定義されるとき、大文字小文字を区別しないオプションがデフォルトでオフになりました。これは大文字小文字に鈍感なことが望まれない場合に性能が勝ります。
– 正規表現に関する名義変数の処理がかなり速くなりました。
– 属性の重みづけの設定が異なるデータを使用するワークフロー・ブランチで再利用されるとき、設定のない属性の重みは、1ではなく0で初期されるようになりました。これは、追加の属性を持つデータで同じマップを計算したい場合に便利です。
– 属性の割り当てダイアログの使い勝手が改善されました: 一覧がほぼ比例的にサイズ変更されて、未使用の属性名の一覧は >> ボタンをクリックした後、元の順序のままになります。
– クラスタの特徴ウィンドウは、いくつかの場合、表示の最上部にスクロールします。
– クラスタの特徴ウィンドウ(水平バー)の左側のリストで属性の順序が、マップ・ウィンドウやその他でも使用されている一般的な属性の順序に従うよになりました。
– ワークフロー・ステップの処理の進捗が、Windowsタスクバーにミラーされるようになりました。
– データレコード・ウィンドウでレコードのソーティングをキャンセルできるようになりました。
– 新しい関数 join(delim, str1, …), join_sorted(delim, str1, …), trimleft(str, char), trimright(str, char) が数式で利用できるようになりました。
– 関数 min, max, mean, count, sum, join, join_sortedで、パターンを書いて引数を指定できるようになりました。従って、パターンにマッチする変数が引数として渡されます。
– マップ・ウィンドウで属性のタイトルが長くなりすぎるとき、名前の末尾からではなく、名前の中間から文字が消されて、短縮されるようになりました。

SOMモデルの編集

– マップ・ピクチャ内のラベルがグループで構成できるようになりました。ラベルの表示をグループごとにコントロールできます。この機能は、編集| ラベル | ラベル・グループを管理 で呼び出せます。文書(画像)のサムネイルがマップ上に表示できます。それをするには、パス名がラベルとしてインポートされるか貼り付けられていなければならず、対応するラベル・グループがパス名としてマークされていなけばなりません。

互換性

– Viscovery SOMineのファイルは、バージョン 7.1.1 と 7.2 の合いアdで双方向に交換可能です。
– ラベル・グループが定義されると、以前のバージョンのソフトウェアでは、表示ラベルのみが示されます。SOM が現行バージョン以降に読み込まれるとき、表示ラベルが保持されます。