月別アーカイブ 2月 2018

投稿者:Kunihiro TADA

Viscovery SOMineのビッグデータ分析には4Kモニターが便利

もはやさほど新鮮な話題でもないのですが、4KモニターとViscovery SOMineを使ってビッグデータを分析するというお話です。

Viscovery SOMineは、多次元(多変量)データを可視化する最強のツールです。属性ピクチャ―(各変数値のトポロジカル・ヒートマップ)により、多数の属性間の関係性を可視化することができるだけでなく、さらにクラスタリングや、各クラスタや各領域のプロファイル分析、各種統計解析、選択した領域に対応するデータレコードの表示、クラス分類モデルやローカル回帰モデル(非線形対応の回帰モデル)の作成、そして、それらモデルの適用・検証などができます。そのため作業中のViscovery SOMineの画面には、かなりたくさんのサブ・ウィンドウが表示されます。比較的小規模なデータを分析しているときでも、サブ・ウィンドウがたくさんあるので、通常のフルHDの画面ではちょっと狭く感じることがしばしばあります。

そこで4Kモニターを使ってみると、これがなかなか快適です。さらに8Kモニターというのも市場に出始めている段階ですが、まだまだ価格が高いです。4Kモニターはお手頃価格になってきましたので、これからは4K以上のモニターがViscovery SOMineの推奨動作要件と言えそうです。

 

 

 

 

投稿者:Kunihiro TADA

ご連絡遅延のお詫びとお願い

弊社が利用するクラウド・サーバー業者のシステム・トラブルにより、昨日、平成30年2月23日15時13分頃から20時21分頃までの間の全Eメールが消失してしまいました。消失したメッセージの総本数は数100通を上回るものと推定されます。

この時間帯に弊社およびXLSTATにお問い合わせ、ご連絡頂いたお客様には、たいへん申し訳ございませんが、お送り頂いたメッセージを受信できておりませんので、ご返事ができない状態となっております。誠に申し訳ございません。

もしお心当たりのあるお客様がおられましたら、誠に恐れ入りますが、sales@mindware-jp.comまたはinfo@xlstat.co.jpまで再度メッセージをお送り頂ければ幸いです。

よろしくお願い致します。

 

 

 

投稿者:Kunihiro TADA

ご連絡遅延のお知らせとお詫び

平成30年2月23日15:13頃、弊社が利用しているサーバー業者のメール・サーバーに障害が発生し、18:40現在もまだメールでのご連絡ができない状況です。メールでのお問い合わせはもちろん、ウェブサイト(www.mindware-jp.comおよびwww.xlstat.com/ja)のフォームからのお問い合わせもメールで弊社に転送される仕組みとなっておりますので、それらがすべて受信できておりません。

お客様各位にはたいへんご不便をおかけして誠に申し訳ございません。

サーバーが復旧次第、順次、返信を行って参りますので、今しばらくお待ち頂けますようお願い申し上げる次第です。

 

 

 

 

 

投稿者:Kunihiro TADA

XLSTAT-Rの新機能

XLSTAT-Rに新しい関数が追加されました。

Partitioning Around Medoids (Medoidによる分割)
この教師なし機械学習アルゴリズムは、K-meansクラスタリングのロバストな代替法を提供します。各クラスタの中心が、medoindと呼ぶクラスタ内のオブジェクトの1つによって代表されます(clusterライブラリのpam 関数)。

Dissimilarity matrix for mixed data (混合データの非類似度行列)
量的変数と質的変数で説明されるオブジェクト間のGower 係数を用いた非類似度行列(clusterライブラリのdaisy 関数)。

GARCH modeling(GARCHモデリング)
金融予測でよく使用されるこのモデルは、変動性クラスタリング特性を持つ 時系列に適応します( tseries ライブラリのgarch 関数)。

Kriging
地質学や気象学などのさまざまな分野で使用される時空間補間法の地球統計学的アプローチ (gstat ライブラリの gstat 関数)。

投稿者:Kunihiro TADA

XLSTAT急成長

現在、世界中で30万人以上の人々がXLSTATの使用経験を持ちます。先行する他社製品にはまだまだ及びませんが、少なくとも学術用統計解析ソフトウェア市場の一角を占める存在になりつつあることは間違いありません。日本市場は世界市場の中での比率が相対的に縮小しており、現在では世界市場の5%に届くか届かないかというぐらい希薄な存在感となってしまっているのですが、それでも日本国内でのXLSTATユーザー数も堅調に増加しています。現在、1日に10人程度のペースで日本での新しいユーザーを獲得しております。

マインドウエア総研としては、2000年からViscovery SOMineの取り扱いを始め、長年にわたってSOMアプローチのデータマイニングを事業の中心に据えて参りました。2003年にベイジアンネットワークのHuginと提携を開始して、SOMとベイジアンネットワークにおいて世界的なトップランナーの技術を日本市場に提供する役割を担って参りました。

XLSTATも2003年から提携を開始したのですが、正直なところ、当初はXLSTATにはそれほど重きを置いておりませんでした。それから15年の年月が流れて、気が付けばマインドウエア総研の売上でのXLSTATの占める割合がViscoveryを抜いてトップに躍り出る状況となってきました。

今、世間はディープラーニングをはじめとする機械学習ブームであり、大学や研究機関の人たちがここぞとばかりに予算獲得のために「シンギュラリティ(技術的特異点)」という言葉まで持ち出して、SFめいた未来のAIに関する夢物語を世間に流行らせて、多くの企業や人々がそれに夢中になっている状況です。

ディープラーニングも重要な技術の1つではありますが、それだけではまだまだシンギュラリティとやらに達するほどの技術革新が出揃ったことには絶対になりません。少し頭を冷やす必要があるかと思います。かつて日本は、第五世代コンピュータという壮大な国家プロジェクトに失敗しています。関係者はそれを失敗とは認めていないのでしょうが、客観的には大失敗だったと言わざる得ません。第五世代コンピュータのコンセプトは、if~thenルールを高速に実行することに特化したハードウェアを開発することにあって、その時点ですでに世界の先端的研究からすると周回遅れの発想でしかなかったのです。そして、今脚光を浴びているディープラーニングも、人工ニューラルネットワークの世界では昔からある手法に過ぎません。

SOMやベイジアンネットワークというのは、80年代の当時、日本人がまったく気づいていなかった新しいアプローチをヨーロッパ人が示したものです。この30年間は、これらの技術が実用的な知的情報処理を地道に提供してきたわけです。AIブームに狂奔する人々から見ると、ディープラーニングこそが最先端で、もはやこれらの技術は時代遅れにさえ映っていることでしょう。しかし、SOMやベイジアンネットワークの技術も、この30年間で着実に進歩しております。製品として実現されているものは、初歩的な教科書に載っているレベルよりもはるかに先を行っております。

マインドウエア総研としては、これまで長年、SOMとベイジアンネットワークの最優良技術を提供してきたプライドを持ちつつ、現在の浮薄なAIブームとは距離を置く方針です。私のこれまでの経験(狭い経験かも知れませんが)から言えることは、ブームに巻き込まれている人々の大部分は見当はずれなことに熱中しており、そうした人々と仕事をしてもよい結果は得られないからです。したがって、AI関連の展示会等のお誘いにも乗りません。ブームに便乗して一儲けしようなどとは考えません。坦々と我が道を行くのみです。

現在の機械学習技術で話題になっていることのほとんどは、我々が十数年前から地道に提供し続けております。

幸いにしてXLSTATがマインドウエア総研の経営安定化に貢献してくれているので、当面はこれに頼りながら、次の新しい技術を発見することに力を注いで参りたいと考えます。