年別アーカイブ 2012

投稿者:

「Excel SVM」「Excel SOM」

※この記事は古い記事ですが、アクセスが多いので書き換えさせて頂きます。(2016.6.10)
弊社ブログのログを見ると表題のキーワードでの検索が目立ちます。
SVM(サポートベクターマシン)もSOM(自己組織化マップ)もExcelそのものでは計算できませんが、ExcelのアドインやExcelのデータファイルを使用できるソフトウェアはあります。
まずSVMの計算ができるExcelアドインは、現在XLSTATのみです。
書き換える前の記事では、11Ants Model Builderをあげておりましたが、現在はこの製品は販売されておりません。ちなみに、11Ants Model Builderは、SVMを含む11種類のアルゴリズムにより、予測・分類モデルを自動生成する世界で初の製品でした。最近、米DataRobot社が話題になっていましたが、それよりも何年も前にニュージーランドの11Ants Analyticsが実現しております。現在、同社は、単なるモデルの自動生成のレベルは卒業して、小売業向けとエアライン向けの特定業種ソリューションに形を変えております。
11Ants Model Builderに搭載されていたアルゴリズムのリストは下記に残しておきます:
•ディシジョン・ツリー(決定木)
•ガウス過程法
•ロジスティック回帰
•ロジット・ブースト
•モデル・ツリー
•ナイーブ・ベイズ
•最近傍法
•偏最小2乗法(PLS)
•ランダム・フォレスト
•リッジ回帰
•SVM
11Ants Model Builderは、自動でモデル作成・評価を行い、アルゴリズムの選択、およびアンサンブル予測モデルの構築(複数モデルによる予測性能の向上)を行っていました。短時間で数1000個以上ものモデルを検討して、最も予測性能のよいモデルを見つけていました。つまりDataRobotよりも先行です。
SOMの方は、何といってもViscovery SOMineがお薦めです。これは単独のWindowsアプリケーションですが、ExcelファイルからSOMのモデルを作成できます。そのほかにもテキスト・ファイル(タブ区切り、スペース区切り)が取り扱えます。またSPSS(.sav)のオプションもあります。
じつは、パッケージ製品としては販売していないのですが、Viscoveryの機能を既存のシステムに組み込むためのモジュールは、個別に提供しております。Excelのアドインとして動作するSOMも(必要があれば)提供可能です。ただし、パッケージではなく個別受注です。

投稿者:

HUGIN 7.7 日本語GUI

HUGIN日本語GUIを更新しました。ご利用の方はマインドウエア総研にお問い合わせください。

投稿者:

Huginの開発スタッフによる新著

Kjærulff と Madsen による教科書の第2版がSpringerから出版されます:
Kjærulff, U. B. and Madsen, A. L. (2013). Bayesian Networks and Influence Diagrams: A Guide to Construction and Analysis. Second Edition, Springer. ISSN 1613-9011, ISBN 978-1-4614-5103-7, ISBN
978-1-4614-5104-4 (eBook) and DOI 10.1007/978-1-4614-5104-4.
さらに、HUGINのスタッフた著者および共著者である以下の出版物があります:
Madsen, A. L. and Butz, C. (2012). On the Importance of Elimination Heuristics in Lazy Propagation in Proceedings of the 6th European Workshop on Probabilistic Graphical Models, pp. 227-234.
Garcia, A. B., Madsen, A. L., and Vigre, H. (2012). The use of Probabilistic Graphical Models to develop a cost-effective vaccination strategy against Campylobacter in poultry. Abstract and poster presentation at the 13th Conference of the International Society for Veterinary Epidemiology and Economics (ISVEE XIII).
出版物のすべての一覧は、http://www.mindware-jp.com/hugin/developer/publications.htmlにあります。

投稿者:

HUGIN ExpertがEUプロジェクトOpenNessに参加

第7フレームワーク計画下の協調プロジェクトOpenNESSにHUGINが参加します。
OpenNessの正式なプロジェクト名は、「Operationalization of Natural Capital and Ecosystem Services(自然資本およびエコシステムの運用化):コンセプトからリアル・ワールド・アプリケーションまで」です。54か月のプロジェクトで、2012年12月1日にスタートして、2017年3月31日に終了する予定です。
プロジェクトの総コストは、11,489,110ユーロ(約12億6千万円)で、うち 8,999,193 ユーロを欧州連合が負担しています。
このFP7 強調プロジェクトは、47のパートナーが関与しており、SUOMEN YMPARISTOKESKUS (フィンランド環境研究所 – SYKE)によってコーディネートされる予定で、コーディネータはEeva Furman、そしてアドミニ・コンタクトはMaria Koskiです。
プロジェクトのwebサイトがアナウンスされています:
Community Research and Development Information Service (http://cordis.europa.eu)
我々の開発戦略の一部として、HUGIN EXPERTは、欧州委員会が一部出資する研究および開発プロジェクトに頻繁に参加します。現在および過去のプロジェクトに関する我々のwebサイトはこちらです:
http://www.mindware-jp.com/hugin/case-stories/eu-projects.html

投稿者:

HUGIN Expertが農業リスク・マネジメント・プロジェクトに参加

2012年1月にスタートした農業リスク・マネジメントに関するプロジェクトでのHugin Expert A/Sの参加は、もうすぐ終了となります。このプロジェクトを通して、デンマークの養豚におけるリスク・マネジメントのための RiBAY というシステムが開発されました。このプロジェクトは、Norma and Frode S. Jacobsen’s Fond および Nordea Bank Fondenによって外部的に資金提供されました。プロジェクトのコーディネータは、コペンハーゲン大学・食糧資源経済研究所のMogens Lund氏です。
RiBAYに基づくソリューションの完全な運用開始は、2013年の予定です。
詳細情報(デンマーク語)は、こちらにあります:
http://risiko-svinebrug.hugin.com
マインドウエア総研より一言:
国内でも畜産に限らずさまざまな分野で公的研究機関や大学等が、国からの受託研究で、Huginのソフトウェアを購入して(自力で)システムを開発しようとする試みが多数ありますが、どれも本格的な運用には至っていないようです。海外では、上記のように公的研究機関の研究員や大学教授がコーディネーターとなって、Hugin Expert A/Sと共同で(正規の開発費用を支払って)本格的なプロジェクトを実施して、実用のシステムを開発する流れとなっております。「餅は餅屋」という言葉があります。ぜひともご認識を改めて頂きたく存じます。

投稿者:

HUGIN-FDC実装が開始される

2012年8月に、HUGIN Expert A/S と保険業界向けのITソリューションでスカンジナビア最大の企業であるFDCは、保険詐欺を検出して阻止する保険会社を支援するコレボレーションの計画を発表しました。
コラボレーションの目的は、FDCの既存および見込み顧客に不正を削減するための有効なツールを提供するために、FDCのソリューションにHUGINソフトウェアの機能を組み込むことでした。
サービスITプラットフォームとしてのFDCソフトウェアへのHUGIN FDMソフトウェアの統合は、ノルウェーの主要な保険会社における予備パイロット・プロジェクトで、成功裏に実証されました。現在、ソリューションを実装する作業が、ノルウェーの保険会社で始まっており、実装の第1フェーズは2013年2月に完了する予定です。

投稿者:

HUGIN 7.7リリース

HUGIN ソフトウェアの新バージョンv7.7がリリースされました。
このリリースの主な新機能は、”discrete function(離散関数)” ノードという新しいタイプのノードと、関連する新しい演算”aggregate(総計)”の導入です。
離散関数ノードは、関数ノードと類似しています。関数ノードがネットワーク中の伝播の結果から計算される数値を表すの対して、離散関数ノードは、数値の集合を表します。つまり、離散関数ノードには、区間またはラベルつき、およびステートの集合などのサブ・タイプがあります。離散関数ノードは、ネットワーク中で伝播がうまく行ったあとに計算される分布を表す数式をユーザーが定義することを可能にします。
新しい演算 “aggregate(総計)” は、2つの分布(度数と重大度を表す)を1つの分布にまとめることに使用できます。数式は、テーブル・ジェネレータを用いて定義されます。
これは、確率ノードのサブ・グラフを接続する(さもなくば切断する)ために、関数ノードと、たとえば、”確率” 演算子を使用することが可能です。これは、1つのネットワークで計算された確率が、別のネットワークに転送できることを意味します。
離散関数ノードに関する機能の開発や総計および確率転送オペレータは、”銀行および金融の運用リスク”の研究プロジェクトによって資金提供を受けました。このプロジェクトは、 Basel II準拠運用リスク測定および Advanced Measurement Approach (AMA)に従うマネジメント・ツールの開発を含む銀行および金融部門での運用リスクのマネジメントの強化に供されます。スタバンゲル大学とSparebank 1 SR-Bank, Sparebank 1 SNN, Sparebank 1 SMN, Sparebanken Hedmark, Sparebank 1 Oslo and Akershusからなるノルウェーの銀行のコンソーシアムによって資金提供されています。
HUGIN グラフィカル・ユーザー・インタフェース v7.7
HUGIN グラフィカル・ユーザー・インタフェースが、さまざまな新機能で改良されています:

  • 離散関数ノードと”aggregate(総計)” および “probability(確率)” 演算子が、HUGIN GUIでサポートされました。
  • 学習およびEM学習ウィザードで生データを折り扱うためのデータ前処理が、新機能によって改良されました。これは、列削除の可能性と教師あり離散化のためのエントロピー・ベース離散化を含みます。
  • HUGIN GUIは、現行の戦略でのLIMID でのシミュレーションをサポートしました。
  • HUGIN GUIで、ドメイン・オブジェクトに関する属性を定義できるようになりました。
  • 効用感度分析(Utility Sensitivity Analysis)ダイアログが、HUGIN GUIに追加されました。これは、LIMIDの効用パラメータについて感度分析を実行することを可能にします。この感度分析は、ユーザー定義パラメータ値の集合で、LIMIDを解きます。
  • コード・ウィザードが、新機能で拡張・改良されました。これは、コード・ウィザードの性能を改善しました。
  • DataSetダイアログの”propagate ALL rows(すべての行を伝播)” の性能がかなり改善されました。
  • HUGIN GUIでのd-分離コードが、性能改善のために置き換えられました。
  • 数値ノードの平均と分散の計算が改善されました。
  • CTRL+右クリックを用いて実行モードのノードのテーブル・ジェネレータの式を調べることができるようになりました。
  • ノード・ステート・ジェネレータが、異なるカテゴリと同一のサブ・タイプのノード間でステートをコピーすること(たとえば、ラベルつき離散確率ノードとラベルつき離散決定ノードの間でステートをコピーすること)をサポートして拡張されました。
  • その他のマイナーな改善。

なお、HUGIN グラフィカル・ユーザー・インタフェースの性能を改善するためのあらゆる努力がなされました。
HUGIN Decision Engine v7.7
The HUGIN Decision Engine が、下記の機能で拡張されました:

  • 新しいタイプのノードが導入されました: “discrete function(離散関数)” ノード。このノードのタイプは、”discrete(離散)” と “function(関数)”ノードのタイプの組み合わせです。前バージョンのHUGIN APIで実装されていた関数ノードは、現在、”real-valued function(実数関数)” ノードと呼ばれます。
  • “aggregate distributions(分布の総計)” を表す新しい演算子が導入されました。分布の総計は、独立した一様分布確率変数の乱数の合計の分布です。この演算子は、離散関数ノードのモデルでのみ使用できます。
  • 離散ノードの確信度から計算された確率を表すために、新しい演算子が導入されました。この演算子は、関数ノードのモデルでのみ使用できます。
  • より一般的なネットワーク・トポロジーが指定できるようになりました。これは、実数関数ノードでない2つのノード間で”functional links(関数リンク)”を含む有向パスを持つことができます。この機能は、新しい数式演算子を使用するための目玉です。
  • 新しい2つのパラメータが、total-weight triangulation method(合計重み三角化法)のために導入されました。これらのパラメータは、より良い三角化を生成し、三角化プロセスをスピードアップします。
    • “initial triangulation(初期三角化)”が指定できます: すでに良い三角化がわかっている場合、より良い三角化の探索をスピードアップするために、これを使用できます。
    • 事前指定するサイズよりも大きなセパレータを破棄することにより、最小セパレータの探索がスピードアップできます。これは、(より小さなグラフに分割する必要なしに)より大きな主要コンポーネントを取り扱うことも可能にします。
  • 離散関数ノードと新しい数式演算子をサポートするために、NET言語が拡張されました。
  • Windowsプラットフォーム用のHUGIN API ライブラリが、(Visual Studio 6.0, Visual Studio .NET 2003, Visual Studio 2005, Visual Studio 2008, および Visual Studio 2010に加えて) Visual Studio 2012用に提供されました。
  • HUGIN WebサービスAPI が、確信度バーの作成、ベクトル・グラフのプロット、表の編集のための新しいウィジェットで拡張されました。
投稿者:

MacでMiner3D

3次元CG(コンピュータ・グラフィックス)を用いて多変量データを可視化するビジネス・インテリジェンス・システムというのは、すでにいくつかあるのですが、Miner3Dという製品は、最も開発の歴史が長い草分け的な製品です。
しかし、残念ながらMiner3Dは、Microsoft Windows用のみで開発されており、UNIX系のOSでは動作しません。Mac用というのもないのですが、エミュレータによって動作させることは可能です。
下記の製品を使って、Mac OS X 10.5で問題なく動作することが検証されております:
VMware Fusion
Boot Camp
Parallels Desktop

投稿者:

A Song for Bayes

ベイジアンネットワークの総本山であるデンマークのAalborg大学で「A Song for Bayes」という活動をやっています。
デンマークのテレビで放映されたコンサートの状況と関係者へのインタビューを観ることができます。
インタビューはデンマーク語でしゃっべているので、残念ながらさっぱり意味がわかりません。しかし、Googleさんの翻訳のお陰で、サイトのデンマーク語のだいたいの意味がわかります。
どうやら「ベイズに関係する数式を使って音楽を作ってみた」という感じらしいです。
楽曲の視聴は、こちらです。
Hugin Expert社が、関係するWebサイトを運営しています。いくつかベイジアンネットワークの事例アプレットがあります。
このサイトによると、音楽というのは瞬間瞬間の音のつながりであり、ベイジアンモデルはマルコフチェーンで統合できて、時間的な変化を記述できる、というようなことを述べています。(まじめな話をするなら、これを電力需要の予測や売上予測などに応用することが有望です。)このサイトも、ところどころデンマーク語で書かれており、今のところ、日本語への翻訳は未定です。

投稿者:

手術用メスで鯨を解体!?

金融とか経済とか、社会のさまざまな複雑な現象について、統計手法を適用する際、場合によっては、手術用メスで鯨を解体する(もし大げさなら、「果物ナイフでマグロを解体」でもいいですが)ようなことになりそうなことが、ときどき見られます。
統計学は「科学の文法」と言われますが、やみくもに統計手法を使えば、何でも科学的になるわけではなく、「科学的方法」の中で使用するべきかと考えます。
科学の常とう手段として、まずは不要なものを取り除いて、できるだけ問題を単純化・理想化してから理論を構築するとか、複雑な全体を分解して、より単純になった要素について議論をするとか、あるいは限定された特殊な条件のもとで初期の理論を構築して、そのあとで段階的に一般化していくといったようなことをやります。
大抵のモデル(または理論、仮説)は、適用される範囲を注意深く限定することによって成り立っています。万能なモデルを作成するのは不可能です。
たとえば、金融機関の顧客について分析する場合、そこにはさまざまな人々がいます。「人生いろいろ」です。人それぞれ境遇も異なり、能力も異なり、考え方も異なります。そんな多様な人々の行動をたった1つの線形モデルで表現できると考えるほうがおかしい、ということに<早く!>気づいてください。
このような場合、従来の回帰分析でも「層別化」というテクニックがあります。単純な言い方をすれば、男性と女性では、異なる回帰式をあてはめたほうが精度がよくなるというような話です。
しかしながら、これにも限界があります。連続値(たとえば年収)で層別化しようとする場合、つまり、高所得者と低所得者をどこで分ければよいかがわかりません。その区分の仕方によって、結果がコロコロ変わるのです。
たとえば、都会で単身や核家族で生活するのと、田舎で年老いた両親(家付き・年金付き)と生活するのでは、同じ所得額でも生活の余裕というものが違います。諸条件によって、所得額の意味が違ってきます。
つまり、変量ごとに別々に離散化(カテゴリ化)をするのは危険だということです。弊社のHPでも説明しておりますが、それでは多変量空間でのデータの分布を無視して区割りをしてしまっているので、本来は一緒にするべき集団を分けていたり、別々の集団であるはずのものを同じ集団としてカウントしていることになります。

したがって、経済分野のような複雑な現象を扱う分野では、多変量でクラスタ分析をして、より均質なグループを作り出して、それぞれのグループについて、それぞれ分析を行うというステップをとられるのが、より良いアプローチです。ただし、一般的な統計ソフトで、それをやるのは、これまた困難がつきまといます。それに気づいた一部の人たちは、自己組織化マップを高度な統計解析の基盤(足場)として利用できるViscoveryを採用し始めているわけです。