年別アーカイブ 2009

投稿者:

HUGIN 7.2 リリース

November 26, 2009
ニューリリース – HUGIN 7.2
==========================
HUGINソフトウェアの新バージョン (v7.2)が11月26日にリリースされました。このリリースの主要な新機能は、以下のとおりです。
– PDA(携帯情報端末)用の新しいアプリケーション・プログラミング・インタフェース(API)。HUGIN Decision Engine は、PDA上でHuginの機能を使用したアプリケーションを実行できるようにするAPIをサポートしました。
– HUGINソフトウェアは、ネットワーク中のノードの集合の最確コンフィギュレーションを見つけるための新しいモンテカルロ・アルゴリズムで拡張されました。
– 期待値最大化(EM)アルゴリズムを用いたオブジェクト指向ネットワークに関するデータからのパラメータ推定が、HUGINグラフィカル・ユーザー・インタフェース(GUI)でサポートされました。パラメータ推定はデータ中の欠損値をサポートしたEMアルゴリズムを用いて実行されます。
HUGINグラフィカル・ユーザー・インタフェース v7.2
————————————————
HUGINグラフィカル・ユーザー・インタフェースが、さまざまな新しい機能で改善されました。
– 限定記憶インフルエンス・ダイアグラム中の決定ノードの不要な親を識別する機能が追加されました。
– 情報価値ダイアログ: 単純な近似によって連続ノード上での情報価値分析がサポートされました。
– エビデンス感度分析ダイアログ: what-ifタブが、連続ノード上のエビデンスをサポートしました。
– 分析ウィザード: 離散ノードと連続ノードの両方を持つネットワークで精度パネルが可能になりました。
– 新しい三角化手法が導入されました。現在はこの三角化手法がツールで使用されるデフォルト手法です。
– 新しいビルドがリリースされたときの自動アップデートが改良されました。
– 選択された決定ノードのポリシーのサイズをステータス・バーが表示するようになりました。
– 選択された効用ノードに関係する効用関数のサイズをステータス・バーが表示するようになりました。
– ネットワークを逆さまに反転させるための機能が追加されました。
– その他のマイナーな改善。
および、HUGINグラフィカル・ユーザー・インタフェースの性能を改善する努力がなされました。
HUGIN Decision Engine v7.2
————————–
HUGIN Decision Engineが、下記の機能で拡張されました。
– LIMID中の決定ノードの”必要な”親を見つけるためのアルゴリズムが実装されました。
– ノードの集合の最確コンフィグレーションを見つけるためのモンテカルロ・アルゴリズムが実装されました。
– 新しい三角化手法が実装されました: この手法は、すべての消去ベース三角化ヒューリスティクスを用 いて各主要成分を三角化し、最善の結果を使用します。
現在、この三角化手法は、非三角化ドメインをコンパイルするときに、コンパイル操作で使用されます。
– 消去ベース三角化ヒューリスティクスは、非最小三角化を産出する場合があるので、”冗長な穴埋めエッジ”を消去する追加パスがこれらのヒューリスティクスに追加されました。

投稿者:

XLSTAT 2009.6

Addinsoftは、XLSTATのversion 2009.6をアナウンスした。PLSPMモジュールが、Excel 2007に完全互換となった。XLSTATは、極めて強力かつ高度な機能を提供する商用ソフトウェアである。 Excel 2007 ユーザーは、新しいリボン(ユーザー・インタフェース)を楽しむことができる。XLSTAT-Proでは、反復測定ANOVA、変数変換などの新しいオプションが追加された。XLSTAT-SPCは、SAPとの互換性を可能にする新しい機能が加わった。

投稿者:

Hugin日本語HP更新中

ベイジアンネットワークのパイオニア・Hugin Expert社のホームページがリニューアルされました。現在日本語のページも更新作業に入っておりますが、その間、従来のページが(画像などをオリジナル・サイトにリンクしているため)見づらい状況が続きます。ご不便をかけますが、なにとぞご容赦ください。

投稿者:

Sport Eybl & Sports Experts での顧客分析

Viscovery Software社は、オーストリアのスポーツ用品小売り大手の Sport Eybl & Sports Experts社の顧客分析を強化するために、同社に対して顧客ターゲティングの最適化のための改良されたスコアリング能力を持つViscovery Predictor をライセンスした。
この決定に至るために、Sport Eybl & Sports Experts社は、市場にある複数のデータマイニング・ベンダーのスコアリング・ソリューションを評価した。 「我々がViscovery Predictorを選んだ理由は、直感的なユーザー・ガイダンスと上級の機能性と能力だ」と同社のダイレクト・マーケティング部門長のMag. Heinrich Hammerschmidtは言う。「これにより、我々は外部の助けを借りずに社内でスコアリング・プロジェクトを素早くリーズナブルなコストで効率的に実行できるようになった。」
Viscovery Predictorは、スコアリング、予測、および高度な分析のためのワークフロー指向のソリューションであり、非線形予測と顧客スコアリングのための独自の特許手法を提供している。モデルの作成および取扱いの簡単さ、上級の精度と高度な分析機能は、Sport Eybl & Sports Experts社が、ターゲット化されたキャンペーンを開発し、供給の意思決定プロセスを推進するために、同社のマーケティングとメディア最適化の蓄積データを適切な観点から活用できるようにする。
Sport Eybl & Sports Experts 社について:
Sport Eybl & Sports Experts 社は、45箇所のショップと大規模店を所有し、4億ユーロの収益を達成しており、オーストリアで最大のスポーツ用品小売り会社である。スポーツ施設とプレミアム・ブランドやディスカウント・ブランドのファッションに特化した有名企業である。同社は、スポーツ用品、スポーツ・シューズ、キャンピング用品、スキー用品を輸入・販売(卸および小売り)している。
Viscovery Software 社について:
Viscovery Software 社(元・Eudaptics)は、ヨーロッパのデータマイニングのトップ企業の1つである。 予測分析のリーディング・ベンダーで、Viscoveryの特許取得済みデータマイニング・ソリューションは、直感的なユーザー・ガイダンス、熟成した実装、およびアプリケーション指向を提供する。Viscovery は、数100の大学や研究機関をはじめ、テレコム、銀行、保険、小売、通販、および製造業において、世界中で多くの顧客を有する。
スコアリング・ソリューションの導入を検討する際は、複数ベンダーのソリューションを慎重に検討するべきであり、Viscovery Predictorも必ずその候補に入れるべきであろう。

投稿者:

Hugin Expert社が12月にブリュッセルでセミナー開催

Hugin Expert社は,2009年12月1日〜3日にブリュッセル(ベルギー)にて,
企業におけるベイジアンネットワーク活用に関するセミナーを開催します.
3日間のコースは,
– ベイジアンネットワークおよびインフルエンス・ダイアグラムの構築から活用の仕方
– HUGIN Decision Engine用のさまざまなプログラミング・インタフェースを用いたプログラミング
– モデルと結果を分析するための手法
を取り扱います.
大学院生の参加は,40%の割引が適用されます.
詳細は下記のページにあります: http://www.hugin.com/Products_Services/Services/Training/

投稿者:

XLSTATソリューション(特定分野向け製品)

XLSTATは新しく4種類のソリューションを発表しています。
「ソリューション」の定義が開発元によってまちまちで困るのですが、これの場合は、特定分野向けにXLSTATの追加モジュールをチョイスしたセットを組んで特別価格にて販売するというものです。
XLSTAT-Sensory: 食品、化粧品、自動車などの分野での官能データ分析用
XLSTAT-Medical: 医療・健康分野の専門家向け
XLSTAT-6S:    シックス・シグマ・プロセスに携わる関係者向け
XLSTAT-Predict: 正確な予測を求めるユーザー向け
これと年間レンタルを組み合わせることで、安価に多機能・高性能な統計解析ツールを揃えることができます。

投稿者:

XLSTATは年間レンタルがおトク

統計解析ソフトXLSTATの価格が改定されて、通常ライセンスの価格は、正直、従来よりも高くなってしまいました。従来の価格は他社ソフトと比較しても相当にお得感があったので「残念だなあ〜」とユーザー様も多いことと思います。
しかしここで朗報があります。今回の価格改定では、通常ライセンスに加えて、年間のレンタル・ライセンスが新設されました。
年間のレンタル・ライセンスは、従来、学生向けだけにあったのですが、新価格体系で、一般(企業・個人)向けと教員向けにも価格が設定されました。これを利用すると、実質的には従来の価格よりも安く利用できます。
通常ライセンスは購入してから1年間、最新バージョンへのアップデート・サービスが受けられ、その後、そのまま使い続けるか、アップグレード・ライセンス(メンテナンス)を購入するかを選択できます。ヘビー・ユーザーなら購入してから1年ごとにアップグレード・ライセンスを購入し続けることになります。
ところが、このアップグレード・ライセンスと今回新設された年間レンタル・ライセンスというのは、それほど差がありません。アップグレード・ライセンスのほうが少し安く設定されているだけです。
国内価格は為替相場によって変更される場合がありますが、XLSTAT-Proの一般向けの価格(税別)は、次のようになります。
通常ライセンス: 82,000円
アップグレード・ライセンス: 29,000円
年間レンタル・ライセンス: 32,000円
結論としては、レンタル・ライセンスがお得です。XLSTAT-Pro以外の追加モジュールについても、価格差は同じような状況です。今後はレンタル・ライセンスを1年ごとに購入するのが通常になりそうです。
はじめてXLSTATを購入される方にとってもさらに導入しやすくなりました。
価格の詳細:
http://www.mindware-jp.com/xlstat/jp/order/price.html

投稿者:

それってホントにデータマイニング?(重回帰分析)

総合的なデータマイニング・システムには、予測モデルのための標準的なツールとして重回帰分析が搭載されています。
この場合の予測モデルとは、未来の出来事を予言するとかではなくて、新しいケースを過去のパターンと照合することにより、何らかの判断を行おうとするものです。たとえば、過去の購買データから特定の商品の潜在顧客を抽出するためのスコアリングなどにこれを用います。離反顧客や貸し倒れリスクの予測、カードの不正使用の発見、あるいは医療診断などの応用にも利用されます。
ズバリ言うと、重回帰分析というのは、予測モデルの手法としては、全く新しい手法ではありません。旧式の統計多変量解析の手法です。これを「データマイニング」と称していること自体が、現在の商用データマイニングの限界を象徴しています。
重回帰分析とは、英語でMultiple Regression Analysisといいます。これの意味は、説明変数(モデルに使用する変数)が複数の場合の回帰分析です。説明変数が1つのときを単回帰と呼びます。ちなみに予測しようとしている変数(例えば、ある商品を購入する確率)を目的変数と呼びます。
国内では「回帰分析」というと単回帰を指すことが多いのかもしれません。重回帰分析のことを「回帰分析」と言うと「重回帰分析ですよね」と言いなおされることが多いです。しかし、海外ではどちらも線形回帰(linear regression)と呼ばれることが多いかもしれません。数理的には全く同じものと認識されています。重回帰のほうが単回帰よりも高度だとか、そんなことはぜんぜんありません。言いかえると、これ以外にいろいろな手法があるということです。
重回帰/単回帰のいずれにしても、1つの1次方程式でモデルを作成します。つまり、データがまっすぐな(超)回帰平面(または回帰直線)の上にきれいに乗るように分布しているデータであれば正確な予測ができます。しかし、現実にはそんなことはほとんどありません。
回帰平面にきれいに乗らないというのは2種類あって、1つはバラツキが大きい場合であり、もう1つはデータの分布そのものが曲がっていて1次方程式で表すことが適切でない場合です。前者は使用している説明変数の説明力が十分でなく、このような場合は手法を変えたところであまり良い結果が得られるとは期待できません。後者の場合は、手法を変えるともっと良い結果が得られます。
線形回帰に対して非線形回帰という手法もあるにはあります。これは分析したい現象の性質がある程度わかっている場合、2次方程式など特定の形式を当てはめてモデルを作成するものです。しかし、これはかなり取扱いがやっかいです。当てはめる式が適切でないと、適切なモデルができません。また、たくさんの説明変数を取り扱うことも現実的に無理です。
また別のアプローチとしては、カーネル回帰という手法があります。ケースごとに個別のモデルを作成するのですが、これは予測性能は上がるもののブラックボックス(つまりモデルの解釈ができない)であり、またたくさんのケースについての予測を行うには計算量が莫大になってしまうという欠点があります。(つまり、リアルタイム処理が求められる業務での予測・判断には向きません。)
(ちなみにXLSTATには、通常の線形回帰のほかに非線形回帰・カーネル回帰・ロジスティック回帰・PLS回帰など多彩な手法があります。少ない予算で高度な予測モデルを手に入れたい場合は、XLSTAT-Predictがお薦めです。)
さらに、高価な技術としては、サポートベクターマシン(SVM)という技術があります。これを用いると予測性能の上げながら高速な計算ができます。しかし、残念ながらこれもブラックボックスです。「結果が得られればそれでよい」という場面で利用が広がりつつありますが、半面、機械まかせの危うさは否めません。
SOMローカル回帰は、予測性能を上げ、かつ解釈が可能なモデルを経済的な時間内に実現します。現在最も高度であり汎用性の高い手法です。簡単に言えば、SOM(自己組織化マップ)により平面ではなく(データの分布に沿った)曲面上に多数のノードを配し、ノードごとに線形重回帰モデルを構築します。通常の重回帰分析では、データ空間のどの場所でも回帰係数が一定であるのに対して、SOMローカル回帰ではデータ空間の場所によって回帰係数が変化し、それがマップとして可視化されます。
SOMローカル回帰手法は、Viscovery Predictorという製品で利用できます。
Viscovery Profilerによるセグメンテーションの結果とViscovery Predictorによる予測の結果を併せて分析する、ということさえ可能です。さらには、Viscovery Predictorで作成したモデルをユーザーの業務システムに組み込むことができ(Viscovery One2One Engine使用)、高性能な予測・判断をリアルタイムで実行することもできます。
SOMローカル回帰の性能を他手法と比較して確かめたい企業様は、ぜひマインドウエア総研にご相談ください。

投稿者:

Viscovery SOMine 5.1 近日リリース

近日中にViscovery SOMine 5.1をリリースする予定です。
主な新機能は、下記のとおりです。
新機能
——
– 適用ワークフローでは、セグメント名やアクション・コードに加えて、ノード値やプロファイル値のような情報が抽出され、アウトプットに書き出される。
– 評価ワークフローでは、マップのノードごとにクラス分類性能が計算され、それを可視化する新しいマップ・ピクチャが生成される。
– クラスタ名またはセグメント名が、マップ中に常時表示される。
– 属性がデータマートに書かれる順序が、ユーザーによって指定できる。
– ワークフローが移動される先にフィードバックが提供され、ワークフローの再配置が簡
単になった。
– マップ中に1つ以上の名義属性がある場合、”セグメント名の作成”も働く。
– 区間を指定した選別が、ノード値だけでなくデータレコード中の値でも行えるオプションがついた。
– データがたくさんの(数1000の)属性を持つ場合でも、統計量ウィンドウがより高速に反応するようになった。
– ノードの選別をキャンセルできるようになった:マウスボタンが押し下げられているうちは、選別はただのプレビューであり、ESCキーを押してキャンセルが可能。カラースケール上でのドラッグも同様なプレビューを表示する。
– カラースケール上でドラッグすると、ドラッグ操作の間に既存のすべての選別が見えるように、即座に選別モードに切り替わる。
– リストが特定の列に格納される場合、それが列ヘッダに示される。さらに、(適切な)4つのソーティング・モードがある: 昇順、降順、絶対値による昇順、絶対値による降順。
– グループ・プロファイル・ウィンドウでは、以前はチャートでのみ見えていたプロファイル値が、数値の表でも利用できるようになった。
– リスト中のハイライトされた属性の集合を他のリストにコピーできる。
– アプリケーションがWindowsのUnicodeサポートを完全使用するようになった。これは異なる地域設定のコンピュータ間でのプロジェクトやモデルの交換を可能にする。
– 数1000の属性を持つSOMファイルの読み込みと書き出しの性能が大幅に改善された。
– “整列” が現在のセグメンテーションを記憶するようになった。これは、整列が切り替えられたとき、異なるセグメンテーションが有効化されることも意味する。
– 名義値の定義ステップでは、名義値”その他”を生成するための明確なオプションが付け加えられた。
– セグメンテーションは、そのオリジナル、つまり、それが作成されたクラスタリングまたはセグメンテーションの追跡を保持する。
– モデル作成ワークフローの属性の重みづけステップで、”重みづけグループ”を定義することにより、属性間の潜在的な正規化をある程度まで無効化できる。

投稿者:

それってホントにデータマイニング?(クラスタ分析(3))

分類するだけでは意味がなくプロファイル分析が重要
Viscoveryにおけるクラスタリングは、SOMの上でデータ空間の位相的順序を考慮するように改善されたWard法(SOM-Ward法)を実行します。それは、主成分分析を非線形化した主たる曲面の上で、K-meansに似た情報圧縮を行い、非階層的なマイクロクラスタを多数作成し、それらのマイクロクラスタを階層的クラスタリングしていると説明することができます。
従来のクラスリング手法がそれぞれ単一のアルゴリズムを適用するだけなのに対して、Viscoveryは複数のいくつもの要素技術をシステム化したより高度な手法です。(市販の多くのデータマイニング・システムでは、KohonenのSOMアルゴリズムを単体で利用するようになっていますが、それでははっきり言ってオモチャであり何の役にも立ちません!)
SOM-Ward法は、Ward法でクラスタを併合する際に、2つのクラスタがマップ上で(位相的に)隣接するクラスタであれば併合し、隣接しない場合は併合しないというルールを付け加えたものです。これがなぜ良好な結果を産むかについては、下記のページも参照してください。
http://www.mindware-jp.com/basic/somward.html
クラスタ分析は、探索的分析であり、つまり、その意味するところは、「クラスタリングの計算にどの変数を含ませるか」で結果が幾通りも作り出せるのであって、「有用な新しい分類を発見すること」がクラスタ分析の目的です。
したがって、クラスタ分析の結果は、各クラスタが全体集合と較べてどのような特徴を持っているか?を統計的に分析する必要があります。既存のあらゆるソフトウェアでは、クラスタ分析はクラスタリングの計算を実行するのみであって統計的分析はまた別です。そして、実際にこれをやろうとするとたいへんな作業になってしまいます。
ある変数選択のもとでクラスタリングを行って、各クラスタごとのメンバーを集めて統計量を計算して、特定の変数にクラスタ間での有意な差があるかどうかを検定して、クラスタリングをやり直してまた同じことをやる、ということが果たして現実的に実行可能でしょうか?ほとんどすべての応用の現場では、詳細な分析は挫折しており、最初に出てきた結果を無条件に採択してしまっているのではないでしょうか?つまり、探索的分析といいながら、実際には探索がなされていません。
Viscoveryでは、視覚的なマップ上でクラスタリングの結果が現れ、クラスタ数の有意度がグラフ表示され、階層的なクラスタリングの各段階を表示させることができ、またクラスタを微調整して新しいセグメントを自由自在に作成することもでき、それらのクラスタやセグメント、あるいはマップ上の任意の領域の統計的特徴をプロファイル・グラフ(棒グラフ)で瞬時に表示することができます。通常なら気の遠くなるような作業を1クリックで済ませることができます。
http://www.mindware-jp.com/Viscovery/welcome.html