年別アーカイブ 2015

投稿者:

XLSTAT 2015.6リリース

XLSTATの今年最後のリリースです。
– 教師あり機械学習アルゴリズムとして単純ベイズ(ナイーブベイズ)が追加されました。単純ベイズは、予測変数間の独立を仮定しています。これは、さまざまなシチュエーションで高速であり、とても正確であることが知られています。
– PLSパス・モデリング・ツールにマーケティングおよび満足度分析に特別に対応するインタフェースが追加されました。新しく追加されたオプションにより、ブランド・イメージや顧客満足度の品質や値の変更のインパクトを評価することが可能になります。PLSパス・モデリングは、XLSTAT-Marketing および XLSTAT-Psy ソリューションに含まれます。

投稿者:

単純ベイズ(ナイーブベイズ)分類器のチュートリアル

XLSTATのチュートリアルに、単純ベイズ(ナイーブベイズ)クラス分類を追加しました。
機械学習関連を強化中です。

投稿者:

公的研究機関および国公立大学等のお客様へ

この時季となりますと年度末の予算消化でご注文が殺到致します。ご購入を検討されているお客様には、お早目のご購入手続きをお薦めする次第です。
弊社はViscovery製品を取扱い始めて15年、HuginおよびXLSTAT製品を取扱い始めて12年が経過しており、大抵の公的機関ではスムーズに直接のお取引を頂いております。しかしながら、一部の機関ではいまだに実験器具や薬品、事務用品等の出入り業者様を通して、ソフトウェア・ライセンスを購入されようとする場合があります。直接販売のソフトウェア・ライセンスをこのような非正規のルート(しかも、およそソフトウェアとは無関係な業者)から調達されることは違法ですのでくれぐれもご注意ください。
もちろん、ほとんどのエンド・ユーザー様は、データマイニングや統計解析が何たるかもわかっていらっしゃるし、そのようなソフトウェアが上記のような出入り業者からは買えないことぐらいは、重々ご承知のこととは存じます。しかしながら、調達部門にいらっしゃる事務方の方々には、なかなかご理解頂けないようです。
ソフトウェア・ライセンスというものは、誰でもが勝手に販売することはできません。ソフトウェアの商社などは素人ではないので、自社が販売権を持たない直販ソフトウェアを無理して取り扱おうとはしません。ところが、ソフトウェアとはまったく無関係な業者様は、ソフトウェア・ライセンスの法務にはまったく無頓着なので、出入りの官庁様から指示されると「はい、はい」と言って、自分でエンド・ユーザーとしてソフトウェア・ライセンスを購入して、それを官庁に横流ししたりしてしまいます。そうなってしまうと、そのライセンスを違法なルートから購入した官庁が、ソフトウェアを不正使用することになってしまいます。
あるいは、良心的な業者様の場合は、無断で再販するなどという思い切ったことをする前に、弊社にお問い合わせ頂けます。弊社では、たいへん申し訳ないのですが、すべての間接販売をお断りしております。その理由は、すでに直接お取引頂いている官庁様の一部からは「直接販売証明書」なるものを提出するように命じられて、それに従っているからです。そのような書類を提出しておきながら、一方では状況に応じて間接販売を行うというのでは、どうにも筋が通らないのです。すでに提出している書類が虚偽となってしまいます。
出入り業者様に上記の事情を説明してお断りしても、半数以上のお客様は正規のルートで直接ご購入頂けているのですが、残念なことに一部のお客様はご購入を断念されています。この場合、エンド・ユーザー様が、「不要」と判断されて購入を取りやめられるのであれば、何ら問題はございません。ただし、調達部門の事務方が「出入り業者から買えないのであれば購入不可」とされている場合は、法的な問題が大有りです。
もし弊社製品を購入されたいのに事務方からストップがかかって購入できなくて困っているというエンド・ユーザー様がいらっしゃれば、ぜひとも弊社に直接ご相談ください。弊社から各機関に公正なお取引を頂けるように働きかけます。弊社は、どのような組織に対しても自社の製品を販売する正当な権利を有しますので、これによってエンド・ユーザー様にご迷惑がかかるような筋合いではございません。ご連絡をお待ちしております。

投稿者:

”Viscovery SOMine”の読み方

”Viscovery SOMine”の読み方をWebで検索されている方がいらっしゃるようです。検索しても出てこないと思いますので、ここに書きます。
もしカタカナで書くとしたら「ヴィスカバリー・ソマイン」となります。
ただし、SOMを「ソム」と読んでいるのは日本人ぐらいで、国際学会などではみんな「エス・オー・エム」と言っています。それを知っている人は、「ヴィスカバリー・エスオーマイン」と言う人もいます。
もともとが、合成による造語なので、何が正解というのはありません。
ちなみにViscoveryは、Visual+Dicoveryの合成であり、SOMineはSOM+Mineの合成です。
つまり、「SOMを組み込んだデータマイニングによる視覚的な発見」ということです。データマイニングが90年代に研究されていたときには、科学哲学と密接な関係がありました。すなわち、「科学における発見の方法」についての議論がありました。Viscoveryという社名(製品ファミリー名)に「発見」が合成されているのには、じつは哲学的な次元からのメッセージが含まれています。
ただし、Viscoveryはもともと製品ファミリー名として使い始められ、もとの社名はEudapticsでした。英語読みでは「ユーダプティクス」ですが、ドイツ語読みでは「オイダプティクス」となります。これは、Euro+Adapt(ics)と思われます。まあ、ネーミングの方法が全部ワンパターンであります。
率直に言って、あまりネーミングが上手な会社ではないのですが、SOMineだけは奇跡的に良いネーミングで、認知度もとても高いです。Viscovery社が今日まで存続できたのは、ひとえにSOMineのネーミングのおかげだったとさえ思えます。
SOMineは、90年代に開発した同社の最初の製品で、その後、より改良された技術を企業向けデータマイニングとして、より高額な価格で発売するときに、Viscovery ProfilerとかViscovery Predictorの製品名で発売した経緯があります。技術の会社なので、中身の技術の開発には全精力を傾けるのですが、そうして開発された製品のネーミングは、まっるきりベタで、そういうところには全くお金をかけてきませんでした。
時代が流れてデータマイニング市場も一巡したところで、企業向けの高額製品と主に学術用の廉価版として販売してきたSOMineを再統合して、現行バージョンのSOMine 7となりました。アカデミック価格は完全に廃止されましたが、過去の企業向け製品の価格帯からすると、もはやすべてのユーザー様に廉価版の価格帯でご利用頂けるようになったというわけです。

投稿者:

XLSTATに関する重大なお知らせ

XLSTATの開発会社AddinsoftのCEO、Thierry Fahmyからのご挨拶をお知らせ致します。
————————————————————————
XLSTATユーザーの皆様へ、
まず、Addinsoftチームと私が皆さまからのご用命を頂けることをいかに栄誉と感じているかをお伝えしたく存じます。以下、ちょうど我々がリリースしたばかりの情報をお伝えします:
– 新しいウェブサイト (www.xlstat.com)
– 新しいヘルプ・センター (help.xlstat.com)
– いくつかのまったく新しい機能を持つXLSTATの新バージョン
– 新製品のご提供
新しいXLSTATソフトウエア・スィートは、すでに皆様が親しまれているのとほとんど同じに見えますが、それらが分野ごとのユーザー指向のソリューションとして利用できるように、我々のモジュールを再パーッケージ化致しました。最も大きな変更は、XLSTAT-ProがXLSTAT-Baseに置き換わったことで、これは旧Pro+PLS+Pivotの全機能と、ADA の一部機能(主座標分析、PCorA)とMXの一部機能(SDチャート)に相当します。従来のすべてのモジュールは廃止されて、新しいソリューションのパーツとして統合されました。
新しいソリューションは、Base、Premium、Biomed、Ecology、Forecast、Marketing、Psy、Quality、Sensoryです。Premiumソリューションは、すでに述べたソリューションに含まれるすべての機能を含みます。サードパーティ・モジュールの3DPlot、CCR、LGは、どのソリューションにも追加できるオプションとして残こされました。詳細は、http://www.xlstat.com/en/solutions/でご覧ください。
この変更は、ほとんどのユーザー様にとって、従来と同じ金額でより多くの機能が得られることを意味します。弊社は、2009年から実質的な値上げをせずに、約50個の新機能を追加し、製品の安定性を強化してきたこと、そして、より多くのツールを開発し、より良いサービスを提供するために弊社のチームの人員が5倍の規模に拡大したことにご留意ください。一部のお客様では、この新製品の提供は、ライセンスのコストが少し高くなることを意味するかもしれません。しかし、我々がなしたすべての改良が提供され、競合製品と比べて、まだなお魅力的な価格であり、XLSTATが選ばれ続けることを期待しております。
話はこれだけではありません。我々は、GPUベースのコンピュテーションへのアクセスを提供する初めての統計ソフトウェア・プロバイダーであることに誇りを持ってアナウンス致します。これは、もしあなたが、NVIDIAグラフィック・カード(たとえばGe Force)をお持ちであれば、標準のどのプロセッサよりも少なくとも10倍速い計算を実行できることを意味します。今のところ、これはノンパラメトリック検定のモンテカルロ・シミュレーションでのみ利用可能です。しかし、我々はこの能力を他の機能にも段階的に拡張して参ります。
XLSTATは、単なるユーザー・フレンドリーな統計マクロではありません。これは、高度に最適化された c++ コードと先端技術に負うところが大きいです。我々は、単にとても直感的な統計ソリューションであることを目指すのだけでなく、市場で最も効率的な計算のできる分析ソフトウェアであることも目指します。
まもなく、新しい提携の詳細や、お客様と弊社の履歴(ご注文やサポート)を簡単に追跡できる新しいCRMシステムについてもお知らせする予定です。
どうぞよろしくお願い致します。
Thierry Fahmy, CEO

投稿者:

垂直統合と水平分散

情報化社会論と人工知能社会論について、もう少し書きます。
80年代の日本のニューメディア開発のほとんどすべてが、最終的に本格的な普及に至らなかったという点では、はっきりと失敗を認めなければなりません。当時、「デルファイ法によって技術予測はかなりの精度でできる」と豪語されていたものですが、実際には当時の中央官庁や大企業が行っていた技術予測はデタラメだったのです。
たぶん、「半導体の集積度が何年後にはどうなる?」というような量的な予測はそこそこできていたのだと思いますが、技術の質的な面の予測は、天才ではない普通の専門家が何10人何100人寄ってたかってもできないのだろうと思います。
80年代の日本で考えられていたニューメディアと今日普及しているインターネットとの決定的な違いは、前者が垂直統合型のネットワークを想定していたのに対して、後者は水平分散型であるという点です。
垂直統合ネットと水平分散ネットの技術的な観点での説明はいろいろあるでしょうが、それはそれとして、「権力」という観点から見れば、物事の本質がより鮮明に見えてくるように思います。
つまり、旧郵政省は、ニューメディアも従来の放送局と似たようなスキームで捉えていたのだと思います。実際に免許制にするかどうかは別として、情報の発信者と一般の受信者をはっきりと分けていたのです。発信者は、絶対的に優位な立場で、つまり、「上」にいて、受信者は、上から降りてくる情報を有難く受け取るべきだという前提が、暗黙のうちに出来上がったいたわけです。
80年代の日本では、キャプテン・システムというニューメディアが開発されていました。当時、まだコンピュータの性能が今ほど高くなかったので、キャプテン・システムで送られてくる画像は、単純な図形と文字の組み合わせのようなものでした。わかりやすく言えば、現在我々が使っているPowerPointの画面のようなものが通信回線を通って送られてくるわけです。そして、画面のどこかを押す(クリックする)と画面が変わるわけです。
そう、初期のWorld Wide Web(WWW)が登場するよりも10年以上早く、表面的には同じようなことがすでに実現されていました。さらに単純な図形の組み合わせではなく、自然画が伝送できる技術の開発にも取り組まれていました。しかし、決定的な違いは、WWWが水平分散型ネットで、誰でもがWebサーバーを立ち上げて情報発信できるのに対して、キャプテン・システムはセンターのコンピュータだけからしか情報発信することができなかったわけです。
キャプテン・システムの推進者たちは、実際に動作するシステムをほぼ完成させて、たとえば私が主催したセミナーでもデモンストレーションをして見せたのですが、「いったいどうやってコンテンツ作成のコストを負担するのかがわからない」というところでつまづいていました。つまり、システムはできたけれど、ビジネス・モデルが構築できなかったわけです。
我々は、今、WWWの経験を通して、そんな心配はする必要がなかったということがわかるのですが、当時は、そんなつまらないことで真剣につまづいていたのです。何がそうさせたのかは、今となっては明白です。情報の発信者と受信者を上下の関係で捉えていて、一般民衆が情報発信をするというようなことには、まったく思い至らなかったからです。
インターネットは、もともとは冷戦時代に米国の国防のために開発された技術なのですが、この水平分散型のネットワーク技術は、幸いなことに民主的な社会を構築することに大きく役立ちました。
しかし、垂直統合と水平分散は、綱引きの関係です。コンピュータ技術の潮流は、この間を行ったり来たりを繰り返しているように見られます。今日、我々が向かおうとしている「クラウド・コンピューティング」は、まさに水平分散から垂直統合への揺り戻しです。
クラウド・コンピューティングの本質は、インターネット産業における勝者が、インターネットでの権力の座を獲得したという勝利宣言でもあります。IBMのWatsonのような人工知能は、データセンターに置かれて運用されることが暗黙の前提となっております。これからしばらくは、このような時代に突入していくものと思われます。
しかし、たぶん、10年か15年すると、また水平分散への揺り戻しが起きるはずです。そのときに、我々がより良い民主的な人工知能技術に出会えることを切に願います。

投稿者:

人工知能社会論を考える

現在、産業界では空前の人工知能ブームで、一部で「人工知能社会論」まで飛び出してきたとのことですが、それで思い出されるのが、80年代の「情報化社会論」です。当時、私は、セミナー会社で一連の情報通信技術の標準化に関するセミナーを企画・開催して、大いに儲けさせて頂きました。ごっつぁんです。
官製の高度情報化社会論では、今頃、電電公社のINSが全国津々浦々に普及しているはずでした。増田米治先生は元官僚でしたが、退官されて民間で情報化社会論を展開されました。とくに「機会開発者」という概念をつくられて、情報化社会において人びとが知的にして創造的な活動に精を出す理想郷を描かれました。
2015年の現在、我々はあの頃の未来をさらに通り越した未来に住んでいます。
そして、私は、情報化社会論がいかにきれいごとだったかを痛切に感じるわけです。まずインターネットが普及すること、新興のIT企業が台頭して怪しげな商品を売ったり、さまざまなトラブルを引き起こすこと、毎日大量の迷惑メールが送られてくること、企業や官庁から個人情報が漏えいして混乱を来すこと、子供たちが悪い大人の餌食になること、ネット上で新たなイジメの形態が発生すること等々、30年前には予想だにしなかったことばかりです。
もし歴史に学ぶとすれば、「現実は想像をはるかに超えて展開されるだろう」と考えるべきでしょう。
人工知能社会論をチラ見したところ、「人間を超える知性を持つ者と持たざる者の格差」とかなんとか言っているらしいですが、所詮それは一部の権力者やエリートにとって都合の良い想像ではないかと思ってしまいます。
昔は一部のエリートだけが重要な情報を握っていて、一般の人々との間に情報格差が存在しました。だから(私がセミナー事業で儲けたように)情報がお金になったのです。しかし、現在は情報そのものではお金を稼げません。むしろ、STAP細胞やオリンピック・エンブレムの騒動のように、名もなき民衆がネットを使って、権力にあぐらをかいているエリートたちの嘘を暴く時代になってしまいました。
仮に人間の能力を遥かに超える人工知能の開発に成功したとして、それを一部の権力者のために秘匿しておいて、はたしてその能力をいかんなく発揮できるものでしょうか?たぶん、大してうまい使い方はできないことでしょう。
一般の人々が人工知能にアクセスできる社会が到来したとき、たぶん、知性の格差というものがなくなってしまうのではないでしょうか?つまり、誰もが人工知能を使って、複雑な物事の先の先まで熟考した結果を理解することができるようになるでしょう。自分で考える力には個人差がありますが、他人のアイデアを利用するだけなら誰にでもできるのです。結果さえわかれば、少々の頭の良し悪しなんて問題ではないのです。
このような社会では高卒だの大卒だのという差別はナンセンスになってしまいます。実際、私の実感として、海外の超一流の大学を出たような人は、本当に素晴らしいですが、日本の普通の大学を出た人と高卒の人の間にそれほどの差があるとも思えないのです。日本国内の学歴差別というのは、いわれのない差別の一種です。
人工知能社会では、技術的なことをあまり伴わない、ほとんどのデスクワークはコンピュータにとって代わられるでしょう。公務員の大部分は不要になります。人びとは学校教育から解放されるでしょう。(そうゲゲゲの鬼太郎の歌のように。)長い人生の間の好きな時期に好きなことを学べばよいだけです。
このような社会では学歴によって人の身分の上下を決めることが、もはや意味をなさなくなるので、世の中全体が実力主義の空気を漂わせることになるでしょう。しかし、それはそれで世知辛い世の中です。結局、ますます俗物ばかりが幅を利かせる世の中になっていくとも考えられます。

投稿者:

XLSTAT価格改定

XLSTATが9月に価格改定されます。従来XLSTAT-Proを基本モジュールとして、追加モジュールを選択して自由な構成でライセンスを購入できる方式を採ってきましたが、追加モジュールの数が増えたことで、却って新規のユーザー様には「どのモジュールを購入すればよいのかよくわからない」ということが生じるようになってきました。
新価格体系では、XLSTAT-Base(従来のPro,PLS,Pivot)を最小構成として、その他に、利用される専門分野ごとの構成を予め設定して提供します。専門分野ごとの構成は次のとおりです:
XLSTAT-Ecology (Base+ADA+Dose+Life(surv)+Omics)
XLSTAT-Forecast (Base+Time+Sim)
XLSTAT-Premium (オプション以外の全モジュール)
XLSTAT-Marketing (Base+CJT+MX+PLSPM+Sim)
XLSTAT-Medical (Base+Dose+Life(surv)+Life(mc)+Omics+PWR
XLSTAT-Quality (Base+SPC+DOE+PWR+Sim)
XLSTAT-Sensory (Base+MX)
XLSTAT-Psy (Base+ADA+PLSPM)
つまり、これらはすべて最小構成のBaseが含まれますので、ご注文の際は、これらのいずれかを選択するだけで、簡単にご注文頂けるようになります。さらに下記のモジュールはオプションとして追加することができます:
XLSTAT-3DPlot
XLSTAT-LG
XLSTAT-CCR
教育用や学生用の年間ライセンスの価格は、ほぼ従来の価格帯でご購入頂けますが、全体的には価格が少し上がります。たとえば、従来はPro+LifeとかPro+Timeというように、追加モジュールを1つだけ選ばれるユーザー様も少なくなかったのですが、今後は、そのような購入の仕方がなくなってしまいます。
従来の方式では、たとえば年間ライセンスで、最初にPro+Lifeを購入して、半年後にDoseを追加されるというような購入の仕方をされるユーザー様もおられたのですが、その場合、すべてのモジュールの期限が有効でなければなりませんので、先に購入されたモジュールの期限がきれた時点で、後から追加購入されたモジュールも含めて、すべてのモジュールが使用できなくなるという問題がありました。
新価格体制では、構成の柔軟性が従来よりもやや後退しますが、注文の仕方がわかりやすくなることと、追加モジュール方式による有効期限の矛盾が解消されます。
8月中はまだ従来の方式でのご注文を受け付けておりますので、XLSTATを安価に購入されたいお客様はお急ぎください。

投稿者:

SOMデータマイニングの真実

SOM研究とViscoveryの記事が長文過ぎて伝わりにくいかと思い、もう少し簡潔な表現をしてみます。
SOMは多次元(多変量)データの理想的なモデリング基盤として使用できます。
それは、多次元データの可視化、探索的分析、クラスタリング、クラス分類、非線形モデルのための基盤提供など、幅広い活用を可能にします。
その意味で、多変量解析の文脈で捉えることもできます。しかし、SOMを主成分分析やクラスタ分析などと並ぶような多変量解析手法の1つと捉えるべきだということではなく、むしろ、既存の手法とSOMを組み合わせることで、それらの手法を強力化するターボチャージャーのようなものです。
つまり、SOMは既存の手法と競合したり、置き換わったりするものではありません。それどころか、SOM単体では精緻な分析にはなり得ません。(この段階で間違った方向に行ってしまっている研究があまりに多いです。)しかし、SOMは複雑なデータを大局的に整理しなおすことで、難しかった分析を簡単にしてくれたり、新しい創造の糸口を提示してくれます。それが真実です。
総合的なデータマイニング・システムでも、KohonenのSOMアルゴリズムは搭載されていますが、単体のアルゴリズムのレベルで実装されているので、ほとんどのユーザーには実践的な活用は閉ざされたままです。
またもう1つ世間では重大な誤解があります。データマイニングでは、バッチ学習アルゴリズムを使用するべきですが、残念なことに、SOMの学術研究の情報がノイズとなって、長年にわたってユーザーを惑わせ続けてきました。
SOMの学術研究では、いかにSOMのノードがランダムな状態から、(SOMの)格子がもつれたりせずに自己組織化的に秩序を獲得するか、ということに重点を置いた研究がなされてきました。
しかし、それはデータマイニングとはまったく関係のないことです。そんなことでデータマイニングの(統計的な)性能が向上したりはしません。実用上は、ランダムな状態から学習するSOMなんて必要がないからです。
不幸なことに国内のSOMの研究者の中には、伝統的な統計解析の知識も乏しく、またデータマイニングでのSOMに関するさまざまなテクニックを理解しないまま、海外で15年も20年も前に研究されたSOMアルゴリズムの変形をまだ研究している人がいて、その成果を大げさに発表している場合があります。この手の研究室で開発されたソフトウェアの出来は、見るも無残なほどチープな出来です。そんな学術情報に惑わされると、10年単位で大きな時間のロスになります。
SOMのバッチ学習アルゴリズムと伝統的な統計解析の両方について熟知して、それらを組み合わせた新しい分析手法を本格的に実装できているのは、これまでの20年間、世界中でViscoveryのみです。