モデルの検証

モデル構築におけるとても重要な活動は、構造によってエンコードされた条件付き独立および従属の分析によるモデル構造の検証です。

原因から結果ではなく結果から原因への矢印は、最もよくある間違いの1つで、CPTの指定で深刻な問題(たとえば、多数の結果変数から単一の原因変数への矢印の場合)と間違った推論を導きます。

構造的モデル検証の実行のためのCID 分析の実践的使用の事例として、クレジット・カードの不正使用の発見のためのモデル構築の問題を考えます。以下の3つの論理変数があるとします:

A: 同じクレジットカードを使って2,3日中に複数台のPCを購入。

B: クレジットカードが、異なる場所でほとんど同時に使用される。

C: 不正。

モデル A→C←B は、一見自然かもしれません(AとBがCの確率を決定するための"入力" として使用される)。

しかしながら、d-分離のルールから、このモデルは、Cが未知の場合、A(またはB)を観察することがB(またはA)についてのどのような情報も提供しないことを示しているとわかります。これは間違いです。なぜなら、A(またはB)を観察することはCにおける我々の確信度を増大しそれは翻ってB(またはA)も観察できることの我々の確信度を増大します。したがって、このモデルは単に間違った確率を与えます!

一方、モデル A←C→Bは、我々がC関する(明確な)知識を持たない場合、AとBを従属にします(すなわち、A(またはB)を観察することは、我々がB(またはA)も観察するであろうことの確信度を増大させます)。 もし我々がCに関する明確な知識を持つなら(すなわち、Cの値が既知であるなら)、このモデルは、AとBが独立であることを示しています。これはずっと合理的に見えます(もし、我々が不正なケースを考慮しているということを確実に知っているなら、A(またはB)を観察することが、我々がB(またはA)を観察しようとしているかどうかについての我々の確信度を変えないであろう)。


Back

翻訳者:多田くにひろ(マインドウェア総研