资源描述:
《人工智能原理教案03章 不确定性推理方法3.5 贝叶斯网络》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、3.5贝叶斯网络 贝叶斯网络是一系列变量的联合概率分布的图形表示。一般包含两个部分,一个就是贝叶斯网络结构图,这是一个有向无环图(DAG),其中图中的每个节点代表相应的变量,节点之间的连接关系代表了贝叶斯网络的条件独立语义。另一部分,就是节点和节点之间的条件概率表(CPT),也就是一系列的概率值。如果一个贝叶斯网络提供了足够的条件概率值,足以计算任何给定的联合概率,我们就称,它是可计算的,即可推理的。3.5.1贝叶斯网络基础 首先从一个具体的实例(医疗诊断的例子)来说明贝叶斯网络的构造。 假设: 命题S(moker):该患者是
2、一个吸烟者 命题C(oalMiner):该患者是一个煤矿矿井工人 命题L(ungCancer):他患了肺癌 命题E(mphysema):他患了肺气肿 命题S对命题L和命题E有因果影响,而C对E也有因果影响。 命题之间的关系可以描绘成如右图所示的因果关系网。 因此,贝叶斯网有时也叫因果网,因为可以将连接结点的弧认为是表达了直接的因果关系。图3-5贝叶斯网络的实例tp3_5_swf.htm图中表达了贝叶斯网的两个要素:其一为贝叶斯网的结构,也就是各节点的继承关系,其二就是条件概率表CPT。若一个贝叶斯网可计算,则这两个条件缺一
3、不可。 贝叶斯网由一个有向无环图(DAG)及描述顶点之间的概率表组成。其中每个顶点对应一个随机变量。这个图表达了分布的一系列有条件独立属性:在给定了父亲节点的状态后,每个变量与它在图中的非继承节点在概率上是独立的。该图抓住了概率分布的定性结构,并被开发来做高效推理和决策。 贝叶斯网络能表示任意概率分布的同时,它们为这些能用简单结构表示的分布提供了可计算优势。 假设对于顶点xi,其双亲节点集为Pai,每个变量xi的条件概率P(xi
4、Pai)。则顶点集合X={x1,x2,…,xn}的联合概率分布可如下计算: 双亲结点。该结点得
5、上一代结点。 该等式暗示了早先给定的图结构有条件独立语义。它说明贝叶斯网络所表示的联合分布作为一些单独的局部交互作用模型的结果具有因式分解的表示形式。从贝叶斯网的实例图中,我们不仅看到一个表示因果关系的结点图,还看到了贝叶斯网中的每个变量的条件概率表(CPT)。因此一个完整的随机变量集合的概率的完整说明不仅包含这些变量的贝叶斯网,还包含网中变量的条件概率表。图例中的联合概率密度: P(S,C,L,E)=P(E
6、S,C)*P(L
7、S)*P(C)*P(S) 推导过程:P(S,C,L,E)=P(E
8、S,C,L)*P(L
9、S,C)*P(
10、C
11、S)*P(S)(贝叶斯定理) =P(E
12、S,C)*P(L
13、S)*P(C)*P(S) 即:P(E
14、S,C,L)=P(E
15、S,C),E与L无关 P(L
16、S,C)=P(L
17、S) L与C无关 P(C
18、S)=P(C) C与S无关 以上三条等式的正确性,可以从贝叶斯网的条件独立属性推出:每个变量与它在图中的非继承节点在概率上是独立的。 相比原始的数学公式: P(S,C,L,E)=P(E
19、S,C,L)*P(L
20、S,C)*P(C
21、S)*P(S) 推导过程: 由贝叶斯定理,P(S,C,L,E)=P(E
22、S,
23、C,L)*P(S,C,L) 再由贝叶斯定理P(S,C,L)=P(L
24、S,C)*P(S,C) 同样,P(S,C)=P(C
25、S)*P(S) 以上几个等式相乘即得原式。 显然,简化后的公式更加简单明了,计算复杂度低很多。如果原贝叶斯网中的条件独立语义数量较多,这种减少更加明显。 贝叶斯网络是一系列变量的联合概率分布的图形表示。这种表示法最早被用来对专家的不确定知识编码,今天它们在现代专家系统、诊断引擎和决策支持系统中发挥了关键作用。贝叶斯网络的一个被经常提起的优点是它们具有形式的概率语义并且能作为存在于人类头脑中的知识结构的自然映
26、像。这有助于知识在概率分布方面的编码和解释,使基于概率的推理和最佳决策成为可能。3.5.2贝叶斯网的推理模式 在贝叶斯网中有三种重要的推理模式,因果推理(由上向下推理),诊断推理(自底向上推理)和辩解。3.5.2.1因果推理 让我们通过概述的实例来说明因果推理得过程。给定患者是一个吸烟者(S),计算他患肺气肿(E)的概率P(E
27、S)。S称作推理的证据,E叫询问结点。首先,我们寻找E的另一个父结点(C),并进行概率扩展 P(E
28、S)=P(E,C
29、S)+P(E,~C
30、S); 即,吸烟的人得肺气肿的概率为吸烟得肺气肿又是矿工的人的
31、概率与吸烟得肺气肿不是矿工的人的概率之和,也就是全概率公式。 然后利用Bayes定理: P(E
32、S)=P(E
33、C,S)*P(C
34、S)+P(E
35、~C,S)*P(~C
36、S); 公式解释:P(E,C
37、S)=P(E,C,