欢迎来到天天文库
浏览记录
ID:44962516
大小:251.50 KB
页数:31页
时间:2019-11-06
《第7章贝叶斯网络》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第7章贝叶斯网络8/4/20211数据仓库与数据挖掘第7章贝叶斯网络7.1引例7.2贝叶斯概率基础7.3贝叶斯网络概述7.4贝叶斯网络的预测、诊断和训练算法7.5工具包应用8/4/20212数据仓库与数据挖掘7.1引例参加晚会后,第二天早晨呼吸中有酒精味的可能性有多大?如果头疼,患脑瘤的概率有多大?如果参加了晚会,并且头疼,那么患脑瘤的概率有多大?PartyHangoverBrainTumorHeadacheSmellAlcoholPosXray8/4/20213数据仓库与数据挖掘7.2贝叶斯概率基础7.2.1先验概率、后验概率和条件概率7.2.2条件概率公式7.2.3全概率
2、公式7.2.4贝叶斯公式8/4/20214数据仓库与数据挖掘7.2.1先验概率、后验概率和条件概率先验概率:根据历史的资料或主观判断所确定的各种时间发生的概率。没有经过试验证实,属于检验前的概率。后验概率:通过贝叶斯公式,结合调查等方式获取了新的附加信息,对先验概率修正后得到的更符合实际的概率。条件概率:某事件发生后该事件的发生概率。8/4/20215数据仓库与数据挖掘7.2.2条件概率公式条件概率的计算可以通过两个事件的发生概率,以及相反方向的条件概率得到。8/4/20216数据仓库与数据挖掘7.2.3全概率公式基本事件的互斥性基本事件的完备性8/4/20217数据仓库与数
3、据挖掘7.2.4贝叶斯公式独立互斥且完备的先验事件概率可以由后验事件的概率和相应条件概率决定8/4/20218数据仓库与数据挖掘7.3贝叶斯网络概述7.3.1贝叶斯网络的组成和结构7.3.2贝叶斯网络的优越性7.3.3贝叶斯网络的3个主要议题8/4/20219数据仓库与数据挖掘7.3.1贝叶斯网络的组成和结构贝叶斯网络是描述随机变量(事件)之间依赖关系的一种图形模式,是一种用来进行推理的模型。贝叶斯网络由网络结构和条件概率表两部分组成。网络结构是一个有向无环图,由结点和有向弧段组成。每个结点代表一个事件或者随机变量,变量值可以是离散的或连续的,结点的取值是完备互斥的。有向弧段
4、代表随机变量间的因果关系或概率依赖关系,通过在各变量之间画出它们的因果关系。弧段是有向的,不构成回路。8/4/202110数据仓库与数据挖掘7.3.2贝叶斯网络的优越性对已有的信息要求低,可以进行信息不完全、不确定情况下的推理;具有良好的可理解性和逻辑性;专家知识和试验数据的有效结合相辅相成,忽略次要联系而突出主要矛盾,可以有效避免过学习;推理结果说服力强,贝叶斯网络对先验概率的要求大大降低。8/4/202111数据仓库与数据挖掘7.3.3贝叶斯网络的3个主要议题贝叶斯网络预测:从起因推测一个结果的理论,也称为由顶向下的推理。目的是由原因推导出结果。贝叶斯网络诊断:从结果推测
5、一个起因的推理,也称为由底至上的推理。目的是在已知结果时,找出产生该结果的原因。贝叶斯网络学习:由先验的贝叶斯网络得到后验贝叶斯网络的过程。8/4/202112数据仓库与数据挖掘7.4贝叶斯网络的预测、诊断和训练算法7.4.1概率和条件概率数据7.4.2贝叶斯网络的预测算法7.4.3贝叶斯网络的诊断算法7.4.4贝叶斯网络预测和诊断的综合算法7.4.5贝叶斯网络的建立和训练算法8/4/202113数据仓库与数据挖掘7.4.1概率和条件概率数据左表给出了事件发生的概率:PT发生的概率是0.2,不发生的概率是0.8右表给出了事件发生的条件概率:PT发生时,HO发生的概率是0.7P
6、(PT)P(BT)True0.2000.001False0.8000.999P(HO
7、PT)PT=TruePT=FalseTrue0.7000False0.3001.0008/4/202114数据仓库与数据挖掘7.4.2贝叶斯网络的预测算法计算结点HA的概率。完善结点概率:在不知结点明确信息情况下的预测。P(+HA)=P(+BT)P(+HO)P(+HA
8、+BT+HO)+P(+BT)P(-HO)P(+HA
9、+BT-HO)+P(-BT)P(+HO)P(+HA
10、-BT+HO)+P(-BT)P(-HO)P(+HA
11、-BT-HO)计算已知参加晚会的情况下,第二天早晨呼吸有酒精味的概率。
12、P(+SA)=P(+HO)P(+SA
13、+HO)+P(-HO)P(+SA
14、-HO)计算已知参加晚会的情况下,头疼发生的概率。8/4/202115数据仓库与数据挖掘7.4.2贝叶斯网络的预测算法输入:给定贝叶斯网络B(包括网络结构m个节点以及某些节点间的连线、原因节点到中间节点的条件概率或联合条件概率),给定若干个原因节点发生与否的事实向量F(或者称为证据向量);给定待预测的某个节点t。输出:节点t发生的概率。(1)把证据向量输入到贝叶斯网络B中;(2)对于B中的每一个没处理过的节点n,如果它具有发生的事实
此文档下载收益归作者所有