欢迎来到天天文库
浏览记录
ID:59319292
大小:135.50 KB
页数:3页
时间:2020-09-05
《贝叶斯网络基础知识.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、贝叶斯网络随着计算机技术发展,知识发现和数据发掘能力越来越得到人们的重视。在人工智能领域中,贝叶斯网络以其对不确定知识的表达能力,对数据处理分析的能力得到了广泛的应用。贝叶斯网络继承了图论的直观性,同时以坚实的数学理论支撑,在医学诊断,故障分析等领域的应用都证明了它存在的科学性和重要意义。结构学习是建立贝叶斯网络的智能化方法,它以数据分析的方法,寻找能准确描述节点之间依赖关系的网络,是贝叶斯网络理论发展的重要方向。提高贝叶斯网络结构学习效率的主要因素是评分函数和搜索算法,优化评分函数的搜索算法是贝叶斯网络结构学习的核心问题结构学习的CH评分:(与BD评
2、分的区别是?)学习贝叶斯结构实质上就是学习与数据拟合最好的网络结构。即P(G
3、D)的最大值。由贝叶斯公式得:另外,P(D)与结构无关,假设P(G)服从均匀分布。上式两边同时取对数得:因此,等价于求边际似然函数P(D
4、G)的最大值。(名字的由来:)是二元组(G,)D的似然函数,记为:边际似然函数P(D
5、G)记为L(G
6、D).若参数先验分布P(
7、G)服从狄利克雷分布,则CH评分如下:对数似然函数:.由于贝叶斯网络具有独特的不确定性表达形式、易于综合先验知识以及直观的推理结果等特性,贝叶斯网络已逐渐成为在不确定情况下进行推理和决策的一种很受欢迎的网络结构,贝
8、叶斯网络结构学习是目前研究的热点,其目的是获取能较好吻合数据集并且尽可能简单的网络结构.同时,贝叶斯网络结构学习也是一个NP难题.MDL(等价于BIC)不需要计算参数的先验分布,计算简单,倾向于选择较简单的网络结构,基本原理是对于给定的实力数据进行压缩,从而降低数据的编码长度,一个MDL评分由以下两部分组成:(1)模型的描述长度.n表示节点变量个数;ki表示节点的父节点数目。条件概率表的编码长度.N为实例数据集中实例的个数;表示变量父节点集合的取值组合的数目;Si表示变量取值的数目。(2)数据的压缩编码长度.为变量X对于变量Y的条件熵。ScoreMDL
9、=L1+L2+L3连续变量离散化:对于连续型属性,主要是根据专家经验知识设置断点进行离散化。贝叶斯狄利克雷标准(BD),即CH评分,在1992年由CooperandHerskovits提出。
此文档下载收益归作者所有