基于信息几何构建朴素贝叶斯分类器

基于信息几何构建朴素贝叶斯分类器

ID:37739636

大小:165.50 KB

页数:6页

时间:2019-05-30

基于信息几何构建朴素贝叶斯分类器_第1页
基于信息几何构建朴素贝叶斯分类器_第2页
基于信息几何构建朴素贝叶斯分类器_第3页
基于信息几何构建朴素贝叶斯分类器_第4页
基于信息几何构建朴素贝叶斯分类器_第5页
资源描述:

《基于信息几何构建朴素贝叶斯分类器》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于信息几何构建朴素贝叶斯分类器基于信息几何构建朴素贝叶斯分类器黄友平黄友平,男,博士研究生,主要研究方向为Bayesian网络、信息几何。E-mail:huangyp@ics.ict.ac.cn.,史忠植史忠植,男,研究员,博士生导师,主要研究领域为智能科学、数据挖掘、智能主体。E-mail:shizz@ics.ict.ac.cn(1中科院研究生院,北京100080)(1,2中科院计算所智能信息处理重点实验室,北京100080)摘要:朴素贝叶斯分类器是机器学习中一种简单而又有效的分类方法。但是由于它的属性条件独立性假设在

2、实际应用中经常不成立,这影响了它的分类性能。本文基于信息几何和Fisher分,提出了一种新的创建属性集的方法。把原有属性经过Fisher分映射成新的属性集,并在新属性集上构建贝叶斯分类器。我们在理论上探讨了新属性间的条件依赖关系,证明了在一定条件下新属性间是条件独立的。试验结果表明,该方法较好地提高了朴素贝叶斯分类器的性能。关键词:朴素贝叶斯分类器;信息几何;Fisher分;条件独立6基于信息几何构建朴素贝叶斯分类器6基于信息几何构建朴素贝叶斯分类器1.引言朴素贝叶斯分类器(NaïveBayesianClassifier)

3、是一种基于Bayes理论的简单分类方法,它在很多领域都表现出优秀的性能[1][2]。朴素贝叶斯分类器的“朴素”指的是它的条件独立性假设,虽然在某些不满足独立性假设的情况下其仍然可能获得较好的结果[3],但是大量研究表明此时可以通过各种方法来提高朴素贝叶斯分类器的性能。改进朴素贝叶斯分类器的方式主要有两种:一种是放弃条件独立性假设,在NBC的基础上增加属性间可能存在的依赖关系;另一种是重新构建样本属性集,以新的属性组(不包括类别属性)代替原来的属性组,期望在新的属性间存在较好的条件独立关系。目前对于第一种改进方法研究得较多[

4、2][4][5]。这些算法一般都是在分类精度和算法复杂度之间进行折衷考虑,限制在一定的范围内而不是在所有属性构成的完全网中搜索条件依赖关系。虽然如此,寻找条件依赖关系依然需要较复杂的算法。而通过重新构建样本属性集的方式则可以避免寻找条件依赖关系,保持朴素贝叶斯分类器的简单和直观。事实上,属性构造方法一直是机器学习领域中重要的方法之一,在决策树、规则学习、神经网络等方面得到了有效应用[6][7]。Pazzani提出了一种构建NBC的方法:BSEJ算法[8],该算法是基于原有属性的笛卡儿积来构建新的属性。本文基于信息几何理论和

5、Fisher分,提出了一种新的属性构造方法,从而得到一种新的朴素Bayes分类器IG-NBC(InformationGeometry–NaïveBayesClassifier)。我们在理论上探讨了新属性间的条件独立关系,并对一些特殊情况进行了分析。最后给出了该算法与朴素贝叶斯分类器相比较的试验结果。2.信息几何和Fisher分信息几何是采用(Riemann流形上的)微分几何方法来研究统计学的理论。自1975年Efron首先在统计学中采用微分几何方法以来,许多统计学家在这方面进行了大量的工作。特别是由于甘利俊一(S.Amar

6、i)[9]-[12]和ZHUHaiyu[13]-[15]等人的杰出工作,使得信息几何理论得到学术界的广泛关注,成为统计学中一个令人瞩目的新分支,并在许多领域得到了大量应用。设m维样本空间上随机变量X的概率分布(参数)簇S={p(X6基于信息几何构建朴素贝叶斯分类器

7、θ)

8、θ∈Θ},其中θ为该分布簇的参数向量,Θ为n维欧式空间Rn的一个开集。在p满足一些正则条件的情况下,S形成一个微分流形,称为统计流形,θ称为统计流形的自然坐标[9]。对于一个带参数θ的概率分布p(X

9、θ),其对数似然函数记为:(1)其中为n维欧式空间的向量

10、。记,,则该概率分布的Fisher信息矩阵定义为:6基于信息几何构建朴素贝叶斯分类器(2)6基于信息几何构建朴素贝叶斯分类器在自然坐标θ下,Fisher信息矩阵成为此概率分布所对应的流形S的Riemann度量。事实上,从保持充分统计量变换下度量不变的意义上说,Fisher信息矩阵是统计流形上唯一合适的Riemann度量[16]。与欧式空间的距离不通,该度量具有相对坐标变化的不变性,从而在很大程度上体现了样本分布的内在特征。设,则Fisher信息矩阵I可写为:(3)其中Ux又称为Fisher分。Fisher分作为一种特征抽取

11、的手段,在机器学习领域得到了广泛的研究和应用[7][9][19][20]。可以看出,Fisher分Ux把m维样本空间中的每一个点映射为n维空间中的一个点:6基于信息几何构建朴素贝叶斯分类器(4)6基于信息几何构建朴素贝叶斯分类器Tsuda等人认为Fisher分可以完全地抽取出样本数据的类别分布信息,并可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。