欢迎来到天天文库
浏览记录
ID:37227248
大小:425.19 KB
页数:4页
时间:2019-05-19
《朴素贝叶斯算法在蝴蝶兰病害分类中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2015年3月农机化研究第3期朴素贝叶斯算法在蝴蝶兰病害分类中的应用研究卜旭松,刘立波(宁夏大学数学计算机学院,银川750021)摘要:蝴蝶兰属于热带气生兰,对生长环境的温湿度非常敏感,温湿度过高或过低不仅对蝴蝶兰生长不利而且易引发多种病害。为此,利用传感器采集的蝴蝶兰生长环境空气温湿度数据,运用朴素贝叶斯算法对其进行分类,以此判断蝴蝶兰的健康状况,达到病害分类的目的。实验表明,该方法的平均分类准确率达到81%,与其它统计学预报方法相比,具有简单、易行的优点。关键词:蝴蝶兰;温湿度;朴素贝叶斯;分类+中图分类号:S115文献标识码:A文
2、章编号:1003-188X(2015)03-0230-04DOI:10.13427/j.cnki.njyi.2015.03.057源于古典数学理论,其基本原理是贝叶斯定理,是一0引言种较稳定的有监督分类算法,被广泛应用于邮件过[6][7][8]宁夏地区春季多风沙,夏季高温干燥,冬季寒冷,滤、电网故障诊断、未知病毒检测及供应链金[1]而蝴蝶兰对温度、湿度条件要求高。普通日光温室融信用风险预测等多个方面。朴素贝叶斯分类算法夏季高温可达40℃以上,冬季低温时常维持在4~精度高、速度快、错误率低,但它需要建立在类条件独8℃,远远不能满足蝴蝶兰生
3、长发育的要求,更不能进立的基础上。本文所研究的空气温湿度数据,其属性[2]入花期。蝴蝶兰病害的发生大多由于高温、高湿或是相互独立的,因而利用朴素贝叶斯算法进行病害分[3-4]类预警研究是可行的。低温多湿,空气不洁或者通风不良所致。在此生长环境下,蝴蝶兰大多生长快、徒长,组织柔弱,致使1.1朴素贝叶斯分类方法[9-10]各种病菌容易生病害。本文在综合分析宁夏银川地朴素贝叶斯分类器是基于贝叶斯定理进行区蝴蝶兰温室环境空气温湿度数据的基础上,利用朴分类构造的统计分类器,在处理大规模数据库时表现[5]素贝叶斯算法对蝴蝶兰易发生病害进行分类预警,
4、出较高的分类准确性和运算性能。其在分类运算时以减轻病害发生所造成的损失。通常都假设某一指定类别中各属性取值相互独立,这一假设也被称为类别条件独立,它可以有效减少在构1朴素贝叶斯算法造朴素贝叶斯分类器时的计算量。分类是一种重要的数据分析形势,是一种有监督1.2贝叶斯定理的学习,通过对已知类别训练集的分析,从中发现分设X为一个类别未知的数据样本,H为某个假类规则,以此预测新数据的类别。常用的分类算法有设,若样本数据X属于一个特定的类别C,那么分类问决策树、关联规则、支持向量机及朴素贝叶斯等。决题就是决定P(H
5、X),即在获得样本数据X时,H
6、假策树分类算法能较好地处理噪声数据,但只对规模较设成立的概率。由于P(X)、P(X
7、H)和P(H)的概小训练样本集有效;基于关联规则的分类算法准确率率值可以从供学习使用的数据集合中得到,贝叶斯定高,但容易受硬件内存的制约;支持向量机算法的分理则描述了如何根据P(X)、P(X
8、H)和P(H)计算类准确率高、复杂度低,但速度慢。朴素贝叶斯算法获得的P(H
9、X),有关的具体公式定义描述为P(X
10、H)P(H)P(H
11、X)=(1)收稿日期:2014-04-08P(H)基金项目:宁夏科技支撑计划项目(2013);中国科学院‘西部之光’人1.3朴素贝
12、叶斯分类方法才培养计划项目(2012);国家农业科技成果转化资金项目(2012GB2G300480)朴素贝叶斯分类器,或称为简单贝叶斯分类器,作者简介:卜旭松(1988-),男,山东烟台人,硕士研究生,(E-mail)其分类操作处理步骤如下:buxusong@126.com。1)每个数据样本均是由一个n维特征向量X=通讯作者:刘立波(1974-),女,宁银川人,教授,博士,(E-mail)li-ulib@163.com。{x1,x2,…,xn}来描述其n个属性{A1,A2,…,An}的·230·2015年3月农机化研究第3期具体取值。2
13、)假设共有m个不同类别C1,C2,C3,…,Cm,给定一个未知类别的数据样本X,分类器在已知X情况下,预测X属于事后概率最大的那个类别。也就是说,朴素贝叶斯分类器将未知类别的样本X归属到类别Ci,当且仅当:P(Ci
14、X)>P(Cj
15、X),1≤j≤m,j≠i时,也就是P(Ci
16、X)最大。其中的类别Ci就称为最大事后概率的假设。根据式(1)可得P(X
17、Ci)P(Ci)P(Ci
18、X)=(2)P(X)图1朴素贝叶斯分类原理3)由于P(X)对于所有的类别均是相同的,因此Fig.1Principleofnaivebayesclassificatio
19、n只需要P(X
20、Ci)P(Ci)取最大即可。由于各类别的2蝴蝶兰病害分类方法事前概率是未知的,因此通常就假设各类别的出现概率相同,即P(C1)=P(C2)=P(C3)=…=P(Cm)利用朴素贝叶斯算法分类器
此文档下载收益归作者所有