实验三:分类算法实验

实验三:分类算法实验

ID:30244979

大小:394.50 KB

页数:14页

时间:2018-12-28

实验三:分类算法实验_第1页
实验三:分类算法实验_第2页
实验三:分类算法实验_第3页
实验三:分类算法实验_第4页
实验三:分类算法实验_第5页
资源描述:

《实验三:分类算法实验》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用标准文案HUNANUNIVERSITY人工智能实验报告题目实验三:分类算法实验学生姓名蒙寿伟学生学号201408070120专业班级智能科学与技术1401班指导老师袁进日期2017年5月15日精彩文档实用标准文案一.实验目的1.了解朴素贝叶斯算法和决策树算法的基本原理;2.能够使用朴素贝叶斯算法或者决策树算法对数据进行分类3.学会对于分类器的性能评估方法二、实验的硬件、软件平台硬件:计算机软件:操作系统:WINDOWS 2000 应用软件:C,Java或者Matlab三、实验相关知识贝叶斯定理:P(A)是A的先验概率,之所以称为“先验”是因为它不考虑任何B方

2、面的因素。P(A

3、B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。P(B

4、A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。P(B)是B的先验概率,也作标淮化常量(normalizingconstant)。以第一条数据为例:vhigh,vhigh,2,2,small,low,unaccClassValues:unacc,acc,good,vgood对应P(Bi)。(i=0,1,2,3)P(Ai)六个属性相互独立:P(A0

5、B0)*P(A1

6、B0)*......P(A5

7、B0)=P(A

8、B0)。。。。。。分别算出取其中

9、的最大值,其中,P(A)的值相同,可以不算出来。If(P(B

10、A)最大==测试样例.ClassValues)returntrue;Elsereturnfalse;精彩文档实用标准文案三、实验内容及步骤实验内容:利用贝叶斯算法或者决策树算法进行数据分类操作数据集:汽车评估数据集(见附录)实验步骤:1.仔细阅读并了解实验数据集;2.使用任何一种熟悉的计算机语言(比如C,Java或者matlab)实现朴素贝叶斯算法或者决策树算法;3.利用朴素贝叶斯算法或者决策树算法在训练数据上学习分类器,训练数据的大小分别设置为:前100个数据,前200个数据,前500个数据,前70

11、0个数据,前1000个数据,前1350个数据;4.利用测试数据对学习的分类器进行性能评估;5.统计分析实验结果并上交实验报告;<1>定义和初始化变量<2>统计并计算条件概率P(Ai

12、Bi),(i=0,1,2,3),当训练数据比较小时会出现Bi等于0的情况,这时P(Ai

13、Bi)=nan,所以可以加一个判断,当P(Ai

14、Bi)<0或P(Ai

15、Bi)>1时,让P(Ai

16、Bi)=0.精彩文档实用标准文案<3>计算(四个里面取最大)精彩文档实用标准文案<4>实验结果四、思考题:1.两种算法在训练数据集和测试数据集上的性能一致吗?哪个比较好? 决策树(decisiontre

17、e)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。     不同于贝叶斯算法,决策树的构造过程不依赖领域知识,它使用属性选择度量来选择将元组最好地划分成不同的类的属性。所谓决策树的构造就是进行属性选择度量确定各个特征属性之间的拓扑结构。决策树的成功率为:61.80372%,贝叶斯成功率为:68.7831%(贝叶斯更

18、好一点)相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。精彩文档实用标准文案2.提出一种提高分类器性能的方法并通过实验验证。三、实验心得通过这次实验加深了我对朴素贝叶斯的认识,学会了用朴素贝叶斯算法解决具体的问题。朴素贝叶斯分类是一种十分简单的分类算法,对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就觉得此待分类项属于哪个类别。朴素贝叶斯的原理决定了其成功率不可能太高,但是朴素贝叶斯的简单易用性使得其在一些日常生活中应用广泛。附件(代码)#include

19、stream>#include#include#include#include精彩文档实用标准文案#includeusingnamespacestd;intcountTrain=0;//训练样本数目intcountTest=0;//测试样本数目intcountTestSuc=0;//测试样本正确的数目intcountF=100;//训练和测试的分界stringCVname[4]={"unacc","acc","good","vgood"};intClassValues[4];

20、//unacc,acc,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。