欢迎来到天天文库
浏览记录
ID:30118646
大小:290.50 KB
页数:18页
时间:2018-12-27
《生物信息学课程设计--贝叶斯算法编程实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、算法课程设计报告(算法编程实现类)贝叶斯算法编程实现院系部门:重庆邮电大学学生学号:*********学生姓名:*********指导教师:*****生物信息学院制2013年5月第一部分贝叶斯算法研究背景、特点与发展31.1贝叶斯算法研究背景31.2贝叶斯算法特点31.3贝叶斯算法发展3第二部分算法分析与程序流程图设计32.1、基于对问题的分析42.2、基于对问题的java算法分析42.2、程序流程图设计5第三部分实现设计语言选择与算法编程实现53.1、java算法实现5第四部分程序测试与结果分析104.1程序测试104.2结果分析11第五部
2、分总结与心得体会115.1总结与心得体会11第六部分参考文献126.1参考文献(2个)1218第一部分贝叶斯算法研究背景、特点与发展1.1贝叶斯算法研究背景贝叶斯分类算法是统计学分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(NaïveBayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,且方法简单、分类准确率高、速度快。由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为此,就出现了许多降低独立性假设的贝叶斯分类算法,如TAN(t
3、reeaugmentedBayesnetwork)算法。1.2贝叶斯算法特点和决策树模型相比,朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的
4、性能最为良好。181.3贝叶斯算法发展贝叶斯分类理论有最初的朴素贝叶斯于EM算法,灰色关系继续发展为基于改进EM的朴素贝叶斯分类理论。第二部分算法分析与程序流程图设计2.1、基于对问题的分析对问题进行分析,设X是类标号未知的数据样本,设H为某种假的,如数据养本X属于某特定的类C。对与分类问题,希望确定P(H
5、X),即给定观测数据样本X,假定H成立的概率。贝叶斯定理给出了如下计算P(H
6、X)的简单有效的方法:P(H
7、X)=P(X
8、H)P(H)/P(X)其中P(H)称为先验概率,P(X
9、H)表示假设H成立时观查到X的概率。P(H
10、X)表示后验概率
11、。每一个样本数据用一个n维特征向量X={x1,x2,x3,…,xn}表示,分别描述具有n个属性A1,A1,…An的样本的n个度量。假定有m个类C1,C2,…,Cm,给定一个未知数据样本X(即没有类编号),分类器将预测X属性与最高后验概率的类。也就是说,朴素贝叶斯分类将未知样本分配给Ci(1<=i<=m),当且仅当P(Ci
12、X)>P(Cj
13、X),j=1,2,…18m,j不等于i这样最大的P(Ci
14、X)对应的类Ci称为最大后验假定。由于P(X)对于所有类是常数,只需要P(X
15、Ci)P(Ci)最大即可。注意假设不是等概率的,那么类的先验概率可以用P
16、(Ci)=si/s计算,其中si是类Ci的训练样本数,而s是训练样本总数。P(X
17、Ci)=2.2、基于对问题的java算法分析首先需要将所有的训练数据读入到ArrayList>对象集合中去,其中每一条训练数据对应一个ArrayList对象集合。同理用readTestData()将测试元组读如ArrayList对象集合中去。下面就需要将ArrayList>中的每一组训练元组按照类别属性分开,保存到Map18、rayList>>对象中去用三重for循环来计算测试元组中每一属性所在每一个类别中概率的之积,并返回最大积所对应的类别名称。182.2、程序流程图设计第三部分实现设计语言选择与算法编程实现3.1、java算法实现packageorg.decimalcalculate;importjava.math.BigDecimal;publicclassDecimalCalculate{privatestaticfinalintDEF_DIV_SCALE=10;18//这个类不能实例化privateDecimalCalculate(){}19、publicstaticdoubleadd(doublev1,doublev2){BigDecimalb1=newBigDecimal(Double.toStrin
18、rayList>>对象中去用三重for循环来计算测试元组中每一属性所在每一个类别中概率的之积,并返回最大积所对应的类别名称。182.2、程序流程图设计第三部分实现设计语言选择与算法编程实现3.1、java算法实现packageorg.decimalcalculate;importjava.math.BigDecimal;publicclassDecimalCalculate{privatestaticfinalintDEF_DIV_SCALE=10;18//这个类不能实例化privateDecimalCalculate(){}
19、publicstaticdoubleadd(doublev1,doublev2){BigDecimalb1=newBigDecimal(Double.toStrin
此文档下载收益归作者所有