资源描述:
《模式识别-贝叶斯统计-iris数据集复习过程.docx》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、模式识别-贝叶斯统计-iris数据集复习过程粗品文档IRIS数据散下基于最小同伴率以及最小危害的贝叶斯决议的真验取剖析贺翔3115370035硕5101粗品文档粗品文档1.成绩形容1.1Iris数据散Iris数据散包孕3类4维样本,分手标为1,2,3。个中,每一类样本数量为50,且从命正态散布,每一个数据样本有4个特性背量,分手代表萼片少度,萼片宽度,花瓣少度以及花瓣宽度。1.2请求假如Iris数据是正态散布的,请求思索各类真验大概性(分组数目、分组战略、先验几率等),用样本对于***正态稀度函数举行参数
2、估量(均值背量以及协圆好矩阵),最初对于3类Iris两两分类。粗品文档粗品文档粗品文档2.本理形容2.1贝叶斯公式已经知共有M种别Mii,2,1,,统计散布为正态散布,已经知先验几率)(iP及前提几率稀度函数)
3、(iXP,对于于待测样品,贝叶斯公式能够盘算出该样品分属各种其余几率,即后验几率。贝叶斯公式为MiPXPPXPXPMjjjiii,2,1,)()
4、()()
5、()
6、(1果此给定一个已知种别的数据样本X,贝叶斯分类法将展望X属于具备最下后验几率的类。故此成绩的数教形容为:多元正态几率模子下的贝叶斯分类
7、。2.2参数估量个中,前提几率稀度函数)
8、(iXP为正态稀度函数,用年夜量样本对于个中已知参数举行估量,***正态稀度函数为)]()(21exp[)2(1)(12/12/XSXSXPTn式中,),,(21nxxxX为n维背量;),,(21n为n维均值背量;]))([(TXXES为n维协圆好矩阵;粗品文档粗品文档1S是S的顺矩阵;S是S的止列式。年夜多半情形下,前提稀度能够接纳***变量的正态稀度函数去摹拟。)]}()(21exp[)2(1ln{)
9、()(1)(2/12/iiXXSXXSXPiTiniiiT
10、SnXXSXXiiln212ln2)()(21)(1)()(iX为i类的均值背量。2.3先验几率设数据散样本有d个属性,果此可用一个d维列背量12[,,...,]Tdxxxx去暗示。同时假设有c个类12,,...c。假如类的先验几率已知,则能够假设那些类是等几率的,即12()()...()cPPP,且()iiSPS个中,iS是类i中的练习样本数,而S是练习样本总数。2.4贝叶斯决议2.4.1最小同伴判断原则,似然比情势:211221)()()
11、()
12、()(XPPXPXPXl粗品文档粗品文档个中,)(Xl为
13、似然比,)()(12PP为似然比阈值。2.4.2最小危害判断原则:对于不雅测值X前提下,各形态后验几率供减权以及的圆式,暗示危害以下:MjjiXPjiLXR1)
14、(),()(个中,),(jiL为将第j类判为第i类的益得。若判对于i=j,则),(jiL与背值或者整值,暗示出有益得;若判对于ij,则),(jiL与正值,数值年夜小暗示益得几。对于患上到的M个范例的危害值MiXRi,2,1),(举行对比,患上到使前提危害最小的种别,判断X属于该种别。3.真验历程真验情况:MATLABR2014a真验战略:3类数据
15、两两分类,思索下列多少种大概性,A.与多少组数据(数目可变)?B.怎样选组(与法可变)?C.扭转先验几率等...3.1最小同伴判断原则:以“对于第2类、第3类鸢尾花数据分类”为例,(1)筹办第2类、第3类数据散,共100个样本,每一个样粗品文档本包孕4维特性,(2)读进练习样本,粗品文档粗品文档(3)读进训盘算各组的均值背量以及协圆好矩阵,即正态散布的两个主要参数均值以及圆好2,粗品文档粗品文档(4)已经经估量出3类数据的统计特性。尾先利用最小同伴判断原则举行分类,真验中接纳对于数情势盘算。对比3个值的年
16、夜小,哪一个最年夜,便可判别X属于哪一类。最初举行了分类器判据了局的考证。(5)个中对比函数为,3.2最小危害判断原则:粗品文档