欢迎来到天天文库
浏览记录
ID:9856576
大小:49.50 KB
页数:9页
时间:2018-05-12
《采用聚类分析的方法对两种葡萄进行分类毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、模式识别结业论文(采用聚类分析的方法对两种葡萄进行分类)学院:计算机与信息工程学院班级:2011级通信工程班采用聚类分析的方法对两种葡萄进行分类摘要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,建立聚类分析模型。首先因为样品酒的60个指标之间具有较强的相关性,所以对变量指标进行R型聚类分析,降低变量个数;然后采用Q型聚类分析对样本进行分类。把两组样品葡萄分为5类。红葡萄分类结果:第一类:样品8(反式白藜芦醇苷指标为5.283,而其他样品都小于1);第二类:样品3(氨基酸指标为8397.28远大
2、于该指标均值2385.31)第三类:样品10(VC含量10.25,远大于均值0.477);第四类:样品1、2、4、5、6、7、9、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27;第五类:酒样品11(花色苷指标为104.92,远大于均值7.787);关键词:R型聚类Q型聚类1问题分析要根据酿酒葡萄和葡萄酒的质量的这两种葡萄进行分级,首先对原始酿酒葡萄的理化指标数据进行整理,并把葡萄酒的平均质量指标作为葡萄的变量指标进行考虑。由于白葡萄和红葡萄的分析方法相同,所以
3、我们以红葡萄为例来进行分析。首先定性考察反映红葡萄指标状况的60个方面,可以看出某些指标之间可能存在较强的相关性。比如氨基酸的总量与天门冬氨酸、苏氨酸、丝氨酸、谷氨酸、脯氨酸、甘氨酸、丙氨酸、胱氨酸、缬氨酸、蛋氨酸、异亮氨酸、酪氨酸、苯丙氨酸、赖氨酸、组氨酸、精氨酸之间可能存在较强的相关性,白藜芦醇与反式白藜芦醇苷、顺势白藜芦醇苷、反式白藜芦醇、顺势白藜芦醇之间可能存在较强的相关性,还原糖与果糖和葡萄糖之间存在较强的相关性,为了验证这种想法,运用MATLAB软件计算60个指标的相关系数矩阵.其次由相关性矩阵
4、可以判断某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取几个有代表性的指标进行聚类分析。为此,把60个指标根据其相关性进行R型聚类,聚成20类,再从每个类中选取代表性的指标。首先对每个变量的数据分别进行标准化处理。变量间相近性度量采用相关系数,类间相近性度量的计算选用类平均法,编写MATLAB程序,从而求出聚类树形图。最后根据这20个变量指标对27中红葡萄进行聚类分析。首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均法,编写MATLAB程序,从而得
5、到葡萄聚类树形图。2模型的建立与求解根据求得的相关系数矩阵,采用R型分析和Q型分析的方法对葡萄进行分类,具体的数学模型如下:(1)首先对葡萄的指标进行标准化处理,然后通过下面的模型可以求出葡萄变量指标的相关系数矩阵;(2)然后采用最短距离法求出相关系数矩阵中两个类中最近两点间的距离,再采用dendrogram函数,即可画出葡萄变量指标的聚类树形图;(1)最后对每个变量指标的数据分别进行标准化处理,样本间间的相似性采用欧氏距离度量,类间距离的计算选用类平均法,然后再次使用dendrogram函数求出葡萄的聚类
6、树状图,从而得到葡萄的分类结果。3模型的结果与分析1)红葡萄分类的结果与分析如下:(1)对红葡萄变量的聚类树状图:图1对红葡萄变量的聚类树状图由图形和MATLAB程序可知,把葡萄的变量指标分为20类,其中还原糖,果糖,葡萄糖,可溶性物质,PH值、可滴定酸,顾酸比,干物质含量,果穗质量,百粒质量,果梗比,出汁率,果皮质量,L*,果皮颜色a+,果皮颜色b*,H,C,18个变量指标之间有较大的相关性,被聚到一起;氨基酸,脯氨酸,花色苷3个变量指标之间存在有较大的相关性,被聚到一起;丝氨酸,缬氨酸,异亮氨酸,亮氨酸
7、,赖氨酸,组氨酸,精氨酸之间存在较大的相关性,被聚成一类;白藜芦醇和顺势白藜芦醇苷之间存在较大的相关性,被聚成一类;黄酮醇。槲皮素,异鼠李素,总糖之间存在较大的相关性,被聚成一类;苏氨酸,谷氨酸,丙氨酸,苹果酸,柠檬酸,多酚氧化酶,褐变度,DPPH自由基,总酚,单宁,葡萄总黄酮之间存在较大的相关性,被聚成一类;其余各自成一类。这样就从60个指标中选定20个分析指标,可以根据这35个指标对27种红葡萄进行聚类分析。(2)27种红葡萄聚成5类的树状图图227种红葡萄聚成5类的树状图由图可知,各种红葡萄之间存在较
8、大的差异,可把27种葡萄分为4类,结果为:第一类:红葡萄样品8;第二类:红葡萄样品3;第三类:红葡萄样品10;第四类:红葡萄样品1,2,4,5,6,7,9,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27;第五类:红葡萄酒样品11.从以上结果结合聚类图中的合并距离可以看出,红葡萄样品8与其他样品有非常大的不同,主要表现在该样品的苹果酸,柠檬酸,褐变度,黄酮醇,远高于其
此文档下载收益归作者所有