基于主成分分析与神经网络的葡萄酒品质评价.pdf

基于主成分分析与神经网络的葡萄酒品质评价.pdf

ID:52518321

大小:495.61 KB

页数:4页

时间:2020-03-28

基于主成分分析与神经网络的葡萄酒品质评价.pdf_第1页
基于主成分分析与神经网络的葡萄酒品质评价.pdf_第2页
基于主成分分析与神经网络的葡萄酒品质评价.pdf_第3页
基于主成分分析与神经网络的葡萄酒品质评价.pdf_第4页
资源描述:

《基于主成分分析与神经网络的葡萄酒品质评价.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第24卷第1期广东石油化工学院学报V01.24No.12014年2月JournalofGuangdongUniversityofPetrochemicalTechnologyFebruary2014基于主成分分析与神经网络的葡萄酒品质评价吴淦洲。,梁海燕(1.广东石油化工学院理学院,广东茂名525000;2.茂名市高级技工学校,广东茂名525000)摘要:此文在主成分分析的基础上,运用人工神经网络对UCI数据库的葡萄酒数据建立了数学模型。仿真实验结果表明该模型是行之有效的方法。关键词:主成分分析;神经网络;品质评价中图分类号

2、:029文献标识码:A文章编号:2095—2562(2014)01—0056—03O引言葡萄酒作为一种色香味俱佳的饮品,既能满足人们的感官享受,又具有相当高的营养和保健价值。对葡萄酒品质的评价,一般通过评酒员对葡萄酒进行品尝后给其分类指标进行打分,由于主观感官打分受到很多因素的影响,所以其准确性也受到了一定的影响。国内外对葡萄酒品质的评价主要有遗传神经网络n]、模糊神经网络[2]、数据挖掘[3等算法,而主成分分析法是统计学中基于历史数据特点来发掘其规律性的主要手段。本文首先用主成分分析法来筛选出4种主要特征来作为BP神经网络

3、输入层的神经元,然后建立神经网络模型来对葡萄酒品质进行评价。l模型构建与计算本文的研究数据来自于UCI机器学习数据库(http://archive.ics.uci.edu/ml/datasets/Wine),该数据库共包括178个样本,分成三类:第一类样本有59个;第二类样本有71个;第三类样本有48个。每个样本都含有13个特征向量,分别是:alcohol,malicacid,ash,alkalinityofash,magnesium,totalphenols,flavanoids,non—flavanoidphenols,

4、proanthocyanins,colorintensity,hue,OD290/OD315ofdilutedwines,proline。由于每个样本均有13个特征向量,数量较多,所以本文首先用主成分分析法去处理一下这13个特征向量。主成分分析的基本方法是通过构造原指标的适当的线性组合,以产生一系列互不相关的新综合指标,从中选出少数几个新指标并使它们含有尽可能多的原指标带有的信息,从而使得用这几个新指标代替指标分析问题和解决问题成为可能。综合指标是原来多个指标的线性组合,虽然这些线性综合指标不能直接观测到,但综合指标间互不相

5、关,又能反映多个指标的信息。主成分分析实际上是一种降维的方法。1.1主成分分析法如果原指标为··,⋯,,主成分分析后得到的新指标Y,Y:,⋯,均是。,:,⋯,的线性组合(m≥p):Y=UY(1)其中收稿日期:2013—07—19;修回日期:2014—02—04作者简介:吴淦洲(198O一),男,广东茂名人,讲师,硕士,研究方向为复杂系统优化与建模。第1期吴淦洲等:基于主成分分析与神经网络的葡萄酒品质评价57U==(U。,U2,⋯,)=(2)Y,Y,⋯,称为主成分,其中Y。为第一主成分,Y为第二主成分,依此类推。其具体计算步骤

6、为:(1)指标数据的标准化分析或评价中确定的各个指标,都有不同的量纲、不同的数量级,而不同的量纲、不同的数量级的数据不能放在一起直接进行比较,也不能直接用于多元统计分析,需要对指标的数值进行标准化处理,以消除其量纲数量级上的差异,使其具有可比性。最为常用的方法则是标准化变换:=(1,2,⋯,凡;=1,2,⋯,m)(3)V,,其中,和~/伽r()分别为第个指标的均值和标准差,得到标准化数据矩阵置=(,三,三,⋯,二)(i=1,2,⋯,n)(4)(2)计算的相关矩阵足以及R的特征根设为:1≥2≥⋯≥I>0(5)(3)计算前P个主

7、成分:Ui=tUlf,2i,⋯一,Up/),ti=1,2,⋯,P),(6O)各主成分彼此不相关,并分别以方差贡献率ai解释了P个指标,累计贡献率ai可以作为选取主成分个数的依据:】∑aL=L(i,z=1,2,⋯,P)(7)∑∑用Matlab2OlOb编程实现主成分分析,得出表1所示数据:表1主成分分析结果特征值差值贡献率/%累计贡献率,%特征值差值贡献率,%累计贡献率/%5.3259723.66459.17759.1770.7597080.4027.84086.0861.6620160.90l8.46777.6440.303

8、6470.1603.37493.925由上表可知,前4个主成分的贡献率就达到了93.925%。故我们可将这4个主成分作为神经网络的输入元,避免了由于变量太多而导致神经网络效率下降的问题。1.2BP神经网络算法厂I输■—层二-]lBP神经网络结构即多层前馈式误差反传播神I..........

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。