欢迎来到天天文库
浏览记录
ID:10796325
大小:570.50 KB
页数:20页
时间:2018-07-08
《主成分分析的计算步骤》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、葡萄酒的评价摘要本文通过聘请一批有资历的评酒员对葡萄酒的质量进行评价,从而得出不同组别、不同样品葡萄酒的质量。然后分析酿酒葡萄与葡萄酒质量的理化指标对葡萄质量的影响,以及它们之间的联系。对于问题1,我们采用了单因素方差分析和检验对评判两组评酒员的评价结果进行了显著性检验。对于问题2,我们首先对酿酒葡萄的理化指标进行主成分分析,得出各个样品的综合得分;然后,根据附表1中品酒员对各个样品的综合评分对葡萄酒进行模糊综合评判处理,得出各葡萄酒样品质量的模糊评判分数;再据有关资料提供的酿酒葡萄与葡萄酒的权重系数进行
2、综合处理,得出酿酒葡萄的分级情况为:对于问题3,我们先采用灰色关联度分析得出了酿酒葡萄理化指标X1与葡萄酒的理化指标(X2)的关联度,比较了各理化指标的关联程度大小;然后再采用一元多项式回归得出X1与X2的具体函数关系为:对于问题4,我们先用残差分析剔除了一些异常数据后,再对有关数据进行处理,逐个分析了酿酒葡萄对葡萄洒质量、葡萄酒对葡萄洒质量的单因素影响,再采用多元线性回归得出了酿酒葡萄、葡萄酒的理化指标对葡萄酒质量的综合影响。我们得出:单因素影响:综合因素影响:关键词:检验、主成分分析、Matlab编程
3、、灰色关联度分析、一、问题重述1.1、问题背景:葡萄酒是一种健康饮料,口味独特,酒精含量又低,深受大家的欢迎。然而确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。因此,确定酿酒葡萄和葡萄酒的质量之间的关系是非常必要的。1.2需要解决的问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一
4、组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析题目要求根据葡萄酒和酿酒葡萄检测的理化指标来反映葡萄酒和葡萄的质量。2.1问题一的分析:问题一要求我们根据附件1中两组评酒员的评价结果,判断哪一个更为可信。首先,本文采用了Excel统计原理求出每一个组每一个样品的总平均分,然后用单因素方差分析不同组别的同类葡萄,得
5、出F比,然后进行比较得出两组评酒员的评价结果有无显著性差别。然后,用t检验进一步证明。根据上面所得出的数据求出均值差的置信水平为0.95的置信区间。然后,根据置信水平,评判哪一组结果更可信。2.2问题二的分析:对问题二,对问题2要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。本文采用了主成分分析法,根据附件2葡萄和葡萄酒的理化指标表,选取一级指标,有多次测量数据则取其平均值。运用Matlab编程,计算得到主成分的个数,以及主成分的得分,再对它们求和得出每一个样品的综合得分。接着,运用Exc
6、el统计原理求出每种葡萄酒样品的质量的总平均分,根据统计原理得出它们权重关系。然后求出每个样品在两种因素下的总得分,再根据得分情况对酿酒葡萄分级。2.3问题三的分析:对问题三,采用主成分分析法求出葡萄酒的理化指标的主成分得分。然后,求出每个样品的总得分。采用灰色关联度分析酿酒葡萄与葡萄酒的理化指标的关联度。最后,采用一元多项式回归求出两者的具体函数关系,并得出置信区间。2.4问题四的分析:对问题四,采用一元线性分析分别得出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的函数关系。然后,采用多元线性分析得出酿酒葡萄
7、和葡萄酒的理化指标与葡萄酒质量的函数关系,期间采用了残差分析,剔除不可置信点。三、模型假设1.假设二级指标对一级指标的影响不大;2.四、符号说明1.:指标变量的个数;2.rij:(i,j=1,2,…,p):为原变量的xi与xj之间的相关系数;3.R:实对称矩阵;4.:主成分;5.:特征值;6.:特征向量;7.:主成分载荷;8.:因素集;9.:评语集;10.:权重集;11.:单位矩阵;五、模型的建立与求解(一)对于问题一:分析附件1中两组评酒员的评价结果的显著性差异,判断哪组更可信。首先用采用excell统
8、计学原理求出每一组每个样品的总得分。然后采用单因素试验的方差分析分析两组评酒员的评价结果有无显著差异。再采用t检验进一步验证。根据得出的数据求均值差的置信水平为0.95的置信区间。第一种方法:采用方差分析一般地为了考虑因素A是否对试验指标有影响,我们在因素的不同水平A1、A2,…,Ar下进行试验,如果在每一水平Ai下,进行了ni次观察,从而得到ni个数据,把因素每一水平下的试验指标看成一个随机变量,则这ni个数据就是的一个容量
此文档下载收益归作者所有