基于数据挖掘的葡萄酒质量识别

基于数据挖掘的葡萄酒质量识别

ID:39260403

大小:1.99 MB

页数:61页

时间:2019-06-29

基于数据挖掘的葡萄酒质量识别_第1页
基于数据挖掘的葡萄酒质量识别_第2页
基于数据挖掘的葡萄酒质量识别_第3页
基于数据挖掘的葡萄酒质量识别_第4页
基于数据挖掘的葡萄酒质量识别_第5页
资源描述:

《基于数据挖掘的葡萄酒质量识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号⋯⋯⋯⋯⋯UDC.I7361加密级⋯⋯⋯⋯⋯编号⋯⋯⋯⋯⋯串-初大学CENTRAI,SOUTHUNIVERSITY硕士学位论文论文题目.⋯⋯基王熬握挖掘.的葡萄酒质量荪烈⋯⋯学科、专业:⋯⋯⋯⋯⋯⋯⋯统盐掌⋯⋯⋯⋯⋯⋯⋯⋯⋯研究生姓名:⋯⋯⋯⋯⋯⋯⋯捧翠叠⋯⋯⋯⋯⋯⋯⋯⋯⋯导师姓名及专业技术职务⋯⋯⋯⋯⋯赣青松⋯熬撬⋯⋯⋯⋯⋯⋯⋯2010年5月’原创性声明姗PllrIIUlIrllIIIIFIflrfllY1719737本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特别加以标注和

2、致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:靴日期:堆年』月孕日学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网

3、络向社会公众提供信息服务。期:址年上月斗日摘要随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大。但中国的葡萄酒业仍面临着进口酒的激烈竞争以及质量检测体系不明确带来的市场紊乱。针对这些问题,本文分析了葡萄酒质量人工品尝存在的不足,并提出了如何提高基于数据挖掘技术的葡萄酒质量等级的识别率,对中国葡萄酒市场的稳定发展以及更好地酿造出高质量的葡萄酒有着实际的应用价值。在数据挖掘中,经常会遇到不平衡数据的分析。相对于多数类来说,少数类样本对准确率的影响力小,这意味着对所有样本进行分类,可以在不识别出任何少数类样本的情况下得到很高的

4、正确率,识别少数类的分类规则也就被忽略了。本文的创新点在于从不平衡样本中提取平衡样本进行建模并对测试样本预测,进行多次的循环,得到多次的预测结果,选择次数出现最多的预测结果作为最终的预测结果,大大提高了低质量葡萄酒的识别率。基于此抽样建模方法,本文首先对判别分析、支持向量机、分类回归树以及随机森林在葡萄酒质量识别能力进行了比较分析,其中随机森林的预测效果最好,整体识别率以及低质量葡萄酒识别率最高,且模型较为稳定;其次,采用随机森林确定变量重要性,变量重要性排序结果发现,硫酸钾和酒精的重要性最高,硫酸钾和酒精的含量增加,更容易使得此种葡

5、萄酒质量的提升,为酿造师酿造出更好的葡萄酒提供重要的信息;最后,本文将异常点的检测方法应用于进口酒的低质量葡萄酒的检测,遗憾的是,低质量葡萄酒的识别程度有限,仅识别出30%左右的低质量葡萄酒样本,只能辅助低质量葡萄酒的识别,实证结果表明,基于异常样本的低质量葡萄酒的识别率提高了。关键词葡萄酒质量识别,判别分析,支持向量机,分类回归树,随机森林,异常点检测ABTRACTWiththedevelopmentofthedomesticwineindustry,boththenumberandthescaleofwinecompaniesiS

6、increasing.However,China’Swineindustryisstillfacingthefiercecompetitionagainstimportedwinesaswellasthemarketdisordercausedbytheshortageofthequalityassessmentsystem.Tosolvetheseproblems,weinthispaperfirstdiscussedthedeficienciesofwineartificialtaste,andthenproposedametho

7、dologytoimprovetherecognitionrateofwinequalitybymeansofdataminingtechniques.ItmaybenefitthequalitycontrolofwinesaswellasthestablleadvancementofChinesewinemarket.Inthefieldofdatamining,theanalysisofunbalanceddataisthecommoncase.Comparedtotheclasswithmoresamples.theinflue

8、nceofminorclassonthepredictionaccuracyiSsmaller.、胁enallsamplesareclassifiedwithhighaccuracy,thesamplesofthemin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。