欢迎来到天天文库
浏览记录
ID:26863032
大小:50.50 KB
页数:4页
时间:2018-11-29
《枣果实品质鉴定因子数据的预处理研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、枣果实品质鉴定因子数据的预处理研究摘要:因子数据预处理是为枣果实品质鉴定提供高质量数据的关键。对枣果实因子数据预处理研究,是将枣果实的颜色、形状、口感、树形、是否丰产等文本信息通过去噪音、处理空白数据、然后运用专家赋值规则库进行Java编程进行自动数字化,再利用归一化公式进行数据转化,从而判定影响枣果实品质优劣的关键因子,为枣农和消费者及时了解枣果实品质提供了简单的理论参考。中国8/vie 关键词:枣果实品质鉴定;因子数据;专家赋值规则库;数据预处理;关键因子 中图分类号:S665.1文献标识码:A:0439-8114(2016)22-5945-04 DOI:10.14088/j
2、.ki.issn0439-8114.2016.22.054 ResearchofDataPreprocessinginIdentifyingtheFactorDataofJujubeFruitQuality LIZi-yang,SHENLian-ying,ationofjujubefruitcolor,fruitshape,fruitflavor,thetreeform,andfertilityintodigitalinformationbydealingentrulebasemingtoautomaticdigitization,andthenusesthenormalizati
3、onformulafordatatransformation.SothatitdeterminesthekeyfactorsoftheJujubefruitquality.ItprovidesasimpletheoryreferenceforconsumersandJujubee. Keyentrulebase;datapreprocessing;keyfactor ��树是中国特有的果树和经济林树种,也是中国第一大干鲜兼用果树。目前中国拥有世界98%以上的枣树资源和几乎全部的枣产品国际贸易,也是近千万中国农民的主要经济来源[1]。鉴定枣品质优劣决定对该品种枣的处理方向,包括枣品种
4、的选育、改良以及消费者选取适合自己需要的枣果实具有决定性作用。 影响枣果实品质的因子有很多种,但是影响最终决策目标的因素并非是全部因素,找出决定性因素以降低数据处理规模,提高数据分析效率具有重要作用。对影响枣果实品质的因子数据进行预处理,是将枣专家在果园多次尝试并记录下的文本信息以及给出的鉴定结果与计算机技术相结合,通过整理庞大的数据,找出决定枣果实品质的关键因子,并建立数据库,为枣农以及消费者了解任何品种的枣果实提供参考。 1因子数据预处理的必要性 数据库通常有一个共同的特点,即存在大量的不完整的、含噪声的和不一致的数据[2]。为了使这些数据能够符合数据分析的要求,提高数据分析
5、的效率和得到清晰的结果,必须进行数据的预处理。 对枣果实的因子数据进行预处理,目的是将专家考察后记录的文本信息转化为便于处理的数据。由于实践考察后专家手工记录的原始数据,没有经过系统的整理,规范化程度比较低,例如记录多为:胜似红珍珠、果面平整、酸甜可口等,因子名称不规范、因子属性值不明确、而且还有许多空白值。所以对枣果实品质鉴定的因子数据进行预处理是非常必要的。 专家调查的数据量大、需要处理的原数据为文本信息、后期处理(比如品种推荐、枣品质鉴定)等需要数字化、规范化的数据,并且调查工作具有持续性、周期性(专家每年调查数据以及果农或者消费者咨询专家的建议时提供的数据),所以数据预处理
6、在整个决策系统中占有60%的时间,这也给因子数据的预处理带来了更大的难度和更多的工作量,所以数据预处理需要自动化。 2因子数据预处理 本研究数据预处理包含过滤噪声数据、填充空白数据、文本信息数字化、数据转化与分析以及数据验证(图1)。 2.1过滤对噪声数据预处理 本研究的源数据是不同专家到果园进行多次实践品尝记录下的,由于每个人记录习惯的不同,所以大多因子名称以及因子属性的表述不一致,而且手工记录导致噪声数据有很多。只有将这些噪声数据进行有效的处理,后期的决策才会更加准确。 专家记录考察数据的过程中由于节约时间,有许多简化,例如“酥脆”一词,这个词是描述枣果实的两个特征――酥
7、松与清脆。显然使用这个词描述单独的枣果实特征是不合适的;而且在原样本数据中有大量的不规范因子属性名称,例如纵裂、横裂,其实是描述枣果实裂果率;规范因子属性名称使后期枣农以及消费者对枣果实进行鉴定时输入的属性特征更加准确。
此文档下载收益归作者所有