欢迎来到天天文库
浏览记录
ID:37046876
大小:1.49 MB
页数:66页
时间:2019-05-15
《多值关联规则挖掘算法的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文多值关联规则挖掘算法的研究与应用作者姓名刘芳学科专业计算数学指导教师吴广潮副教授所在学院数学学院论文提交日期2018年4月StudyandApplicationofQuantitativeAssociationRuleMiningAlgorithmADissertationSubmittedfortheDegreeofMasterCandidate:LiuFangSupervisor:Prof.WuGuangchaoSouthChinaUniversityofTechnologyGu
2、angzhou,China摘要随着互联网技术的快速发展,数据信息呈现爆炸性增长。为了从大量的数据中发现隐藏的、有价值的信息,数据挖掘技术成为重要的研究领域。关联规则挖掘作为数据挖掘中的重要算法,在很多方面已经取得了丰硕的成果。但是随着大量数据及各种类型数据的出现,对关联规则挖掘技术提出了更高的要求。关联规则挖掘技术按处理对象的不同可以分为布尔型关联规则和多值型关联规则。在多值关联规则挖掘过程中,通常是首先进行多值属性离散化,再通过布尔型关联规则挖掘算法进行处理。然而,多值属性离散化通常伴随着区间
3、划分的问题,划分个数过大或过小都会导致结果的改变。本文以多值属性离散化问题为切入点,主要研究内容如下:(1)针对多值属性离散化中存在的问题,提出一种改进的ISODATA(IterativeSelf-organizingDataTechniquesAlgorithm)聚类算法。它可以自动进行区间划分,并基于密度自动选取初始聚类中心,保证聚类结果的稳定性。同时,可以根据聚类有效性指标确定算法控制参数和收敛条件。实验表明该算法相对于原算法具有更高的准确率和稳定的性能。(2)针对布尔型关联规则挖掘过程中
4、,Apriori算法的算法效率低、产生候选项集过多、未考虑用户需求等问题,提出基于约束和压缩矩阵的改进算法。一方面设置规则约束,针对用户感兴趣的规则进行挖掘;另一方面将事务数据库转换为矩阵进行处理,提高算法效率。通过实例测试和实验分析发现,该算法相对于Apriori算法有更高的效率。(3)基于改进的多值关联规则算法对学生满意度影响因素进行研究。采用“中国大学生学习与发展追踪研究”调查数据,通过数据预处理、建立模型和实验结果分析,探索影响学生满意度的主要因素。结果发现,顾客期望对学生满意度的影响最
5、大,其它因素对学生满意度也有不同程度的影响。最后,针对学校如何改进自身服务、有效提高大学生满意度提出切实可行的建议。关键词:多值关联规则;离散化;ISODATA;Apriori算法;学生满意度IAbstractWiththerapiddevelopmentofInternettechnology,datainformationhasgrownexplosively.Inordertofindhiddenandvaluableinformationfromalargenumberofdata,da
6、taminingtechnologybecomesanimportantresearchfield.Asanimportantalgorithmindatamining,associationrulemininghasachievedfruitfulresultsinmanyaspects.However,withtheemergenceofalargenumberofdataandvarioustypesofdata,theminingtechniqueofassociationrulesis
7、moredemanding.AssociationruleminingtechnologycanbedividedintoBooleanassociationruleandquantitativeassociationruleaccordingtothedifferentprocessingobjects.Intheminingprocessofquantitativeassociationrule,itisusuallyfirsttodiscretethequantitativeattribu
8、te,andthentheBooleanassociationruleminingalgorithmisusedtodealwithit.However,thediscretizationofquantitativeattributesisusuallyaccompaniedbytheproblemofintervaldivision,whichcanleadtothechangeoftheresultwhenthenumberistoolargeortoosmall.Inthispaper,q
此文档下载收益归作者所有