欢迎来到天天文库
浏览记录
ID:33084720
大小:1.85 MB
页数:73页
时间:2019-02-20
《一种基于关联规则挖掘的查询扩展算法及应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP315论文编号:102870912-s063学科分类号:120100硕士学位论文一种基于关联规则挖掘的查询扩展算法及应用研究研究生姓名戚璐瑶学科、专业管理科学与工程研究方向管理信息系统与企业信息化指导教师马静教授南京航空航天大学研究生院经济与管理学院二О一二年三月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofEconomyandManagementAKindofQueryExpansionAlgori
2、thmBasedonAssociationRuleMiningandResearchonApplicationAThesisinManagementScienceandEngineeringbyQiLuyaoAdvisedbyProf.MaJingSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofManagementMarch,2012承诺书本人声明所呈交的硕士学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中
3、特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京航空航天大学或其他教育机构的学位或证书而使用过的材料。本人授权南京航空航天大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要在当今这个信息爆炸的时代,信息迷失、信息过量已成为许多人在进行查询时面对的问题。而随着互联网使用的普及,搜索引擎作为一种查询工具,已经应用的越来越广泛了
4、。但是,目前大部分搜索引擎的技术是依赖于关键词进行检索,因此常常会返回大量无用信息,致使查询效率低下。因此,如何通过关联规则挖掘,提高扩展查询中的查全率和查准率,已经成为近年来研究的一大热点和难点。关联规则挖掘是数据挖掘中最基本、也是最重要的功能。通过关联规则挖掘发现更多的查询词,从而提高查询扩展的效率,是查询扩展的主要研究方向之一。本文首先对关联规则、关联规则挖掘及查询扩展的相关基础理论进行了梳理;然后着重对关联规则挖掘各个算法进行了深入研究,并对FP-growth算法的性质与优缺点进行了剖析;在此基础上,本
5、文设计了一种基于关联规则挖掘的查询扩展算法,新算法对FP-growth中挖掘频繁模式的方法进行了改进,降低了时间复杂度,并设计了一个基于网页标记信息的查询扩展模型,将新发现的关键词应用到查询扩展中,该模型通过对网页关联度进行量化表示,从而对扩展得到的结果集进行筛选。本算法通过实现关联规则挖掘-扩展查询的循环,在保证了关联规则挖掘效果的基础上,提高了查询扩展算法的查准率,最后通过实验证明该算法有效。关键词:查询扩展,关联规则挖掘,向量空间模型,FP-growthi一种基于关联规则挖掘的查询扩展算法及应用研究Abs
6、tractAtthistimeofinformationexplosion,ithasalreadybecomeaproblemthatinformationistoomuchandmesswhenpeoplewantfindanswersfromtheinternet.Asaquerytool,thesearchingenginehasbeenappliedmoreandmorewidelywiththepopularityofInternet.However,asthetechniquewhichmosto
7、fthesearchengineuseisdependentonthekeyword-basedsearch,thereoftenreturnsalotofuselessinformation,resultinginlowqueryefficiency.Inrecentyears,howtoimprovetheprecisionandrecallofqueryexpansionthroughtheassociationrulesmining,hasbecomeahotanddifficultresearchpr
8、oblem.Theassociationruleminingisthemostimportantandthemostbasicfunctionsindatamining.Therefore,howtofindmorekeywordsthroughassociationruleminingtoimprovetheefficiencyisoneofthemainresearchdirect
此文档下载收益归作者所有