欢迎来到天天文库
浏览记录
ID:57745698
大小:5.57 MB
页数:63页
时间:2020-03-27
《搜索引擎结果冗余信息消解算法的研究与应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、学校代号:10255学号:2081078搜索引擎结果冗余信息消解算法的研究与应用ResearchandApplicationofanEliminationAlgorithmforRedundantInformationonSearchEngine’SResult学科专业:计算机系统结构作者:郭茜指导教师:朱明答辩日期:2011年1月13日东华大学计算机科学与技术学院CollegeofComputerScienceandTechnologyDongHuaUniversity东华大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本
2、人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:71011年、IZ锄勃/月东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文
3、。保密口,在——年解密后适用本版权书。本学位论文属于/不保密回。学位论文作者签名:锄彩日期:矽ff年f月哆日指导教师签名:榭日期:跏f/年1月搜索引擎结果冗余信息消解算法的研究与应用搜索引擎结果冗余信息消解算法的研究与应用摘要目前随着网络信息的爆炸式增长以及信息多元化的发展,快速有效地获取所需的信息变得越来越困难,通用搜索引擎已不能适应用户对信息检索的准确性要求,消除搜索引擎结果中的冗余信息正成为研究热点之一。聚类技术是消解搜索引擎结果中冗余信息的关键技术之一,对于提供搜索结果的关联性和搜索信息的有效性起着至关重要的作用。本文作者的主要研究工作概述如下:1)分析
4、了搜索引擎的发展现状和当前消解冗余信息的不足之处,通过构建消解搜索引擎结果中冗余信息的技术框架,研究了消解冗余信息的方法。2)设计和实现了关于搜索引擎结果信息的分词处理,特征提取和消解冗余信息的处理流程。其中,分词处理采用改进的正向最大匹配切分(MM)算法并进行歧义校正,特征提取采用向量空间模型进行特征词表示。3)针对基于中心点的K.Means聚类算法的不足,提出了改进算法,并结合搜索引擎评价标准对该改进算法的效果进行了评价。实验表明,改进后的算法可以有效地改善聚类的性能,提高冗余消解的效率。本文研究和实践的消解搜索引擎结果冗余信息的算法,技术路线及其实现过程在
5、提高搜索引擎反馈信息的准确性和查询效率方面具有很好的可借鉴性。关键词:搜索引擎;冗余消解;分词;特征提取;聚类搜索引擎结果冗余信息消解算法的研究与应用ResearchandApplicationofanEliminationAlgorithmforRedundantInformationonSearchEngine’SResultAbstractNowadays,withtheexplosiongrowthofnetworkinformationandthedevelopmentofinformationdiversification.itismoreandmo
6、redi伍culttoobtaininformationquicklyandeffectively,generalsearchenginesdidnotadapttotheaccuracyrequestofusers,eliminatingtheredundantinformationofsearchresultisbecomingoneofhotspotsforstudy.Clusteringtechnologyisthekeytechnologytoeliminateredundantinformationofsearchengine’Sresult,whi
7、chalsoplaysallimportantroleinrelevanceofsearchresultsandeffectivenessofsearchinformation.Theprimaryresearchworkmadebyauthorofthispaperissummarized瓠thefollowings:1)Thispaperanalyzesthedevelopmentofthesearchenginesandthedeficienciesofeliminatingalgorithmsfortheredundantinformation,stud
8、iestheelimin
此文档下载收益归作者所有