欢迎来到天天文库
浏览记录
ID:33179566
大小:2.20 MB
页数:53页
时间:2019-02-21
《web数据挖掘在个性化搜索技术上的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大连交通大学硕士学位论文Web数据挖掘在个性化搜索技术上的研究姓名:王丽申请学位级别:硕士专业:计算机应用技术指导教师:曹家琏20091212摘要摘要互联网是为用户提供信息交换、共享而发展起来的Internet应用。人们上网的主要目的是查洵信息。由于Intemet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统⋯一搜索引擎成为帮助人们上网获取信息的主要工具。这些搜索引擎在给人们带来很大便利的同时也暴露出许多问题。搜索引擎返回给用户的检索结果数量越来越大,人们越来越难以找到真正符合自己意图的信息。传统搜索引擎缺乏个性化的局限性日益突出,单单依靠传统搜索引
2、擎己经无法满足人们的需求,因此,搜索引擎的个性化研究成为当今Interact信息检索方面的一个重要课题。本文首先对Web挖掘的理论基础及个性化搜索引擎进行了介绍,其中包括Web数据挖掘分类、Web数据挖掘在个性化搜索中的应用、搜索引擎的分类及检索效果主要性能指标、个性化搜索引擎的基本类型和涉及的主要技术等。其次,针对Google给出的PageRank排序算法的一个缺陷,即同一页面的所有链出页面分得该页面相同权重的PageRank值,研究了给出的具有针对性的新算法,即使得同一页面的链出页面根据自身页面的重要性分得该页面不同权重的PageRank值。再次,本文探讨了用户兴趣模型,包
3、括用户兴趣建模常用方法、用户兴趣模型技术等。最后,设计了个性化搜索引擎模型,思想是将Web挖掘和PageRank技术结合起来,建立用户兴趣模型,引入到个性化搜索引擎中,使检索结果更加符合用户的实际需要。在论文的最后,总结了本文的研究工作与存在的不足,并对进一步的研究工作进行了分析和展望。关键词:Web数据挖掘;PageRank算法;用户兴趣模型;个性化搜索引擎人连交通人学]:学硕斗j学位论文AbstractTheInternetisapplicationprovideinformationexchangetousers,sharinganddeveloping.Themainp
4、urposeofaccesstOtheIntemetisqueryinformation.AstheinformationhascharacterizeontheInteractthathasalargenumber,strongdisorder,Repeatability,avarietyofinformationretrievalsystemsontheInteract-searchenginebecomethemaintooltoobtaininformationonIntemettohelppeople.Thesesearchengineshasbroughtgreat
5、conveniencetOpeoplebutalsoexposedmanyproblems.Searchenginereturnedtotheuseralargenumberofsearchresults,itisincreasinglydifficulttofindrealintentionsinlinewiththeirowninformation.Thelimitationoftraditionalsearchenginelackofpersonalizedhavebecomeincreasinglyprominent,onlyrelyontraditionalsearc
6、hengineshavebeenunabletomeetpeople’Sneeds,therefore,thepersonalizationresearchofsearchenginebecomeanimportantsubjectfortOday’SInternetinformationretrieval.Inthispaper,first,thetheoreticalfoundationofWebminingandpersonalizedsearchengineswegeintroduced,includingWebdataminingclassification,Webd
7、ataminingintheapplicationofpersonalizedsearch,theclassificationofsearchengineandkeyperformanceindicatorsofretrieval,thebasictypeofpersonalizedsearchengineandrelatedtomainlytechnology.Second,givenGoogle’SPageRankforthesortingalgorithmofadefect,thati
此文档下载收益归作者所有