web数据挖掘在个性化搜索技术上的研究

web数据挖掘在个性化搜索技术上的研究

ID:33179566

大小:2.20 MB

页数:53页

时间:2019-02-21

web数据挖掘在个性化搜索技术上的研究_第1页
web数据挖掘在个性化搜索技术上的研究_第2页
web数据挖掘在个性化搜索技术上的研究_第3页
web数据挖掘在个性化搜索技术上的研究_第4页
web数据挖掘在个性化搜索技术上的研究_第5页
资源描述:

《web数据挖掘在个性化搜索技术上的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连交通大学硕士学位论文Web数据挖掘在个性化搜索技术上的研究姓名:王丽申请学位级别:硕士专业:计算机应用技术指导教师:曹家琏20091212摘要摘要互联网是为用户提供信息交换、共享而发展起来的Internet应用。人们上网的主要目的是查洵信息。由于Intemet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统⋯一搜索引擎成为帮助人们上网获取信息的主要工具。这些搜索引擎在给人们带来很大便利的同时也暴露出许多问题。搜索引擎返回给用户的检索结果数量越来越大,人们越来越难以找到真正符合自己意图的信息。传统搜索引擎缺乏个性化的局限性日益突出,单单依靠传统搜索引

2、擎己经无法满足人们的需求,因此,搜索引擎的个性化研究成为当今Interact信息检索方面的一个重要课题。本文首先对Web挖掘的理论基础及个性化搜索引擎进行了介绍,其中包括Web数据挖掘分类、Web数据挖掘在个性化搜索中的应用、搜索引擎的分类及检索效果主要性能指标、个性化搜索引擎的基本类型和涉及的主要技术等。其次,针对Google给出的PageRank排序算法的一个缺陷,即同一页面的所有链出页面分得该页面相同权重的PageRank值,研究了给出的具有针对性的新算法,即使得同一页面的链出页面根据自身页面的重要性分得该页面不同权重的PageRank值。再次,本文探讨了用户兴趣模型,包

3、括用户兴趣建模常用方法、用户兴趣模型技术等。最后,设计了个性化搜索引擎模型,思想是将Web挖掘和PageRank技术结合起来,建立用户兴趣模型,引入到个性化搜索引擎中,使检索结果更加符合用户的实际需要。在论文的最后,总结了本文的研究工作与存在的不足,并对进一步的研究工作进行了分析和展望。关键词:Web数据挖掘;PageRank算法;用户兴趣模型;个性化搜索引擎人连交通人学]:学硕斗j学位论文AbstractTheInternetisapplicationprovideinformationexchangetousers,sharinganddeveloping.Themainp

4、urposeofaccesstOtheIntemetisqueryinformation.AstheinformationhascharacterizeontheInteractthathasalargenumber,strongdisorder,Repeatability,avarietyofinformationretrievalsystemsontheInteract-searchenginebecomethemaintooltoobtaininformationonIntemettohelppeople.Thesesearchengineshasbroughtgreat

5、conveniencetOpeoplebutalsoexposedmanyproblems.Searchenginereturnedtotheuseralargenumberofsearchresults,itisincreasinglydifficulttofindrealintentionsinlinewiththeirowninformation.Thelimitationoftraditionalsearchenginelackofpersonalizedhavebecomeincreasinglyprominent,onlyrelyontraditionalsearc

6、hengineshavebeenunabletomeetpeople’Sneeds,therefore,thepersonalizationresearchofsearchenginebecomeanimportantsubjectfortOday’SInternetinformationretrieval.Inthispaper,first,thetheoreticalfoundationofWebminingandpersonalizedsearchengineswegeintroduced,includingWebdataminingclassification,Webd

7、ataminingintheapplicationofpersonalizedsearch,theclassificationofsearchengineandkeyperformanceindicatorsofretrieval,thebasictypeofpersonalizedsearchengineandrelatedtomainlytechnology.Second,givenGoogle’SPageRankforthesortingalgorithmofadefect,thati

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。