基于神经网络的网页排序学习算法研究

基于神经网络的网页排序学习算法研究

ID:18017802

大小:4.04 MB

页数:73页

时间:2018-09-12

基于神经网络的网页排序学习算法研究_第1页
基于神经网络的网页排序学习算法研究_第2页
基于神经网络的网页排序学习算法研究_第3页
基于神经网络的网页排序学习算法研究_第4页
基于神经网络的网页排序学习算法研究_第5页
资源描述:

《基于神经网络的网页排序学习算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学硕士学位论文基于神经网络的网页排序学习算法研究姓名:吴桂宾申请学位级别:硕士专业:计算机软件与理论指导教师:汤庸;舒忠梅20090506基于神经网络的网页捧序学习算法研究摘要论文题目:基于神经网络的网页排序学习算法研究专业:计算机软件与理论硕士生:吴桂宾指导教师:汤庸教授、舒忠梅讲师摘要随着互联网的发展,搜索弓l擎的重要性与日俱增。如何有效的查找需要的信息是非常关键的,一个好的搜索引擎可以极大的节省用户查找信息的时间。搜索引擎包含多个组成部分,其中网页排序是搜索引擎设计的核心问题,排序结果的准确率直接决定了搜索引擎的性能和用

2、户体验。信息检索领域中有许多的网页排序算法,其中以样本对级别方法的模型应用比较广泛。在样本对级别方法的模型中,有一类是基于神经网络结构的,其中以RankNet算法比较具有代表性。RankNet算法虽然简单易用,却也存在着样本对级别方法本身固有的不足:查询之间不具备平等性;每一个文档序对是平等的,各文档序对之间没有优先关系。这是与网页评价标准的原则相违背的。本文提出了对基于样本对级别方法的神经网络排序算法的改进思路。文章以RankNet算法为例,对其进行了改进。一是构造了新的误差函数,对误差函数加一入查询的平等性信息,并结合神经网络的

3、特点,分析了不对其加入文档位置权重信息的原因;二是对神经网络的训练过程也进行了改进,通过扩充训练样本集,使其加入查询的平等性信息和文档位置权重信息,使模型的学习过程更符合网页评价标准的原则,以达到提高排序精度的目的。本文在LETOR(TREC2003,TREC2004,OHSUMED)数据集上进行了实验,分别利用2层神经网络模型和3层神经网络模型来进行学习。并且通过交叉校验的方法来避免过拟合。实验采取了多个评估指标进行衡量。实验结果表明改进算法比起原有的RankNet算法能够有效的提高网页排序的精度。关键词:网页排序、样本对级射、查

4、询平等性、文档位置权重、神经网络基于神经网络的网页排序学习算法研究AB锄ACTTitle:ResearchonLearningtoRankforWebSearchBasedonNeuralNetworkMajor:ComputerSoftwareandTheoryName:缪台GuibinSupervisor:ProfessorTangYongoLecturerShuZhongmeiABSTRACTAsIntemetdevelopsrapidly,searchenginebecomesmoreandmoreimportant.It’

5、Scriticaltosearchinformationeffectively,thereforeagoodsearchengineCansaveusers’time.Searchengineincludesanumberofcomponents,andthekeypoiIltispage珊蝇theresultofpagerankingdeterminesthesearchengine’SperformanceandUsel"Stexperience.Therealemanypagerankingalgorithmsinthefie

6、ldofinformationretrieval,whilethemodelsusingpairwisemethodaremorepopular.Inthesemodels,somearebaseonneuralnetwork,andRankNctisoneofthesemodels.RankNetissimple,butalsohasshortcomings:queriesalenotequal,anddocumentpairsareequal,whichiscontrarytotheprincipleofpagerankinge

7、valuationcriteria.Thispaperproposesmethodstoimprovepagerankingalgorithmsbaseonpall'wiseandneuralnetwork,andusesRankNetasanexampletoillustrate.Firstlyitdesignsanewlossfunction晰tllinformationaboutequalityofqueries,andanalyzeswhynotincludinginformationaboutweightsofdocume

8、nts'positions.Secondlyitimprovesthetrainingprocessofneuralnetwork,byexpandingthesizeoftrainingsampleset,makingthetrai

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。