基于群体特性的搜索方法研究

基于群体特性的搜索方法研究

ID:36422886

大小:7.34 MB

页数:66页

时间:2019-05-10

基于群体特性的搜索方法研究_第1页
基于群体特性的搜索方法研究_第2页
基于群体特性的搜索方法研究_第3页
基于群体特性的搜索方法研究_第4页
基于群体特性的搜索方法研究_第5页
资源描述:

《基于群体特性的搜索方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉理工大学硕士学位论文基于群体特性的搜索方法研究姓名:白瑾申请学位级别:硕士专业:计算机科学与技术指导教师:刘东飞201104摘要Intemet的普及和应用十分迅速,已成为人们获取信息和知识的重要途径。互联网体系结构具有开放、异构和分布式等特点,互联网上的信息具有海量、冗余、更新快等特点。搜索引擎是人们获取网络信息的有效途径,伴随着互联网和人们信息需求的发展,如何在互联网上获取有价值的信息还是存在很大困难。一般情况下,不同搜索用户的搜索意图和信息需求是不相同的,具有一定的特定性和互异性。传统的搜索技术中没有考虑信息需求的差异性,相同的搜索关键词,

2、返回一样的结果,搜索准确度较差,不能满足人们的信息需求。对用户兴趣特性建立用户兴趣模型,在搜索引擎中引入用户兴趣模型,能够达到提高搜索准确度的目的。针对传统搜索引擎系统的局限性,人们信息需求的特性,本文进行了基于群体特性用户兴趣模型的搜索引擎技术研究。主要研究工作有以下几个方面:’(1)分析研究通用搜索引擎的原理、结构和组成,以及发展现状,重点对存在的问题进行了深入分析,为后面的研究奠定了基础。(2)构建了基于群体特性的用户兴趣模型,设计了基于用户兴趣模型的搜索引擎体系框架。对用户兴趣模型进行了重点研究,研究了用户兴趣模型的表示和建立技术。在分析改

3、进模糊ISODATA算法等文本聚类算法的基础上,提出了用户兴趣模型的更新算法,实现模型对用户群体兴趣特征的实时、准确反映。(3)研究了搜索意图分析和扩展的相关技术,给出了分析扩展算法,对于提高搜索效率,效果比较明显。(4)研究了搜索引擎排序算法,提出了基于用户模型的全局加权相关度排序算法,算法结合用户兴趣模型计算搜索关键词和搜索结果的相似度,依据相似度对结果进行排序,提高排序效果。(5)设计了基于群体特性用户兴趣模型的搜索引擎原型系统,划分了功能模块。利用Lucene和Java等开源软件和工具,实现了系统主要功能。重点对系统各项功能进行了实验研究,

4、验证了设计思路和各算法的合理性,有效性。实验表明,在搜索引擎中加入具有群体特性的用户兴趣模型,搜索引擎的性能有一定的提高,说明研究思路合理,相关算法是有效的,同时方法存在着很多不足之处,有待于进一步的改进。关键词:搜索引擎,用户兴趣模型,群体特性,搜索意图扩展,搜索结果排序AbstractThePopularizationandapplicationofIntemetisveryrapidly,itisbecomingallimportantwayofobtaininginformationforpeople.TheInternetarchitec

5、turehasthecharactersofopen,heterogeneousanddistributed,andtheinformationinIntemethasthecharactersofmassive,redundant,updatesoonand,SOon.Thesearchengineisoneofthemosteffectivewaytoobtaininformation,butwiththedevelopmentofInternetanduser'sinformationrequirements,itisstillhasgrea

6、tdifficulttoobtainvaluableinformationontheInternet.Generally,differentUS髓'Shasdifferentsearchintentionandinformationrequirements,andithasacertainspecificandexclusive.Generalsearchenginetechnologydoesnottakeintoaccountthedifferentinformationneeds,tothesamesearchkeywords,itretur

7、nthesameresults,thesearchaccuracyispoor)couldnotmeetpeople'sinformationneeds.Accordingtotheuser'sinteresttoestablishuscfmterestmodel,introducestheUSerintcrcstmodelintothesearchenginecanachievethegoalofenhancesthesearchaccuracy.Inviewoftraditionalsearchenginesystem’slimitMio玛th

8、echaracteristicofpeoplc.sinformationneeds,thisarticlecarriedo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。