基于用户兴趣的个性化信息检索技术研究new

基于用户兴趣的个性化信息检索技术研究new

ID:33801652

大小:5.87 MB

页数:72页

时间:2019-03-01

基于用户兴趣的个性化信息检索技术研究new_第1页
基于用户兴趣的个性化信息检索技术研究new_第2页
基于用户兴趣的个性化信息检索技术研究new_第3页
基于用户兴趣的个性化信息检索技术研究new_第4页
基于用户兴趣的个性化信息检索技术研究new_第5页
资源描述:

《基于用户兴趣的个性化信息检索技术研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、北京机械工业学院硕士学位论文基于用户兴趣的个性化信息检索技术研究姓名:谢宇申请学位级别:硕士专业:计算机应用技术指导教师:张仰森20080101摘要随着Web信息的爆炸性增长,如何快速、准确地从浩瀚的信息资源中寻找所需信息已经成为困扰人们的一大难题。传统搜索引擎技术满足了人们一定的需求,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的用户个性化的需求。用户个性化检索系统就是针对这个问题而提出来的。用户个性化信息检索系统的研究目标在于充分利用用户的个性化信息,通过用户的兴趣来引导信息的采集,充分利用网络信息,以更好地服务用户的个性化需求。围绕着用户个性化信息检索

2、技术,论文的主要工作包括以下几个方面:(1)用户兴趣个性化信息的获取。分析了用户兴趣个性化信息的收集、表示和更新。提出了从显式和隐式两方面获得用户兴趣个性化信息的方法,此种方法可以比较全面的获得用户兴趣。(2)网页结构分析及内容的提取。提出了将网页转化为DOM树的方法,通过对DOM树的遍历、分析、合并等处理过程完成对网页标题、正文、链接等信息的提取,此种方法可以获得准确率较高的网页内容信息。(3)网页内容与用户个性化兴趣相关度的判定。分析了在向量空间模型中向量相似度的计算方法,即向量内积和夹角余弦。实验结果表明向量内积方法更适合本文设计的原型系统并且取得了较好的性能。本文在

3、研究了基于用户兴趣的个性化信息检索中所涉及的各种问题的基础上,针对汽车类新闻网页领域实现了一个用户个性化检索原型系统,并在本文中提供了各个部分的详细设计方案,为进一步的研究提供了实验平台和实验数据。关键词:用户兴趣;个性化检索;搜索引擎ABSTRACTWiththeexplosivegrowthofWebinformation,howtofindinformationneededquicklyandaccuratelyfromthevastinformationresourceshasbecomeamajorproblem.Althoughtraditionaltechno

4、logiesofsearchengineCanmeetuser’sdemands,theyCan’tfulfillpersonalizedrequirementsofdifferentbackgrounds,purposesandtimesbecauseofthecharacterofcommonuse.Personalizedwebcrawlingforusersisbroughtforwardtoaddressthisissue.PersonalizedwebcrawlingforUSerSaimsatbettermeetingUSerS’personalizeddem

5、andsbytakingfulladvantageofusers’personalinformation,gatheringinformationaccordingtoUSerS’interestandmakingm11useofwebinformation.Thethesisincludesfollowingaspectsaccordingtothetechnologyofpersonalizedwebcrawlingforusers:(1)Theobtainmentofpersonalizedinformationofusers’interest.Theanalysis

6、ofcollection,expressionandupdateofUSerS’personalizedinformationofinterest.Astothecollectionandupdateofusers’personalizedinformationofinterest,itCanberealizedinexplicitorimplicitways,thismethodcanbemorecomprehensiveaccesstoUSerS’interest.(2)Theanalysisofwebpage’Sstructureandtheextractionofc

7、ontents.TochangethewebpageintotheformofDOMtree,wecanextractwebpagetitle,maintextandlinksthroughtraverse,analyzeandmergertheDOMtree.Thismethodcanbemoreaccurateaccesstowebpageinformation.(3)TheSimilaritybetweenthecontentofwebpageandusers’interest.Theanalysisofsi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。