基于社会化标注的个性化检索方法-研究

基于社会化标注的个性化检索方法-研究

ID:31981066

大小:1.74 MB

页数:45页

时间:2019-01-30

基于社会化标注的个性化检索方法-研究_第1页
基于社会化标注的个性化检索方法-研究_第2页
基于社会化标注的个性化检索方法-研究_第3页
基于社会化标注的个性化检索方法-研究_第4页
基于社会化标注的个性化检索方法-研究_第5页
资源描述:

《基于社会化标注的个性化检索方法-研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据基于社会化标注的个性化检索方法研究4.2网页分类知识介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.274.2.1网页分类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..274。2.2网页分类的结构和特性⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..274.3基于社会化标注和网页分类计算用户相似度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.284.4基于社会化标注和网页分类的用户质量计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.294.4.1用户质量定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一294.4.2用户质量算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..304.5社会化标注扩展及文档

2、得分计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.324.5.1社会化标注扩展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一324.5.2文档得分计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯~334.6实验设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.334.6.1数据集⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..334.6.2评价方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..344.7实验结果及分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.344.7.1阈值选择⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..344.7.2结果对比及分析

3、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一354.8本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.36结论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一37参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯38攻读硕士学位期间发表学术论文情况⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..42致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯~43大连理工大学学位论文版权使用授权书⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..44万方数据大连理工大学硕士学位论文1绪论1.1研究背

4、景近年来,Web2.0的应用在社会上越来越普及,比如社会化标注系统、电子商务系统以及个性化网络,这些都不断渗入我们生活的方方面面。而我们所处的网络,也正朝着个性化网络迈进。在这样的个性化网络中,用户可以通过标注、评论等多种方式在在线网页上留下自己的观点。作为其中比较重要的一种,用户在网络中的标注行为经常对网页内容起到了很好的概括.并反映了用户对网页的想法和态度。这样的标注同时也是对网络中丰富资源的分类,并且这种分类不需要具有系统知识的专家进行维护,因此这种标注称为社会化标注(socialannotation),该分类方法称为大众分类(folksonomy)‘1.3

5、】,而提供这种标注功能的系统称为社会化标注系统(SocialAnnotatingSystem)或大众分类系统(FolksonomySystem),例如,Flikr【41,Del.icio.USl5J,Bibsonomy[6】等都是网络中为人熟知的社会化标注系统。随着社会化标注系统的不断普及和日趋流行,其所具有的一些良好特性使其在信息检索领域中的应用也越来越广测^lo】。与此同时,随着用户网络检索能力的上升及信息检索技术的成熟,用户对于信息检索服务准确性的要求也越来越高。然而,用户在通常情况下提交的查询都比较简短精炼,为其查询目的的高度概括,并不能完全准确地表达真正

6、的需求。同时,每个用户都有其独有的兴趣,其在检索的时候,往往与其兴趣相关。即使查询完全相同,也可能因为用户的兴趣不同而需要返回不同的结果。为了满足用户这种个性化的需求,个性化检索技术应运而生【11

7、,并且逐步发展。综合来看,个性化检索技术目前的关注点分别都眼于用户兴趣的构建上。最开始的研究普遍使用用户检索的历史作为兴趣的来源[12.”】,随后一些学者开始使用外部资源对用户兴趣进行挖掘。例如,网页中的本体资源【14。引、网页分类信息【16-171以及用户的眼动轨迹[18】等。而在用户兴趣使用的方法上面,又分为了查询扩展119】和重排序【20】两种方法。2008年,X

8、u等人【2IJ的研究指出并验证了基于用户社会化标注构建的用户兴趣能够有效提高个性化检索的效果,为使用外部资源的个性化检索技术指出了一个新的方向。然而,在真实的网络中,每个用户能够浏览和标注的网页总是有限的,并且该数量对比于网页总数总是极小的,因此社会化标注总是稀疏的。为了解决这个问题,Xu等人【22】提出了使用社会化标注计算用户相似度并进而扩展标注信息的方法,有效解决了标注的稀疏性问题。但由于存在一些诸如“fun”等网页通用的标注、并且用户给出标注时没有约定的规则,往往带有一定的随意性,所以计算用户相似度时不能简简单单考虑标签万方数据基于社会化标注的个性化检索方法

9、研究的出现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。