基于社会化标注的查询扩展研究

基于社会化标注的查询扩展研究

ID:37377858

大小:3.76 MB

页数:53页

时间:2019-05-22

基于社会化标注的查询扩展研究_第1页
基于社会化标注的查询扩展研究_第2页
基于社会化标注的查询扩展研究_第3页
基于社会化标注的查询扩展研究_第4页
基于社会化标注的查询扩展研究_第5页
资源描述:

《基于社会化标注的查询扩展研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于社会化标注的查询扩展研究TheStudyofQueryExpansioninSocialTagging作者姓名:王浩学科、专业:盐篡扭廛旦堇苤学号:20909337指导教师:王鳇副塾拯完成日期:2013.05大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明㈣㈣㈣㈣0㈣Y2417793作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志对本

2、研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:作者签名:善孑知兹私撂彪群兰钓擒百功工潞日期:业年』月上日大连理工大学硕士学位论文摘要社会化标注是用户产生的用于描述网络资源的关键词,区别于传统的自上而下的信息传播方式,社会化标注来源于广大的互联网用户,作为一种新兴的重要的信息资源,能够与广大的互联网用户分享,充分体现了Web2.0的精神。随着Web2.0的发展,许多网站允许用户创建并分享标签,与此同时,社会化标注也引起了研究者越来越多的关注,很多研究表明社会化标注能够用于改善信息检索。但是由于现实中的数据往往有缺陷,尤其是当

3、社会化标注数据稀疏,或者遇到许多无效标注的时候,信息检索的改善效果并不理想。为了解决以上问题,本文探索了两种方法用于扩展和评估社会化标注,从而改善查询扩展的质量:一是JaccardSimRank算法。当碰到稀疏的社会化标注数据的时候,传统的Cosine相似度和Jaccard系数几乎无效。为了解决数据稀疏而提出的基于图结构的SimRank算法,因为没有对社会化标注系统中的信息进行充分的利用,导致对查询词进行扩展的效果并不十分理想。本文提出了改进的JaccardSimRank算法,能够更直观地描述标签词之间的相似度,并利用相似度算法为原始的查询词提供更精确的扩展词,从而提高检索效果。二是

4、社会化标注质量评测策略。该算法基于用户标注的优劣可以被评估这一假设,因为一个用户的社会化标注能够被其他用户评价,通过投票的方式对标签进行评估,得到票数最多标签词可以认为为是最适合这个网络资源的标签。不仅标签被加以评估,提供合适标签词的用户也会获得一个相应的加权值,标签所关联的网络资源也会获得相应的加权值。利用加权值,可以在一定程度上排除机器产生的无效的自动标注,从而改善信息检索的质量。本文的实验数据集是从Bibsonomy网站上抽取的真实数据集,采用提出的两种改进的方法对数据集进行测试,通过对余弦相似度、Jaccard系数、SimRank算法和JSR算法的查询扩展结果进行对比,对实验

5、结果进行评价,试验结果表明,本文提出的两个算法和传统相法相比,有效的提高了查询扩展的质量。关键词:查询扩展;社会化标注;SimRank;相似度大连理工大学硕士学位论文目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.IAbstract⋯...⋯⋯⋯⋯..⋯.⋯...⋯.......⋯⋯⋯⋯⋯⋯.....⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯II1绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯l1.1研究背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11.2查询扩展技术的研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6、⋯⋯⋯⋯⋯⋯⋯11.3本文工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.4论文的结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯32查询扩展的相关技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一52.1查询扩展⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯52.1.1基于关键词的查询扩展技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯52.1.2语义概念查询扩展技术⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯62.2信息检索模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2.1布尔模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2.2向量空间

7、模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2.3概率模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.2.4统计语言模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯102.3本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.103社会化标注⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯l13.1社会化标注简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1l3.2用户标注行为的研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。