【硕士论文】基于社会化标注的搜索引擎优化研究.pdf

【硕士论文】基于社会化标注的搜索引擎优化研究.pdf

ID:32032816

大小:3.32 MB

页数:48页

时间:2019-01-30

【硕士论文】基于社会化标注的搜索引擎优化研究.pdf_第1页
【硕士论文】基于社会化标注的搜索引擎优化研究.pdf_第2页
【硕士论文】基于社会化标注的搜索引擎优化研究.pdf_第3页
【硕士论文】基于社会化标注的搜索引擎优化研究.pdf_第4页
【硕士论文】基于社会化标注的搜索引擎优化研究.pdf_第5页
资源描述:

《【硕士论文】基于社会化标注的搜索引擎优化研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、张晖:基丁社会化标注的搜索引擎优化研究三丰两姜社会化标签作为web2.0中的一种重要技术,最显著的贡献在于完成了用户从单纯的信息接收者到主动的信息发布者的角色转换,深刻地影响着互联网上的信息传播模式。通过标签,其他网站或网民可以便捷地对信息进行分类。标签的作用类似于搜索技术中的关键字,是对信息的个性化描述。由于一般情况下无法对网络上海量的信息进行全文检索(只有功能强大的大型搜索引擎才能勉强做到),因而,具有标签的信息要比没有标签的信息更容易传播。网民通过“贴”标签来描述信息,创造易于被他人检索的信息,同

2、时也通过标签的描述来查找自己感兴趣的信息。并且由于聚合内容技术与标签技术的有机结合,标准化的信息接口降低了信息传播和信息再次加工的成本,从而降低了人们在获取个性化信息上的时间成本和经济成本。通过社会化书签,可以用多个标签作为关键字,对所喜爱的网站或网页(由网络中的书签所指向)进行标注,并与其他网民分享。社会化标签的作用类似于分类式的搜索引擎,其区别在于社会化标签的创建者是一个个普通网民,而不是什么实力雄厚的公司,因而具有更强的实效性,甚至在分类上更为准确。随着web2.O技术影响力的不断扩大,web上可

3、以挖掘的资源更加丰富。结合社会化标签来优化搜索引擎的检索效率不但能够快速准确的定位用户所需的信息,而且能够满足用户对信息个性化方面的需求,从而在很大程度上改善了用户的搜索体验,因此对这部分内容的研究也将具有重要的商业价值。论文的主要工作包括以下三个方面:(1)基于社会化标注内容的研究本文主要根据标签的语义来判断社会化标注的内容。通过比较标签与网页内容之间、标签与标签之间的语义关系,确定标签与网页内容之间、标签与标签之间的语义相似度,并根据该相似度对搜索引擎用户进行推荐,提高其对搜索的满意度,从而达到优化

4、搜索引擎的目的。(2)基于社会化标注重要性的研究衡量标签的重要性有多个方面,本文主要考察的角度是时间。通过对社会化标签网下新的数据源“标签"的时间因素加以分析和利用,从时间的角度衡量标签的新颖程度和重要程度,提出了一种新的基于社会化标签的网页排名算法2扬州大学硕士学位论文一TagRank,该算法通过对网页上用户的标注行为进行挖掘,计算标签的“热度”,从而更客观的反应出标签的真实质量,以此提高网页排名的准确性。实验证明该算法是切实有效的。(3)基于社会化标注个性化的研究基于社会化标注个性化研究不需要用户的

5、主动参与,而是通过对co—tag的数据加以过滤,对用户的标注数据聚类并获取用户的偏好,达到对tag进行层次上分类的效果,从而得到一个关于用户的特征,根据该特征向用户有的放矢的推荐,最终成功的为用户提供个性化服务。关键词:社会化标签,标签,书签,共现tag,TagRank,排名张晖:基于社会化标注的搜索引擎优化研究3一AbstractAsaVeryimponantteclllliqueofweb2.O,themostprominentcontributionofsocial锄otationsisthati

6、tsuccessfullymakeswebuserstumfrombeingsimplexinfo肌ationacceptorstoactiveinfomationpromulgatorsandprofoundlyinnuencetheinfomation把ansmittingmodeontheweb.Withtags,otherwebsitesoruserscanconvenientlyclassifytheinfomation.Thefunctionoftagsissimilartowhichoft

7、hekeywordsinsearchtechnique,it’sthepersonalizeddescriptiontoinformation.Intheusualsituation,it’sve巧hardtoc姗ythrou曲whole-lengthtextretrieval(onlythosepowerfulsearchenginescanconstrainedlyachieVe),sotheannotatedinfo姗ationaremoreeasilytransmitthantheun—anno

8、tated.WebusersdescribetheinformationandcreateeasyretrieValbytheactionofannotating,andtheycan100kfortheinf.0mationwhichtheyareinterestedinbythedescriptionoftags.Becauseoftheorganiccombinationofpolymerizationcontenttechnique

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。