硕士论文-基于兴趣的博客挖掘研究

硕士论文-基于兴趣的博客挖掘研究

ID:34472249

大小:3.78 MB

页数:63页

时间:2019-03-06

硕士论文-基于兴趣的博客挖掘研究_第1页
硕士论文-基于兴趣的博客挖掘研究_第2页
硕士论文-基于兴趣的博客挖掘研究_第3页
硕士论文-基于兴趣的博客挖掘研究_第4页
硕士论文-基于兴趣的博客挖掘研究_第5页
资源描述:

《硕士论文-基于兴趣的博客挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、中国科学技术大学硕士学位论文基于兴趣的博客挖掘研究姓名:王喜玮申请学位级别:硕士专业:计算机软件与理论指导教师:王煦法20090501摘要随着Intemet的迅速发展,人们对信息的获取途径也逐渐增多,从传统的媒体转向互联网,越来越多的用户习惯通过网络来寻找他们所关心的信息。与此同时,网民也开始习惯于在网络上记录生活、展现自我,博客正是在这样的背景下出现并成长起来的。针对博客领域的挖掘研究随着博客的不断普及逐渐引起科研人员的重视,同时对于博客作者的兴趣信息的提取和利用也开始吸引学者们的目光。因而,如何以兴趣为基础,更好的对博客数据进行挖掘并得到我们需要的信息已经成为博客挖掘领域的新课题。本文针对

2、基于兴趣的博客挖掘若干问题进行了研究,主要工作包括以下几个方面:(1)将博客作者兴趣用于博客圈的自动构建。在对传统以文本内容相似度为依据的博客圈构建方法进行分析的基础上,提出了一种利用作者兴趣自动构建具有明确类别的博客圈的方法。该方法以作者的兴趣类别取代传统方法中的文本内容,通过对作者兴趣的聚类得到对应的博客圈。这样生成的圈子不仅可以明确知道其类别,而且圈内的成员都具有相同或者相似的兴趣集合,从而实现了真正意义上针对具有共同兴趣爱好的博客作者而构建的博客圈。(2)提出了基于兴趣的信任传递模型。通过将兴趣信息引入到博客社区的信任传递问题当中,利用兴趣作为领域因素来引导信任信息的传递过程,从而对传

3、统的信任传递模型进行了扩展和改进。基于兴趣的信任传递模型充分发挥了兴趣在该领域的重要作用,使得信任信息严格的在相同领域传播,其提高了信任传递的有效性和正确性,避免了许多不必要的冗余传递,在一定程度上降低了预测信任关系算法的时间复杂度。(3)提出了一种以访客评分为基础,以评论和访客兴趣为补充的博客排名方法。在已知作者兴趣的情况下引入了熟知度的概念,并结合访客评论信息对访客评分进行修正,计算出改进的博客综合得分。此外,还使作者的自身得分参与到博客得分的计算当中,进一步提高博客得分计算的可信度。实验结果表明,作者的兴趣和自身评分都对博客排名的改进起到了一定的作用,这也为博客排名研究提供了新思路。本文

4、所做研究的创新之处在于将作者的兴趣信息引入到部分博客挖掘问题摘要当中,并对传统的方法进行了改进,提出了基于兴趣的解决方案,从而为相关问题的研究提供了新思路。关键词:博客挖掘兴趣博客圈信任传递博客排名UAbstractABSTRACTTheboomingInternetprovidesincreasinglymorewaysforpeopletoobtaininformation.FromconventionalmediatoWWW:moreandmoreusersareusedtosearchinginformationtheyconcernedfromthenetwork.Atthesame

5、time,cybercitizensalebeingaccustomedtorecordingtheirlifeandshowingthemselvestothepublicontheInternet.Underthiscircumstance,bloghaseme唱edandgrownuprapidly.Researchfocusedontheblogareahasdrawnattentionfromtheresearcherswiththeprevalenceofblog.Meanwhile,scholarsbegintoshifttheirconcentrationtotheextrac

6、tionandutilizationoftheinterestofbloggers.Therefore,howtobetterminetheinformationfromblogwiththefoundationofinterestisanewresearchtopicinblogmining.Inthispaper,ourresearchworkfocusesontheinterest-relatedblogminingresearch,whichincludesthefollowingparts:(1)Introducetheblogger'sinterestintoautomatical

7、lyblogsphereconstruction.Byanalyzingtheapproachesofblogsphereconstructionaccordingtothesimilarityoftextcontent,weproposeamethodofclass-specifiedblogshpereconstructionbYusingblogger'sInterest.Thismetho

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。