web社区中话题的发现与排序

web社区中话题的发现与排序

ID:33438759

大小:2.08 MB

页数:48页

时间:2019-02-26

web社区中话题的发现与排序_第1页
web社区中话题的发现与排序_第2页
web社区中话题的发现与排序_第3页
web社区中话题的发现与排序_第4页
web社区中话题的发现与排序_第5页
资源描述:

《web社区中话题的发现与排序》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要随着Web社区的蓬勃发展,互联网正逐步跨入社区时代。Web社区以其开放性、互动性和共享性深得广大网民的喜爱,成为网民表达思想、获取信息、互相交流以及建立社交圈的主要平台。如何对社区中的资源进行分类、整理、排序,将优质、有效的资源推荐给用户,以有效地提高社区资源的分享和利用,具有重要的意义。本文面向虚拟社区领域,使用话题发现技术和话题排序技术对其话题信息进行挖掘。在话题发现中,本文通过选择合适的话题发现模型对从Web页面中提取的与话题相关的主题进行分析,然后运用单遍聚类算法实现了话题发现;在话题排序中,本文根据社区网页特点建立了话题排序特征模型,然

2、后根据话题排序得分实现了话题排序。通过话题发现和话题排序,本文实现了将社区中的信息按照所表达的主题进行归类和组织,并以有序的形式展现给用户,从而有效地管理和组织了社区中的信息,可方便用户在动态变化的社区环境下查看自己感兴趣或需要的信息。本文的创新点如下:(1)在话题发现和建立话题模型时,将主题与评论相结合,从而使获得的话题信息更为全面。(2)在话题排序时,本文通过对Web社区网页进行分析,选出话题的最近发布时间、最远发布时间、主要发布时间、被点击次数、被评论次数、当前评论增长速度,平均评论数和当前评论数作为排序特征,从而解决了传统话题排序中使用单一的

3、点击数或更新时间来进行话题排序的不足。(3)在确定权重向量时,结合用户参与评判的方法提出了一种新的确定排序特征向量权重的方法,实验证明,通过该方法得到的权重向量使本文得到了较好的排序结果。本文的实验对象为国内最大的三个社区网站:猫扑大杂烩、天涯社区和腾讯社区。实验证明,本文所提出的社区话题发现和排序方法是可行的,且排序结果良好。关键词:Web社区;主题信息提取;主题分析;话题发现;话题排序AbstractWiththevigorousdevelopmentofWebcommunities,thehateITIetisgraduallventering

4、theeraofthecommunity.WebcommunityisbecomingmoreandmorepopularwiththemajorityofInternetusers.Itsopenness,interactionandsharinghasmadethembecomeamainplatformforInternetuserstoexpressideas,aceesstomformation,mutualexchange,aswellasestablishtheirsocialcircles.Howtoclassify,arrangea

5、ndranktheresourceincommunitytorecommendtheefficientresourcetousersandimprovethesharingandusingofcommunityresourceeffectivelyhasimportantsignificance.ThispaperusestopicdetectionandtopicrankingtechniquestominetopicknowledgefromtheCommunity.Intopicdetection,thispaperanalVzethethem

6、ewhichisrelatedtothetopicintheWebpagebyselectingaappropriatetopicdetectionmodel,thenusessingle。passclusteringalgorithmtodiscoverythetopic;hatOpicranking,thispaperaccordingtothecharacteristicsofWebpagetoestablishthetopicrankingfeaturemodel,thenachievedtorankingthetopicsbythetopi

7、crankingscore.Aftertopicdetectingandtopicranking,thispaperachievedtoorganizethecommunityinformationbysubjectanddisplaytheminanorderedform,soitcanhelpusersexaminetheirinterestedorneededinformation.Theinnovationofthispaperisasfollows:(1)CombinethemewithcommentinTopicDetectionandt

8、opicmodel.thismakesthetopicinformationmorecomprehensiv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。