bbs中主题发现原型系统的设计与实现

bbs中主题发现原型系统的设计与实现

ID:34657868

大小:460.33 KB

页数:3页

时间:2019-03-08

bbs中主题发现原型系统的设计与实现_第1页
bbs中主题发现原型系统的设计与实现_第2页
bbs中主题发现原型系统的设计与实现_第3页
资源描述:

《bbs中主题发现原型系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、"!!!!!!!!"!,!"数!据!库!与!信息!处!理!,!"!!"中主题发现原型系统的设计与实现蒋凡高俊波张敏王煦法&中国科学技术大学计算机科学与技术系!合肥!%""!.’摘要,,-论坛已经成为人们获取信息+发表言论的重要场所!它由论坛注册用户所发表的大量主题组成$论文针对传统的,,-论坛中有影响力主题计算方法的不足!通过计算词语在回帖传播链上的影响力!提出了一种根据对有影响力词语聚类的方法发现,,-论坛中具有影响力的主题$它能够使用户和论坛管理人员及时"准确和方便地提取重要的主题信息$关键词,,-主题影响力聚类

2、文章编号&""!/0%%&/&!""#’%&/"&#&/"%文献标识码1中图分类号23%&&$&#$%&’()(*+,-.$,$(/)/&0(0123&’&()."4%/$,10350-&6#&%607$34&(8!"9&)(’:)(;)09<(=0>?)(’@&(A)(’B<1)&4*56+)7*()89:875;)*+-<=*(<*6(>2*

3、=(98+76)=8(6(>>*@=F*+89<877*()D!’)<8(D=D)D896A+*6)>*6@89)85=*@=F*+*>EB+*A=D)*+*>;D*+D!1=7=(A6))?*D?8+)6A*89)+6>=)=8(6@7*)?8>G?==D5+*D*()*>!,B<6@<;@6)=(AG8+>(D=(9@;*(<*8(+*/<877*()<6(>=D<8F*+B)?*=(9@;*()=

4、6@)85=<=(,,-98+;7E6D*>8(<@;D)*+D89=(9@;*()=6@G8+>D!’)<6()=7*@B!*H6<)@B6(><8(F*(=*()@B5+8F=>*=758+)6())85=<=(98+76)=8()8;D*+6(>98+;776(6A*+$D$4E03*%%,,-!)85=

5、为载体的,,-论坛已经成为人们获取信息"发表言论的重的当前论坛中关心的热门话题(要场所#当前的网络社区中已经出现了很多目标人群细化"拥&%’没有考虑到有影响力词语在回复链上传播影响力的有自身特色且人气旺盛的社区论坛$每天的在线,,-论坛中作用$都会出现大量由论坛注册用户发表的主题信息$这些主题信息为了克服传统的有影响力主题计算方法的以上缺陷!我们的特点是%从论坛中发表的帖子之间的回复关系出发!提出一种对有影响&&’数量巨大!一些著名的论坛每日的主题量数以千计(力词语进行聚类的方法发现,,-论坛中具有当前影响力的主&!

6、’以发表时间排序!发表过的主题相隔一段时间后就会题!并设计开发出主题影响力发现的原型系统$该系统能够很被随后的主题淹没(好地针对,,-论坛数据提取出有影响力的主题$&%’内容杂乱!论坛中掺杂了大量的无效信息$这对用户及时"准确和方便地从论坛中获取需要的信息造!原型系统架构设计成了很大的障碍$我们需要对大量的主题进行聚类!发现论坛!!&定义中当前关心的焦点并提取出具有影响力的主题$首先!我们定义注册用户在,,-论坛中发表的帖子为#"!传统的有影响力主题计算方法是基于简单的统计排序$对也就是原帖$其他注册用户可以在原帖#

7、"的基础上发表对#"每个主题!"!论坛系统统计出在某个固定时间段内对!"回帖的的回帖#$或对回帖#$的再次回帖#%$这样形成一条回复链!回注册用户数作为衡量!"在论坛中影响力的标准$系统对所有主复链上的帖子满足单向的回复关系$题的影响力进行排序取出前&"个影响力最大的主题作为该时原帖#"和所有在#"基础上发表的回帖组成了一个主题!"$间段内的热门主题!即)十大*$我们认为在主题!"中发表帖子的用户相对集中地围绕原帖#"这种方法的缺陷在于%讨论了某一特定话题$图"显示了主题!"及其包含的原帖与帖基金项目%中国科学院研究

8、生科学与社会实践资助专项作者简介%蒋凡&&I.I/’!男!安徽淮南人!硕士研究生!主要研究方向为信息检索!征兆发现$高俊波&&I.!/’!男!江苏无锡人!博士研究生!主要研究方向为数据挖掘!知识发现$张敏&&I0&/’!男!安徽合肥人!硕士研究生!主要研究领域%信息检索!征兆发现$王煦法&&IJ0/’!男!江苏丹阳人!教授!博士生导师!主要研究

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。