社区问答系统中的社团发现技术研究及其应用

社区问答系统中的社团发现技术研究及其应用

ID:33744194

大小:3.76 MB

页数:77页

时间:2019-02-28

社区问答系统中的社团发现技术研究及其应用_第1页
社区问答系统中的社团发现技术研究及其应用_第2页
社区问答系统中的社团发现技术研究及其应用_第3页
社区问答系统中的社团发现技术研究及其应用_第4页
社区问答系统中的社团发现技术研究及其应用_第5页
资源描述:

《社区问答系统中的社团发现技术研究及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国斜孽教求大誊硕士学位论文社区问答系统中的社团发现技术研究及其应用作者姓名:学科专业:导师姓名:完成时间:冯晓楠计算机软件与理论田野副教授二O一四年四月Ⅵ谬了弘f钎一箩一Z,rU11iVersityofSciellceaIldTechllologyo:[.ChillaAdissertationf6rmasterdegreeResearchofCommunityDete(斯oninCommunity—basedQuestion.andAnsweringSystemsAutll01.:XiaonanF、engSpecial

2、ity:CompllterSoftwareandTheoryn·bUDerVlS0r:FinishedTime:rlnlSned.Llme:AssociateProf.YaTianA1)ril,2014■,中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究:[作所取得的成果。除己特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,

3、学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。公抄保密——年作者签名:导师签名:鳟一签字日期:如f牛一岁一Lf摘要社区问答系统(Community_basedQuestionandAnsWeringSystem,

4、CQA)通过聚集大众智慧,能够免费提供问题的个性化解决方案,例如Yahoo!Answer,百度知道等。然而CQA系统无显式的社团结构,因此“社团”性质没能得到充分应用;而且CQA系统具有较高的开放性:知识内容共享和搜索引擎可接触,使得CQA系统易受到虚假账户的入侵,导致CQA账户行为规律复杂,知识质量急剧下降。为解决CQA系统的上述问题,有必要深入研究系统中账户行为规律和网络性质。同时这些研究工作也有助于解决如下问题,例如相关用户推荐,相似问答内容融合,新型话题发现,虚假用户识别,个性化问答服务等,这些都能提高CQA系统

5、中的知识质量。本文以中国最大的CQA系统“百度知道”为代表,分析·3QA系统中账户的行为规律。通过探索账户间的问答关系,本文构建两种网络模型,展示了CQA系统的基本网络性质。为检测CQA系统中的以兴趣为中心的账户社团,基于标签传播算法SLPA,我们提出一个面向CQA系统的社团发现算法MSLPA(Multila”rspeaker—listener1abelpropagationalgorithm)。本文从网络规模、社团主题、聚合效果、层次结构等多方面评估MSLPA算法的性能,和已有的几种社团发现算法相比,MSLPA能够发现

6、大规模CQA网络中有意义的、重叠的、具有层次结构的账户社团,避免生成大量的微型社团,有效聚合关联账户。基于MSLPA社团发现技术,本文提出一个CQA系统中鉴别虚假账户的方法。首先给出一组具有较高区分度的账户属性集合,包括具有一定物理含义的账户个体属性和账户所属的社团性质,其中个体属性由统计分析得到,社团性质由本文的社团发现结果得到。本文将新提出的属性集合应用于简洁的J48决策树分类器上,判断账户为正常账户或者虚假账户。实验结果显示,该方法表现出良好的性能和效果,分类准确率得到较大的提高。摘要关键词:CQA系统,社团发现,

7、MSLPA算法,社会网络分析,虚假账户鉴别ABSTRACTCommunity-basedQuestionandAnswer(CQA)systems,sucllasY妇oo!An—s、Ⅳer,Baiduknows,proVidepeoplewithfIeeanswerstoquestionf;byintegratingpublicintelligence.However,CQAsystemshavenoexplicit‘;conlmunity”struc—ture,whichwrouldplayanimportantrol

8、einmaIlyapplications.Fhrthermore,CQAsystemsareVulnerabletospamaccountsfarming,becaustjCQAsystemscanbeaccessedbyInternetusersandsearchengines,whichdecre丑sestheq

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。