基于动态labeled-lda模型的微博主题挖掘

基于动态labeled-lda模型的微博主题挖掘

ID:34045589

大小:5.29 MB

页数:48页

时间:2019-03-03

基于动态labeled-lda模型的微博主题挖掘_第1页
基于动态labeled-lda模型的微博主题挖掘_第2页
基于动态labeled-lda模型的微博主题挖掘_第3页
基于动态labeled-lda模型的微博主题挖掘_第4页
基于动态labeled-lda模型的微博主题挖掘_第5页
资源描述:

《基于动态labeled-lda模型的微博主题挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、学位论文独创性声明本人郑重声明:所呈交的学位论文是本人在导师指导下独立研究工作所取得的成果。据我所知,除了文中特别加以标注和致谢的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得金旦里王些太堂或其他教育机构的学位或证书而使用过的材料。对本文成果做出贡献的个人和集体,本人已在论文中作了明确的说明,并表示谢意。学位论文中表达的观点纯属作者本人观点,与合肥工业大学无关。学位论文作者签名:同垅骄签名日期砸.牛.f7学位论文版权使用授权书本学位论文作者完全了解金胆王些太堂有关保留、使用学位论文的规定,即:除保密期内的涉密学位论文外,学校有权保存并向国家有关部门或机构送

2、交论文的复印件和电子光盘,允许论文被查阅或借阅。本人授权金月巴工些太堂可以将本学位论文的全部或部分内容编入有关数据库,允许采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:1虱眵磅乔签名日期:洲r年4月门日论文作者毕业去向工作单位:联系电话:通讯地址:指导教师签名:签名日期:幻f亍年呼月Z5日E—mai1:邮政编码:致谢时光飞逝,转眼问,三年的研究生时光即将落幕。追忆过去,有很多值得自己去回顾去反思。在整个学习过程中,许多人都给予了我无私的指导与帮助。使我在这人生的关键阶段得到了锻炼与成长。在这临近毕业之际,我想借此机会对

3、他们表达深深的感谢。首先,我最要感谢的就是我的导师李锋刚副教授。李老师是一位学术水平很高的学者,他不仅有着严谨的科研态度、兢兢业业的工作精神、深厚的专业修养及和蔼可亲的待人方式,而且他还非常善于教学,每每与他交流问题时,都会给予我很多的启发以及对问题的更深层次思考,让我受益匪浅。在将近三年的硕士生涯里,李老师在理论学习、科研项目、论文撰写等方方面面给予了我悉心的指导。在学习上迷茫时,他总是能给出很多建议,为我指明方向。我很感激能有这样一个跟着李老师学习的机会,我深刻地体会到了科研工作的严谨与思考,也从中领悟到了一些做人做的态度与道理。在此,向李老师的谆谆教诲致以最诚挚的谢意。同

4、时,非常感谢智能管理研究所的所长倪志伟教授,经我们提供了良好的学习环境和很多学习机会;他高尚的品德、严谨的学术作风及和蔼可亲的态度,让我十分敬佩。其次,感谢我们智能管理研究所的所有兄弟姐妹们,梁婷、张国强、郭文阳、丁斌、荆婷婷、何岩新、万飞、杨晓斌、王萍、尤其是徐凯,以及同班的童雅林、陈骜等。他们不仅在学习上给予我很大的帮助同时也让我收获了深厚的友谊,也为我的研究生生活增添了许多乐趣,从他们身上也学习到了很多优秀的品质。还有,感谢我的家人,感谢其他所有好朋友的陪伴,感谢一直以来的生活上与精神上的鼓舞与动力,让我更加热爱生活,更加积极学习与工作,也更加充满自信。最后,向各位专家表

5、示由衷的感谢!作者:周先琳2015年4月摘要随着微博用户的不断增加,微博的影响力也在不断地扩张。微博类动态短文本由于其特有的文本特征,微博主题受时间因素的影响很大。Labeled—LDA模型是传统的LDA模型的一种变形,它是在LDA原有的基础上附加了一层类别标签。使传统的LDA多了一个直接的分配模型类别的优势,同时很好的优化了传统LDA模型在处理文本分类时会出现的在不属于自己的类别上进行生成时可能会导致隐主题的强制分配的问题。本文的研究目的:由于微博类短文本式网络信息的及时性、动态性和主题复杂性及多样性,首先对己选取好的微博文本在做了预处理后,进行文本特征选择。动态化改进后的V

6、SM特征选择方法明显优于传统的TF.IDF算法。其次,本文构建了动态的Labeled-LDA模型,将标签与动态相结合。方法包括三部分:第一,用Labeled-LDh主题模型进行建模和特征选择,确定主题数和隐主题一文本矩阵;第二,对微博文本划分时间文本集;第三,对Labeled—LDA模型进行动态化的改进,最终给出了针对微博文体的一种新的主题检索模型。实验结论:时间对微博的影响很大,动态化改进后的模型可以看出主题随时问因素的变化更为明显,本文提出的动态标签LDA模型对微博类的动态文本的主题挖掘具有优化作用。关键字:微博;文本挖掘;标签;动态;模型;LDAIIABSTRACTWit

7、htheconstamincreasingoftheusersofmicroblog.TheinfluenceofWeiboiscontinuallyexpanding.Becauseoftheuniquetextfeatureofmicroblogclassdynamicshorttext.Thethemeofblogaregreatlyaffectedbythetimefactor.Labeled—LDAmodelisamodificationoftheconventionalLDAmo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。