欢迎来到天天文库
浏览记录
ID:35059705
大小:3.02 MB
页数:56页
时间:2019-03-17
《基于主题模型的主题演化分析及预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、'V'巧::爲1懸名本:!;祭’";1、..:^'V'.I'.人1,;"I‘单位代码=10巧3密级:.i;t,II1"'.|辛'节!I.一。《兰著iii若!硕女#像俗A:;声;'’?;詞敲.,?遂',■-主:满:/-著I//:.’?.-.、-■、*<j.?、^二‘-VU知寺..--'、/vr-n?4;|‘'','jV、.论文题目:基于主题模型的韦题演化分析
2、及预测'.'.,VV■■.■-;’V,‘..:.u,V.i一■\*,'三?■;...''."■-■■,'i"■?^?■:1013041018.心学号;.—J茅利锋;;姓名—张伟教授导。巧息安全^学科专业信%计算机通信网与安全研究方向工学题±申请学位类别20164年—_j论文提交日期—.I:^-.-.一?*t.?南京邮电大学学位论文原创性
3、声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研巧成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。一.与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一本人学位论文及涉及相关资料若有不实,愿意承担切相关的法律责任。研巧生签名:《名接日期;-)。^斗1南京邮电大学学位论文使用授权声明本人授权南京邮电大学可W保留并向国家有关部口或机构
4、送交论文的复印件和电子文档可;允许论文被查阅和借阅;可W将学位论文的全部或部分内容编入有关数据库进行检索;论W采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质一文的内容相致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。涉密学位论文在解密后适用本授权书。研究生签名:_导师签名:又日期:异片著為緣本StudyoftextevolutionanalysisandpredictionbasedontopicmodelThesisSubmittedtoNanjingUniver
5、sityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByMaoLifengSupervisor:Prof.ZhangWeiApril2016摘要随着互联网的不断发展,社交媒体得到了急速发展。如何利用用户在社交网络中产生的海量数据,来对其进行演化分析,成为了自然语言处理领域的研究热点。在社交媒体中,传统的主题检测方法其准确性和效率难以保证,为此主题模型的方法被提出。主题模型认为主题是由一组语义相关的词及词的概率分布表示,其具有可以很好的模拟大规模语料的语义信
6、息的特性,因而得到广泛的应用。本文在已有的主题获取与演化技术的基础上做出了以下有意义的创新。首先,提出了一种基于潜在狄利克雷分配模型的主题演化方法。该方法在已有的演化方法的基础上,增加了主题过滤的方法,并在主题内容演化方面提出了一种判断主题演化状态的方法;其次,在主题演化方法的基础上,结合马尔科夫链模型,提出了一种可以预测主题演化趋势的方法;最后,尝试使用层次狄利克雷过程方法来代替潜在狄利克雷分配模型,以实现主题演化过程中主题数目的自动确认。在NIPS论文集上的实验表明,本文提出的演化可以准确获得主题在内容和强度上的演化趋势,结合马
7、尔科夫链的预测方法可以有效预测其在未来几个时间窗口的演化趋势,使用层次狄利克雷的方法对主题演化进行分析及预测的效果优于使用潜在狄利克雷分配模型的方法。关键词:主题演化,主题模型,潜在狄利克雷分配模型,马尔科夫链,层次狄利克雷过程IVAbstractWiththedevelopmentoftheInternet,socialnetworkhasarapidimprovement.Evolutionaryanalysisofmassdatageneratedbytheusersinsocialnetworkhasbecomeahotsp
8、otinnaturallanguageprocessing.Insocialnetwork,traditionaltopicdetectionmethodisdifficulttoguaranteeitsaccuracyandeffi
此文档下载收益归作者所有