面向学术领域的舆情分析关键技术研究

面向学术领域的舆情分析关键技术研究

ID:35102074

大小:6.70 MB

页数:57页

时间:2019-03-17

面向学术领域的舆情分析关键技术研究_第1页
面向学术领域的舆情分析关键技术研究_第2页
面向学术领域的舆情分析关键技术研究_第3页
面向学术领域的舆情分析关键技术研究_第4页
面向学术领域的舆情分析关键技术研究_第5页
资源描述:

《面向学术领域的舆情分析关键技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:分类号^密巧:公巧¥UDC:^〇19_牡.--*-学号-':131442化J户,苗?祝—inm■Ii11"下,&'、..i.!,巧呵爾gi杂奇嗎'、'’"‘.^1則h击常?诚i衣'’il巧東帛大嗦耀硕±学位论文面向学术领域的舆情分析关键技术研究研究生姓名:刘莉导师姓名:金远平审谱学份类别工学硕±学位巧予单化东南大学一级学科名称计算机科学与工程论文答辩U期2016年6月1日二级学科名称授予日期20年月日学位答辩垂员会丰席徐立揉

2、教巧评阅人倪巧伟教巧院盲2016年6巧I鬥分类号:级;公gUDC004.9学号131442:;一_〇J((东南大学硕±学位论文面向学术领域的舆情分析关键技术研究研究生姓名:刘莉指导教师姓名:金远平教授申请学位级别工学硕±学科专业名称计算化应用技术论文提交日期2016年5月10曰论文答辩日期2016年6月1曰学位授予单位东南大学学位授予日期20年月日答辩委员会主席徐立臻教授评阅人倪巍伟教巧院盲2016年6月ResearchonKeyTe

3、chniquesofPublicOpinionAnalysisinAcademicFieldADissertationSubmi打edtoSoutheastUniversityFortheAcademicDegreeofMa巧erofEngineeringBYUuLiSuervisedbpyProfessorJinYuanpingSchoolofComputerScienceandEngineeringSoutheastUniversityJune

4、2016东南大学学位论文独勒性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研巧工作及取得的研究,除了文中持别加,成果。尽我所知;^标注和致谢的地方外论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料一。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研巧牛篇《:日期;东南大学学位论文使用授权声明东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可W采用影印、缩印或其

5、他复制手段保存论文。本人电子文档的内一容和纸质论文的内容相致。除在保密期内的保密论文外,允许论文被查阅和借阅,可公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研充生院办理。研究生签名:导师签名;期;?^摘要一目前,我国的舆情研巧大多都是围绕般网络舆情展开,主要包括网络舆情的特点、管理、控制与引导、监测、预答等方面。近几年也出现了关于主题方面的舆情分析研究,、信息收集与分析但是大多还是针对于互联网上BBS、电商评论、微博、新闻报道等大众业余网络空间的舆情分析,对于学术领域方面

6、的舆情分析还很少,W便了。研究人员在从事科研之前需要阅读大量的学术文献一学术领域的最新研究热点解目前这。然而面对海量的学术文献,捜索引擎只能帮助用户筛选出符合检索条件的文章列表,科研人员仍然巧要通过大量阅读来获得需要的研巧热点信息,这需要付出很多时间和精力。本文针对学术专业领域舆情分析缺失和中文专业主题内容挖掘不深的问题,研巧面向学术领域一的舆情分析关键技术,提出个新型的面向学术领域的舆情分析算法。首先,根据用户需求,对海畳文献进行基于学术持征的检索,获取相关文档集合。然后提出一LDA主题.通过,本文种基于主题模型

7、的多文档自动摘要算法模型获取文档集合中一每篇文档的主题概率分布和每个主题对应的词语巧率分布。同时根据主题分布的概率值,选取与文档相关的前几个主题来挖掘文本的浅层语义。然后将主题信息应用到选取摘要候选句的王作中,一提出一种基于句子生成概率和文章结构的方法来升算句子的权重LDA。进步根据得到的词语生成概率,对句子进行概率计算,并针对学术文献不同部分重要度不同,提出改进文档句子权重的方法,从而得到摘要候选句。由于学术文献相似且重要的句子很多,仅仅考虑句子权重得到摘要是不够的,还巧要考虑摘要冗余的问题一MMR。本文又提出了

8、种基于最大边缘相关法并结合学术领域持征的兀余控制算法,通过对大量的学术文献进行语料训练,使用学术领域特征的相似度计算对摘要候选句进行多方面的计算评分来选取摘

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。