资源描述:
《面向主题的舆情本体概念及关系的抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士研究生学位论文新疆大学论文题目(中文):面向主题的舆情本体概念及关系的抽取研究论文题目(外文):Researchonsubject-orientedextractionofpublicopinionontologyconceptsandrelations研究生姓名:张学芳学科、专业:工学、软件工程研究方向:语义WEB导师姓名、职称:刘胜全教授论文答辩日期2016年5月日学位授予日期2016年6月日新疆大学硕士研究生学位论文摘要随着网络的快速发展,舆情信息会以某个或者某些主题形式为中心不断地传播,但传播重点也在不断地更改。快速有效地发现相关迁移的焦点内容,有助于相关部门更好
2、的掌握并分析舆情导向,并且将这些舆情信息按照某种形式存储起来,形成舆情本体,可以很好地支持后期的舆情分析。目前主题识别多数以新闻网页信息作为语料库,因为新闻语料格式规范,有具体的人物、事件发生时间、地点、发生何事这些要素。而舆情信息以各种形式如博客、贴吧等快速地传播着。在基于舆情信息的本体构建时,多数方法采用领域相关度和一致度或者它们的改进方法进行领域本体概念的提取,第一,该方法提取的本体概念具有极强的领域性,且实验语料库都是静态的、规范的。而舆情语料信息是跨领域的、时刻变化的,显然该方法在舆情本体构建时有一定的局限性。第二,将基于主题的舆情语料作为训练语料时,只抽取与主题相
3、关的高频词,过滤低频词。某一概念最终只能属于一个主题。但舆情语料是跨领域知识,一个词可能会出现在多个主题中。本文针对以上问题,采用信息爬取技术收集热点舆情文本信息,基于时间属性结合特征词的一些特点进行文档特征词抽取,建立空间向量,有效地发现内容焦点发生迁移但属于同一主题的网络文本,并将其归类。对识别后的主题文本提取名词性词汇或者短语作为候选概念集;根据语义相似度方法评估候选概念间的相关度,并对各概念的权值进行排序;结合词频变化的方法抽取与主题相关的核心概念。最后根据概念间已有的相关度,直接判断概念间关系。若概念间有直接关联,则这对概念具有一定的关系,结合不同方法划分关系类别以
4、及确定关系名称。实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,以及概念间关系,对舆情本体的构建以及后期的知识共享和重用都起到了积极作用。关键词:舆情本体;概念抽取;词语相似度;词频统计;关系抽取I新疆大学硕士研究生学位论文AbstractWiththerapiddevelopmentofthenetwork,publicopinionwillbecenteredonacertainorsomeformofthemetospreadunceasingly,butthespreadingpointisinconstantchange,sotoquicklyandef
5、ficientlyfindthefocusofthemigrationrelatedcontent,canhelptorelateddepartmenttobettergraspandanalysisofthepublicopinionguidance,andthesepublicopinionstoredinacertainform,itiscalledpublicopinionontology,thatcanalsosupportpublicopinionanalysisoflate.Currentlythemajoritystudiesofthemeidentifica
6、tioninformationwillbethenewspagesasacorpus,becausethenewscorpusareformatspecification,includingaspecificfigure,theeventtime,place,whatisgoingontheseelements.While,publicopinioninformationinvariousformssuchasblogs,postbarisspreadingquickly.Whenbuildingontology-basedpublicopinion,themostmetho
7、dsusedomaincorrelationanddomainconsistencyortheirimprovedmethodstoextractdomainontologyconcept,First,themethodtoextracttheontologyconceptsisextremelyterritorialandcorpusarestatic,standardized.Butthecorpusesofpublicopinioninformationarecross-cutting,const