欢迎来到天天文库
浏览记录
ID:39402506
大小:572.00 KB
页数:42页
时间:2019-07-02
《基于本体的网络舆情挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于本体的网络舆情挖掘研究重庆大学硕士学位论文(学术学位)学生姓名:张俊勇指导老师:罗军副教授专业:计算机系统结构学科门类:工学重庆大学计算机学院二〇一四年四月 ResearchOnOntology-basedInternetPublicOpinionMiningAThesisSubmittedtoChongqingUniversityinPartialFulfillmentoftheRequirementfortheMaster’sDegreeofEngineeringByZhangJunyongSupervisedby
2、AssociateProf.LuoJunSpecialty:ComputerSystemArchitectureCollegeofComputerScienceofChongqingUniversity,Chongqing,ChinaApril2014 重庆大学硕士学位论文中文摘要摘要随着互联网的日益壮大,网络迅速普及、网民数量快速增长。从而,网络舆情慢慢成为映射社会舆情的实时晴雨表,从某种程度上它可以最直接、最快速地反映了经济、政治、文化的状况和发展态势。网络舆情分析顺理成章的成为了解社情民意的关键技术之一。然而,监管机
3、构往往更关注某个领域、层次的舆情情况,从基于关键词的搜索结果中的海量信息中找到与特定领域的相关的局部信息是非常困难的,另一方面,由于互联网的开放性、共享性、扁平性使得网络舆情的出现和监管不再具有地域性,不再具有边界。因此,缺少语义理解的关键词搜索,在正确表达搜索期望时总显得力不从心。根据研究目的的需求,本文的研究工作需从以下内容进行:深入理解本体在舆情分析过程中的作用,使舆情分析基于语义的理解之上。本文针对传统的web挖掘缺少对文本语义的理解问题,提出了基于本体的Web挖掘。在挖掘分析之前,利用本体对文本语义的理解,之后进
4、行挖掘分析。这就将本体知识运用到Web挖掘之中,使得两个领域的研究成果可以相互促进,共同来解决舆情分析这个复杂的社会问题。研究文本分类算法,结合领域本体,改进文本分类以适应舆情分析特殊需求。由于传统的分类方法不能很好的适应舆情分析的特殊需要,本文对文本分类算法,做了适当的改进,以适应舆情分析特定需求。舆情分析中,文本样例分布不均会导致分类偏差,这种改进有效的减小了样例不均对分类结果的影响,从而减小了偏差。最后,完善传统的情感倾向计算方法,对情感倾向性进行定量的计算分析,本文完善了对情感倾向性定量的计算,而不仅仅是定性的分析
5、。使得情感倾向分析更加准确,对舆情分析有重要意义。关键词:本体,Web挖掘,舆情分析,文本分类,情感倾向计算I 重庆大学硕士学位论文英文摘要ABSTRACTAsthegrowthofInternet,networkquicklyspread,andthenumberofInternetusersgrowsrapidly.Thus,thenetworkpublicopiniongraduallybecomethereal-timebarometermappingsocialpublicopinion.Tosomeextent
6、,itcanbethemostdirectandrapidreflectionofthestatusanddevelopmenttrendofeconomic,politicalandculture.Naturally,thenetworkpublicopinionanalysishasbecomingoneofthekeytechnologiesofunderstandingthesocietyandpublicopinion.However,regulatorstendtobemoreconcernedaboutapa
7、rticularareaorlevelofpublicopinionsituation.Butfindingalocalinformationassociatedwithspecificdomainfromthemassofsearchresultsbasedonkeywordsisverydifficult.Ontheotherhand,theInternet'sopenness,sharing,flatmakesnetworkpublicopinionandsupervisionnolongertoberegional
8、andnoboundary.Therefore,whensearchingcorrectexpressionoftheexpected,thelackofsemanticunderstandingofsearchkeywordstotallyragged.Accordingtotheresearchpu
此文档下载收益归作者所有