欢迎来到天天文库
浏览记录
ID:35039295
大小:3.63 MB
页数:52页
时间:2019-03-16
《中文微博评价对象提取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391密级中文微博评价对象提取方法研究研究生姓名:刘璟指导教师姓名、职称:朱艳辉教授学科专业:计算机应用技术研究方向:信息检索、文本分类湖南工业大学二〇一六年六月五日III摘要微博作为社交网络中最火热的平台,每天产生的微博文本不计其数,并且涵盖了新闻、娱乐、美食、商品、军事等多个领域。因微博文本数据内容丰富,最能反应当下人们讨论的热点问题,所以对微博文本数据的研究是当前的一大热点。为了在大量的微博文本数据中,找到人们谈论的对象,微博评价对象的提取这一课题因运而生。分词是微博评价对象提取的预处理步骤,分词的效果直接影响评价对象提取的准确率。本文围绕评价对象提取准确
2、率的提高,做了如下研究工作:(1)提出一种领域自适应的中文分词方法。针对中文分词领域自适应性差,对未登录词的识别和歧义词的处理显得力不从心的问题,本文提出一种基于条件随机场的领域自适应中文分词方法,提出了基本特征模板和字特征模板的条件随机场分词方法,并提出一种基于Trie树的逆向最大匹配算法来校正条件随机场分词,针对条件随机场分词的缺陷,提出了固定词串消解、动词消解和词频消解三种方法消除歧义。(2)提出一种多特征融合的条件随机场评价对象提取方法。为了更好的提取微博评价对象,找到条件随机场的最优特征模板,本文对大量的语料进行了实验统计,分析了语义角色特征、词频特征和形容词位
3、置特征与评价对象之间的关系,制定了基于条件随机场的基本词性特征模板、语义角色特征模板、词频特征模板和形容词位置特征模板提取评价对象。这种多特征融合的方法,有效提高了评价对象提取的准确率。关键字:评价对象提取,中文分词,领域自适应,条件随机场IAbstractAsthemostfierysocialnetworkplatform,themicro-blogtextgeneratedeverydaycountless,Itcoversthenews,entertainment,food,goods,militaryandotherfields.Becausemicro-blo
4、gtextcontent-richandthemostabletorespondtothecurrentsituationandthetrendofpeople'slife,sothestudyofmicro-blog'stextdataisoneofthehotspotsatpresen.Inordertofindtheobjectthatpeopletalkaboutinlargeamountsofmicro-blogtextdata,thushasproducedthistopicofresearchonopiniontargetextractionforChine
5、semicroblog.WordsegmentationispreprocessingstepsoftheopiniontargetextractionforChinesemicroblog,Theeffectofwordsegmentationdirectlyaffecttheaccuracyofopiniontargetextraction.Thispaperaroundtheimprovementofopiniontargetextractionaccuracy,dothefollowingresearchwork:(1)PutforwardamethodofChi
6、nesewordsegmentationwiththegooddomainadaptive.AccordingtotheConditionalRandomFieldforChinesewordsegmentation,thefieldishardtoadaptive.andthuscan’tbetterabletosolvetheunknownwordproblemandmostoftheambiguityproblem.AcombinationofCRFanddomaindictionaryisproposedtoimprovethefieldadaptability.
7、PutforwardakindofreversemaximummatchingalgorithmbasedonTrietreetocalibratethewordssegmentationresultofConditionalRandomFieldsandforeliminateambiguity,weusedfixedwordcollocation,verbdictionaryandwordprobabilitybytheruleofwordfor-mation.(2)Putforwardopiniontargetextra
此文档下载收益归作者所有