中文微博评论对象抽取研究

中文微博评论对象抽取研究

ID:35039265

大小:5.56 MB

页数:60页

时间:2019-03-16

中文微博评论对象抽取研究_第1页
中文微博评论对象抽取研究_第2页
中文微博评论对象抽取研究_第3页
中文微博评论对象抽取研究_第4页
中文微博评论对象抽取研究_第5页
资源描述:

《中文微博评论对象抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号?密级UDC编号术中作始大考硕i学位论文中文化媒评封東抽取研堯、学位申请人姓名:换朱申请学位学生类别;全巧夺J巧去:计义如申请学位专业方向!应巧技米指导教师姓名;巧小华乂援/p^硕Jr学位论文'MASTERSTHESIS硕±学位论文中文微博评论对象抽取研究论文作者:梅寒指导教师:胡小华教授学科专业=计rnmez用技术研究方向:自然语言舰华中师范大学计算化学院2016年5月硕去学位论文'S#MASTE民了HESISResearcho

2、nOpionionTargetExtractioninChineseMicroblogAThesisSubmitedinPartialFulfillmentofthe民euirementqFortheM.S.DegreeinComputerApplicationTechnologyByHanMeiPostraduateProramggSchoolofComputerCentralChinaNormalUniversitySuervisor:XiaohuaH

3、upAcademicTitleiProfessorSignatureArovedppMay.2016/2e\巧去学位论文|MA'STERSTHESIS华中师范大学学位论文原创牲声明和使用授权说明房准1性考巧本人郑重声明;所呈交的学位论文,是本人在导师指导下,独立进行研巧工作所取得的研究成果。除文中己经标明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的研巧成果。对本文的研巧做出贡献的个人和集体,均己在文中明确方式标明。本声明的法律结果由本人承担。作者签名日化年占月f日学化文胶权

4、使用裝权书学位论文作者完全了解华中师范大学有关保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属华中师范大学。学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许学位论文被查阅和借阅;学校可W公布学位论文的全部或部分内容,可允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解密后遵守此规定)保密论文注释:本学位论文属于保密,在本授权书。_年解密后适用_非保密论文注释,:本学位论文不属于保密范围适用本授权书。化作者签名:导师签名:b曰期:入t年A月/目曰期

5、年月曰/""本人己经认真阅读CALIS髙校学位论文全文数据库发布章程,同意将本人的""""学位论文提交CALIS高校学位论文全文数据库中全文发布,并可按章程中的一规定享受相关权益。同意论义提巧后滞后:□半年;□年;□二年发布。作者签名:乂导师签《:本拘年>.目期1《日;《年月日日期:共占年月<^/6(Zgm硕壬学位论文MA'STERSTHESIS巧要随着自媒体技术的迅速发展,广大互联网用户逐渐从信息的被动接收者转变为信息的生产和分享者。微博平台的迅速聰起产生了海量的文本数据,其中蕴含的信息无论是对研

6、充还是应用都具有非凡的价值。近年来,针对微博的情感分析发展迅一速,而作为情感分析的关键任务之,评论对象抽取由于在文本摘要抽取、舆情分析等多个领域具有极大的应用价值,逐渐受到研究人员的重视。然而目前面向中文微博的相关研巧还不充分,由于微博文本具有缺乏语言规范、句子结构不清晰等内,在特性,使得研巧难度加大。因此,本文将微博作为研究对象评论对象抽取任。务为研究内容,寻找更有效的中文微博评论对象抽取方法本文将评论对象抽取任务分为候选词抽取与标准评论对象抽取两个主要步骤,针对不同步骤,对现有方法进行了改进优化。具体而言:,本文工

7、作主要有W下四点一第,在候选词抽取阶段,本文改进了现有方法中的基于话题标签分词和简易规则的评论对象候选词抽取方法。现有方法是基于SCP理论将话题标签分词然后将结果加入分词工具的词典中进而对微博文本进行分词,然后用基于规则的方法来抽取文本中的评论对象候选词。由于传统分词工具的词典具有很大的局限性无法对包含了大量网络流行语的微博文本进行良好的分词,并且使用的抽取规则过于简单和粗髓。本文通过收集中文输入法的细胞词库构建新,从而导致候选词抽取效果不佳。的用户词典,然后对抽取规则进行优化和扩展,有效提高了候选词抽取效果第二一,在标准

8、评论对象抽取阶段,提出了种改进的基于聚类的多图平行标签传播的评论对象抽取方法,提高了微博文本评论对象抽取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。