基于共现词的中文微博观点句识别

基于共现词的中文微博观点句识别

ID:34136989

大小:1.62 MB

页数:46页

时间:2019-03-03

基于共现词的中文微博观点句识别_第1页
基于共现词的中文微博观点句识别_第2页
基于共现词的中文微博观点句识别_第3页
基于共现词的中文微博观点句识别_第4页
基于共现词的中文微博观点句识别_第5页
资源描述:

《基于共现词的中文微博观点句识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、安徽大学硕士学位论文目录摘!要⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯lAbstract⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯lllfj录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.V第一章引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。11.1研究背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一11。2国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..31.3本文所做工作及安排⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

2、⋯⋯⋯⋯⋯⋯⋯一5第二章基于模板的显性观点旬提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.1研究基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..72.2句法模板归纳研究⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..92.3实验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.112.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯12第三章使用LDA主题模型提取共现词特征⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。133.1主题模型概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯133.2研究基础⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3、173.3共现词特征提取方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯19第四章基于共现词的隐性观点句提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.214.1文本分类方法介绍⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯214.2Weka集成分类器抽取微博观点旬流程⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯304.3特征提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯314。4实验结果与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯324.5本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35第五章实验与对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.365.1实验

4、语料⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯365.2语料预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯365.3WEKA分类工具与基于SVM分类器分类效果对比⋯⋯⋯⋯⋯⋯⋯⋯⋯375.4使用名词特征与使用共现词特征提取效果对比⋯⋯⋯⋯⋯⋯⋯⋯⋯38V安徽大学硕士学位论文基于共现词的中文微博观点句提取5.5显性与隐性观点句算法结合提取微博观点句⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯395.6本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯40第六章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。416.1本文总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5、⋯⋯⋯⋯⋯⋯⋯⋯⋯416.2未来的工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯42参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.43ji!I:谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..46攻读学位期间发表的学术论文目录⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯47攻读硕士学位期间所参加的横向项目⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。47VI安徽大学硕士学位论文第一章引言1.1研究背景和意义1.1.1研究背景在国外,推特等微博交流平台开始风靡,随之而来的,是我国国内微博平台的发展与火热。从2011年

6、开始,中国的微博平台进入了发展的鼎盛时期,截至2013年11月,我国微博平台所注册的账号总数突破13亿大关,并且主要集中在腾讯以及新浪这两个微博用户平台。用户可以在微博平台上自由发表观点与意见,而这些信息有着巨大的潜在价值。例如,政府部门等可以通过对于微博的调查了解民众对于特定事件的看法;商家通过对于微博的调查对于产品研发做出预测性的判断;民众也可以在微博上曝光一些传统媒体无法报道与曝光的新闻,起到舆论监督作用。微博的观点句识别技术可以帮助人们快速,准确地获得自己感兴趣的内容所包含的民众观点。所以,近年来微博中的观点提取辨别算法研究逐步成为了研究热点。但是,与传统媒体

7、相比,微博又具有信息短,数量多,信息自由度高,传播速度快,影响力大等特点,微博的观点句识别与传统文本的观点句识别相比,更加具有难度。观点句识别,其本质为文本分类问题,并且大部分情况均为文本二分类。文本分类技术是数据挖掘领域中的一项重要技术。文本分类是指在预先给定的文本别类下,根据文本自身所隐含的信息,自动地对文本的类别进行划分。文本分类技术的发展,更使得文本分类由一开始的人工分类向自动化分类转变。这种自动化的分类技术有效提高了分类处理的速度与准确率,使得信息处理的整体过程得到改善,用户在获取所需要的信息时更加高效。⋯目前,随着网络的发展,网络上所蕴含

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。