藏语话题刻面情感识别研究及实现

藏语话题刻面情感识别研究及实现

ID:35096730

大小:6.85 MB

页数:59页

时间:2019-03-17

藏语话题刻面情感识别研究及实现_第1页
藏语话题刻面情感识别研究及实现_第2页
藏语话题刻面情感识别研究及实现_第3页
藏语话题刻面情感识别研究及实现_第4页
藏语话题刻面情感识别研究及实现_第5页
资源描述:

《藏语话题刻面情感识别研究及实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号;公开:下巧91密级雜《兴A磯乂#硕±学位论文题目:藏语话题刻面情感识别研究及实现邹后孝姓名:学号:Y。口40473学院:中国民族信息巧术研究院专业:计算化软件与理论研究方向:舆情分析导师:曹昭巧巧二〇—六年五月Researchandimplementa村onofrecogni村ont;opicfacetemo杜onofT化etanAThesisSubmitedfor化eDereeofMastergCa

2、田出da1;eZouHouxiao:Supervisor:Prof.CaoHuiNo円hwMtUniversityforNationalitiesLanzhouChina,西北民族大学硕±学位论文关于学位论文使用授权的声明本人在导师指导下所完成的论文及相关的作品,知识产权归属西北民族大学。本人完全了解西北民族大学有关保存、使用学位论文的规定,同意学校保存或向国家有关部口或机构送交论文的纸质版和电子版,允许论文被查阅和借阅本人授权西北民族大学可将本学位;论文的全部或部分

3、内容编入有关数据库进行检索,可采用任何复制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或与该一论文直接相关的学术论文或成果时,第署名单位仍然为西北民族大学。保密论文在解密后应遵守此规定。^论文作者签名;童后睾导师签名:帶每曰期;心P原创性声明本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所取得的成果。学位论文中凡引用他人己经发表或未发表的成果、数据、观点等,均己明确注明出处。除文中己经注明引用的内容外,不包含任何其他个人或集体己经发表或撰写过的科研成果。对

4、レ本文的研巧成果做出重要贡献的个人和集体,均己在文中ッ明确方式标明。本声明的法律责任由本人承担。心分方.又f论文作者签名:日期;_—I西北民族大学硕±学位论文摘要在自然语言处理相关的研究越来越宽泛的大背景下,起步比较晚的藏文信息处理技术导致了与藏语句子情感相关的自动分词标注、藏语语料库建设、藏文情感研究等相关方面的基础研巧尚处在初期研究阶段。本文针对藏文话题文本,详细研究了藏文本的句子特性,包括分词、断句及主客观句的识别;并提出了话(题刻面的的概念,在大众对己有话题的整体认识下,

5、为大众提供话题各个层面刻面)的情感分析,在更多维度上被大家解读。1^便话题本文利用藏文句子的句末规则|及藏文复句的特点对藏文本进行了自动断|^句;利用藏文的主观线索及客观线索对藏文句子进行了主客观句识别,并针对藏文情感词极性分析进行了研究一,并开发了个藏文情感词的管理系统,帮助我们分析刻面情感的极性;在话题中加入了领域词典W及藏语格属性词(种子刻面)的分析,并利用种子刻面对话题语料进行了分类,对不满足要求的句子文本进行了聚类:,在聚类之前的准备工作有对藏文本语句进行分析、对藏文本进行句子建模-me

6、ans多层次聚,分析各个聚类算法的优劣并最终提出了K类算法,该算法通过研究句子文本的句子结构,对聚类结果簇进行了多层次的聚类,从而达到对话题挖掘更多刻面的目的。在话题刻面的情感识别部分,我们分析了藏语句子各个词性的特点,并给毎个句子的情感词进行编号,结合句子中否定词、转折词等词对情感词的影响,对句子极性进行平均加权得到刻面情感极性。>本文的创新点在于:针对藏文句子进行了断句、主观句识别1及句子建模的(^研究-means算法的基础上提出了-means多层次聚类算法针对某个话题;在KK;进行了刻面识别

7、及情感极性判断,;句子建模的准确性直接影响聚类的结果因一此进步的工作在于针对藏文句子的词性W及句子结构做更多的研究。关键词;Kmeans,舆情分析,话題刻面,情感分析,主客观句II西北民族大学硕±学位论文ABSTRA打In打aturailanguageprocessingresearch,ThelaterresearchintheTibetaninformatio打processingtechnologyleadstothe了化eta打sente打cesemot

8、ionrelatedautomaticwordsementationandtainT化etancorusconstructio打了化etangggg,p,feelinsofbasicresearchisstillinthe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。