基于句群的汉语语篇内容连贯性分析技术研究

基于句群的汉语语篇内容连贯性分析技术研究

ID:23103619

大小:2.36 MB

页数:69页

时间:2018-11-04

基于句群的汉语语篇内容连贯性分析技术研究_第1页
基于句群的汉语语篇内容连贯性分析技术研究_第2页
基于句群的汉语语篇内容连贯性分析技术研究_第3页
基于句群的汉语语篇内容连贯性分析技术研究_第4页
基于句群的汉语语篇内容连贯性分析技术研究_第5页
资源描述:

《基于句群的汉语语篇内容连贯性分析技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391单位代码:11232密级:专业硕士学位论文基于句群的汉语语篇内容连贯性分析技术研究学院:计算机学院学科(专业):计算机技术学号:2015020276作者:魏天珂学校指导教师:吕学强教授企业指导教师:刘克会完成日期:二〇一八年六月五日学位论文版权使用授权书本人完全了解北京信息科技大学关于收集、保存、使用学位论文的规定,按照学校要求提交学位论文的印刷本和电子版本。学校有权保留学位论文并向中国科学技术信息研究所等国家主管部门或其指定机构送交论文的电子版和纸质版,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。学校有权适当复制、公布论文的全部或部分内容

2、。学校有权将本人的学位论文加入《中国优秀硕士学位论文全文数据库》和编入《中国知识资源总库》。学位论文作者签名:年月日□公开□保密(____年____月)(保密的学位论文在解密后应遵守此协议)指导教师签名:学位论文作者签名:年月日年月日硕士学位论文原创性声明本人郑重声明:所呈交的论文题目为《基于句群的汉语语篇内容连贯性分析技术研究》学位论文,是本人在导师指导下,进行研究工作所取得的成果。尽我所知,除了文中特别加以标注的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明并表示了谢意

3、。本学位论文原创性声明的法律责任由本人承担。作者签字:年月日I摘要摘要近几年,人工智能在各行各业激起了点点涟漪,进一步形成了层层热浪。在实现了基本智能之后,更多的学者为人工智能的“人性化”问题投入了更多努力。语篇的衔接与连贯在许多领域中都担任着重要的角色,并为相关领域的研究提供了一定程度的帮助。例如,智能写作在实现了句子自动生成之后,应保证句子间的连贯性,使生成的文章通顺不生硬。这就需要分析语篇句子之间的连贯性。另外,在阅读理解任务中,如果能很好地识别句子之间的连贯性,在进行答案选择时就能够有效地在原文中定位,从而进行语义分析,选出较合适的答案。综上,语篇的衔接与连贯是语篇分析的重点,是进

4、行更多领域研究的基石。然而,直接在句子层面上进行连贯性研究会遗失很多上下文信息,直接使用整个篇章进行分析研究会因颗粒度较大存在许多技术上的问题。因此,本文在句群的层面上进行语篇连贯性的研究。对句群的划分困难度、句群在不同体裁语料中的分布特征、句群的自动切分以及句群内部句子间关系的自动识别进行了研究,具体如下。首先,本文从多角度总结了句群边界以及类别的分布特点,分析了句群内部句间的各种连接关系,提出了一种基于人工标注的语篇困难度识别模型,并利用双人标注信息的差异性来验证语篇困难度识别方法的有效性与准确性。实验表明,该模型可以较好地区分不同体裁新闻类语篇的标注难度,为相关语篇内容的分析理解打下

5、了良好的基础。其次,本文使用新闻、应用、散文和百科四个不同体裁语篇语料,使用双人独立标注的方式,对四个库进行人工连贯性分析标注。在此基础上,分析了四类语篇语料库中的句群相关的连贯性分布特征,详细对比了不同体裁语篇中的句群连贯性标注难度差异情况,为后续实现句群边界的自动切分与句间关系的自动分析打下了良好基础。再次,本文利用卷积神经网络以及注意力机制对语篇句对进行分类,并结合句群主题特征来提升句群边界识别的准确率。利用大规模弱标注段落数据集解决句群语料短缺的难题。实验表明,该方法能够有效地进行句群边界的自动识别,实现语篇句群的自动切分。最后,本文结合了卷积神经网络与词语序列特征,综合考虑了语义

6、与结构等多方面的特征,并加入注意力机制来深入挖掘句群内部间双核心(连贯关系、流水关系)句际关系。实验表明,本文方法能够有效地识别双核心句际关系,并且可移植性强。关键词:语篇连贯性;标注困难度;话语结构分析;句群切分;句际关系识别IABSTRACTABSTRACTInrecentyears,artificialintelligencehasstirredupwavesinallwalksoflife.Afterachievingbasicintelligence,morescholarshavedevotedmoreeffortstothehumanizationofartificialin

7、telligence.Thecoherenceoftextplaysanimportantroleinmanyfieldsandprovidessomehelpfortherelatedresearch.Forexample,tomakethearticlesgeneratedbysmartwritingblunt,itisnecessarytoanalyzethecoherencebetweentextsentence

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。