欢迎来到天天文库
浏览记录
ID:37032816
大小:1.09 MB
页数:127页
时间:2019-05-17
《基于深层神经网络模型的浅层语义解析统计研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、暨南大学博士学位论文题名(中英对照):基于深层神经网络模型的浅层语义解析统计研究StatisticalResearchofShallowSemanticAnalysisBasedonDeepNeuralNetworkModel作者姓名:张国校指导教师姓名及学位、职称:刘建平硕士、教授学科、专业名称:统计学论文提交日期:2017年12月论文答辩日期:2017年12月答辩委员会主席:论文评阅人:学位授予单位和日期:暨南大学2017年12月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。
2、除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得暨南大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解暨南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权暨南大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保
3、存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日学位论文作者毕业后去向:工作单位:电话:通讯地址:邮编:摘要语义分析是从非结构化的文本数据中识别出语义的形式化表示,并将其转化为结构化数据的过程。浅层语义解析是由语义分析分解出的、具有通用性的子任务构成。本文围绕如何有效地将非结构化的文本数据转化为结构化数据,依据子任务之间的内在关联性,将浅层语义解析作为一个整体,利用深层神经网络模型进行统计研究。第一,构建了一个理论分析框架。该框架包括三部分。首先,从
4、四个层面对浅层语义解析的内涵进行研究,分三种情形将浅层语义解析统一形式化为序列标注问题,为依据内在关联性进行建模奠定必要条件。其次,以词的分布式假定和多维尺度分析为理论和方法依据,论证了三类词向量模型之间的内在统一性,为有效地利用词向量对浅层语义解析进行建模奠定理论基础。最后,从线性时不变系统理论出发,论证了卷积神经网络模型应用于浅层语义解析的适用性条件,分析研究了长短期记忆人工神经网络模型、注意力机制模型和全局优化机制的理论优势,在此基础上,提出一类适用于浅层语义解析的深层神经网络模型,结合多级标注语料库,对浅层语
5、义解析的模型构建、模型选择以及模型识别等进行了系统性设计。针对模型的参数估计问题,推导出基本模型的梯度计算公式,证明了改进算法的收敛性。第二,从三个方面对分析框架进行了实证和应用研究。首先,利用大规模中文百科语料,对一类词向量模型的效果进行了评估,实证结果表明,在基于可类比性准则构建的测试总体上,模型的识别效果高达89.24%。其次,利用一个多级标注语料库,在对模型组件识别效果进行比较研究的基础上,以谓词-论元结构分析为例,对内在关联性在模型构建过程中的有效性进行了研究,并进一步和其他同类模型进行了比较研究。针对中文
6、语料,和传统模型相比,当不依据内在关联性进行建模时,本文所提的深层神经网络模型在中文测试集上识别效果提升了11.18%;当依据内在关联性进行建模时,仅仅利用到词性分析和命名实体识别两个子任务,在不改变原模型结构的基础上,模型识别效果进一步提升了1.12%。针对英文语料,依据内在关联性构建的模型识别效果也显著优于其他同类模型。这些实证结果说明了利用深层神经网络模型对浅层语义解析进行系统性I设计效果的显著性。最后,给出分析框架的两种适用情形,并利用东莞市政府服务热线工单验证了基于深层神经网络模型的浅层语义解析的实用性和有
7、效性。关键词:浅层语义解析;序列标注;深层神经网络模型;词向量模型IIAbstractSemanticparsingistheprocessofidentifyingtheformalrepresentationofsemanticsfromunstructuredtextualdataandtransformingitintostructureddata.Shallowsemanticanalysisiscomposedofsubtaskswhicharedecomposedbysemanticanalysisan
8、daresuitableforgeneralpurpose.Thispaperfocusesonhowtoeffectivelytransformunstructuredtextualdataintostructureddata.Basedontheintrinsicconnectionbetweenthevarioussubtasks,ast
此文档下载收益归作者所有