资源描述:
《一种基于词对齐的中文深层语义解析模型》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、一种基于词对齐的中文深层语义解析模型郑晓东胡汉辉赵林度吕永涛东南大学经济管理学院东南大学计算机科学与工程学院摘要:语义解析是指将自然语言句子转化成便于机器理解和推理的意义形式。近年来英文语义解析的研究取得了很大进展。然而,中文语义解析的相关工作则相对较少。中文和英文之间存在一定的差异,适用于英文的语义解析方法不一定适合中文。因此,针对屮文的语言特点,提出一种基于词对齐的屮文语义解析方法,将中文句子转化成其相应的意义表示看作是一个机器翻译的过程。首先将英文语义解析方法中常用的训练数据集GEOQUERY转化成中文数据集,数据集中毎条训练数据包括一个中文句子及其正确的意义表示。然后利用词
2、对齐模型来获取由中文自然语言字符串及其相应的意义表示所组成的双语词典。最后通过学习一个概率估计模型來确定最终的语义解析模型。实验结果表明,WACSP有较高的精确度和覆盖率。关键词:自然语言处理;语义解析;词对齐模型;作者简介:郑晓东(1976—),男,博士,高级工程师,研究领域为信息处理、知识管理、系统工程;E-mail:51847986@163.com;作者简介:胡汉辉(1956—),教授,博导;作者简介:赵林度(1965—),教授,博导;作者简介:吕永涛(1991—),硕士。收稿日期:2017-07-10基金:国家自然科学棊金而上项Fl(No.70673010)Wordalig
3、nment-basedChinesedeepsemanticparsingZHENGXiaodongHUHanhuiZHAOLinduLVYongtaoSchoolofEconomicsandManagement,SoutheastUniversity;SchoolofComputerScienceandEngineering,SoutheastUniversity;Abstract:Semanticparsingisthetaskoftransformingnatural-languagesentencesintocomplete,formeil,symbolicMeaningR
4、epresentations(MR)suitableforreasoningormachine-undcrstending.Inrecentyears,theresearchofsemanticparsinginEnglishhasmadegreatprogress.However,littleworkhasbeendoneinChinesesemanticparsing.ThereareinherentdifferencesbetweenChineseandEnglish,thereforeonecannotsimplyapplymethods,whicharefeasiblef
5、orEnglish,toChinese.ThispaperproposesastatisticalapproachcalledWACSPaimingatChinesesemanticparsing,whichconsiderstheprocessofconvertingChinesesentenceintoitscorrespondingmeaningasamachinetranslationprocedure.Atfirst,itturnsthefrequently-useddatasetGEOQUERYintoChinesedataset,inwhicheachdatacont
6、ainsaChinesesenteneeanditsaccuratemeaning.ThenitusesthewordalignmentmodeltoacquirethebilingualdictionarymadeupbytheChinesenaturallanguagestringanditsmeaning.Intheend,itdeterminestheultimatesemanticanalysisbylearningastatisticalmodel.ExperimentalresultsshowthatWACSPperformswel1withhigherprccisi
7、onandcoverage.Keyword:naturallanguageprocessing;semanticparsing;wordalignmentmodel;Received:2017-07-101引言语义解析是将自然语言句子转化成便于机器理解和推理的意义表示(MR),它从线性的词语序列中获取潜在的语义结构。意义表示语言(MRL)是一种形式化表示语言,可确保每一个意义表示(MR)有唯一的解析树。随着分词、词性标注和句法解析等自然语言处理技术的逐步成熟,浅层语义