基于跨语言映射的汉语语义知识自动获取方法的研究

基于跨语言映射的汉语语义知识自动获取方法的研究

ID:35070630

大小:2.42 MB

页数:64页

时间:2019-03-17

基于跨语言映射的汉语语义知识自动获取方法的研究_第1页
基于跨语言映射的汉语语义知识自动获取方法的研究_第2页
基于跨语言映射的汉语语义知识自动获取方法的研究_第3页
基于跨语言映射的汉语语义知识自动获取方法的研究_第4页
基于跨语言映射的汉语语义知识自动获取方法的研究_第5页
资源描述:

《基于跨语言映射的汉语语义知识自动获取方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文基于跨语言映射的汉语语义知识自动获取方法的研究RESEARCHONTHEAUTOMATICOBTAINMENTOFCHINESESSEMANTICKNOWLEDGEVIACROSS-LINGUALPROJECTION李晓倩哈尔滨工业大学2016年6月国内图书分类号:TP391.2学校代码:10213国际图书分类号:681.37密级:公开工程硕士学位论文基于跨语言映射的汉语语义知识自动获取方法的研究硕士研究生:李晓倩导师:赵铁军教授申请学位:工程硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:

2、TP391.2U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONTHEAUTOMATICOBTAINMENTOFCHINESESSEMANTICKNOWLEDGEVIACROSS-LINGUALPROJECTIONCandidate:XiaoqianLiSupervisor:Prof.TiejunZhaoAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComp

3、uterScienceandTechnologyDateofDefence:June,2016Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要语义知识库是一种结构化数据库,其中存储的是实体及实体间的相互关系,是当前学术界和企业界的研究热点,其在语义搜索、机器问答等实际的应用中有非常重要的意义。然而现语义知识库大多以英文表示,汉语语义知识库十分缺乏且规模较小,因此构建汉语语义知识库,成为汉语自然语言处理领域亟待解决的问题。机器翻译技术是一种将句子从源语言自动翻译为目标语言的技术方法,一般使用于对自然语句的自动翻译。本文采用

4、机器翻译技术翻译已有知识库从而构建汉语知识图谱。不同于针对句子级别的机器翻译,在语义知识库翻译中待翻译的为知识库中的实体标签。本文的具体研究内容为:(1)为了解决知识库中特定词汇或短语较多及双语平行语料缺少的问题,本文首先利用知识库中实体的源语言标签挖掘互联网中的相关双语语料,构建训练数据。此外考虑到百度百科是较大的汉语知识库,本文利用百科双语词条对知识库翻译模型就行补充,该方法有效提高了知识库翻译的性能。(2)知识库一般采用层状结构,如特定领域知识库一般分为两层(类别,实体),每个类别的实体,均有特定的属性。本文利用知识库的层状结构提高知识库翻译的性能,如本文使用知识库中实体的类别和属性信息

5、解决知识库中人名类别实体的未登录词问题。对知识库中的实体根据其是否属于人名类别,及考虑其性别特征,加入音译模型来翻译此类未登录词。实验表明该方法能有效解决人名实体未登录的问题,从而提高知识库翻译的性能。(3)考虑到知识库翻译任务中待翻译的内容为实体的源语言标签,而实体标签较短,因此缺乏上下文信息,不能有效的将实体标签翻译到目标领域。因此本文利用知识库的图形结构,对实体标签进行扩展。为了提高特定领域知识库翻译的准确性,本文构建基于主题模型的知识库翻译系统,对实体的主题信息利用实体标签扩展训练得到其主题分布。本文使用主题模型为隐含狄利克雷分布模型。本方法有效提取了实体的主题信息,并提高了知识库翻译

6、的性能。关键词:知识库;统计机器翻译;双语语料;未登录词;主题模型-I-AbstractAbstractSemanticKnowledgeBaseisastructureddatabase,inwhichtherelationshipbetweentheentitiesarestored.Nowadays,semanticKnowledgeBasehasbecomethehotresearchinacademiaandindustry,andKnowledgeBasehasaveryimportantsignificanceinthepracticalapplication,suchas,se

7、manticsearch,questionandanswer.However,theexistingsemanticknowledgebasehasexpressedinEnglishonly,andthescaleofChinesesemanticknowledgebasearealwayssmall.So,itisveryimportanttobuildChinesesemanticknowl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。