基于WordNet的蒙古文领域知识图谱构建方法研究

基于WordNet的蒙古文领域知识图谱构建方法研究

ID:17930079

大小:4.93 MB

页数:68页

时间:2018-09-10

基于WordNet的蒙古文领域知识图谱构建方法研究_第1页
基于WordNet的蒙古文领域知识图谱构建方法研究_第2页
基于WordNet的蒙古文领域知识图谱构建方法研究_第3页
基于WordNet的蒙古文领域知识图谱构建方法研究_第4页
基于WordNet的蒙古文领域知识图谱构建方法研究_第5页
资源描述:

《基于WordNet的蒙古文领域知识图谱构建方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、I51013类号:tpwT"""20154019001——?百n函捕■火摩碩士学位办文基于WordNet的蒙古文领域知识图谱构建方法研究ResearchontheConstructionMethodofMongolianKnowledgeGraphBasedonWordNet学科门类:Xf一级学科:计算机科学与技术学科:计算机应用技、专业f研究方向:自然语言处理申请人姓名:边慧珍指导教师姓名:哈斯*:〇八年四月十丨1学校代码:10135论文分类号:TP391学号:201540

2、19001研究生类别:全日制硕士学位论文基于WordNet的蒙古文领域知识图谱构建方法研究ResearchontheConstructionMethodofMongolianKnowledgeGraphBasedonWordNet学科门类:工学一级学科:计算机科学与技术学科、专业:计算机应用技术研究方向:自然语言处理申请人姓名:边慧珍指导教师姓名:哈斯二〇一八年四月十日内蒙古师范大学硕士学位论文内蒙古师范大学硕士学位论文中文摘要知识图谱是一种采用可视化方式展示知识库中包含的各类知识要素的语义网络,随着近年来科学技术的不断创新,语言信息处理开始着眼于知识图谱这一可视化展示方法。自然语

3、言处理,特别是蒙古文信息处理目前着重解决语义问题,所以词汇语义网和知识图谱等成为当下研究的热点。本文的所有数据均来自于WordNet底层数据库,这是因为几乎所有的概念信息都包含在WordNet当中。目前部分本体库、语义词典甚至于蒙古文名词语义网等都是以WordNet为基础而设计的。本文以WordNet为数据来源,提高了资源的利用率,与非结构化数据相比,减少了对资源预处理,节约了时间,加快了构建速度。本文对构建过程进行了深入研究,具体各项研究内容如下:1、首先分析影响语义相似度的参数,在综合分析各参数的优劣势后将概念信息量(InformationContent,IC)定为参数,并在已

4、有算法的基础上提出了改进的IC值计算模型。本文在基于WordNet自身结构的同时考虑到WordNet每个概念在语义树中的深度以及概念的子节点数来计算概念IC值。经过实验验证,改进后的IC计算模型更符合WordNet语义树的特征。2、在选定语义相似度参数后,对现有算法展开了剖析。最后,结合IC参数,给出了语义相似度计算的新模型,该模型还将概念的语义距离考虑在内,通过实验检验发现改进后的语义相似度模型在计算的语义相似度值与人工打分的相关系数高于其它计算方法,这说明该算法模型优于其它计算模型。3、概念以及概念间关系的抽取是构建知识图谱最为关键的一步,本文顶层概念的抽取是利用语义相似度算法

5、的改进模型进行的,然后根据WordNet底层数据库获得概念集以及各概念间的关系。4、本文知识图谱的构建是按以下的流程进行的:基于人工将目标领域划分为彼此不包含的子领域,并为每个子领域设定一个核心概念,利用语义相似度算法获得每个子领域的顶层概念。根据顶层概念借助WordNet底层数据库获得每个子领域的初始概念集。然后重新利用语义内蒙古师范大学硕士学位论文相似度算法求每个子领域的初始概念集与其余子领域的顶层概念的语义相似度值,获得目标领域的最终概念集。将最终概念集利用蒙古文WordNet进行映射获得相对应的蒙古文词汇,最后利用图形数据库理论,使所构建的目标领域知识图谱可视化展示。5、蒙

6、古文计算机领域知识图谱的构建是对本文基于WordNet蒙古文领域知识图谱构建方法的检验,展示了具体的构建流程,将对之后蒙古文知识图谱的进一步完善有一定的参考价值。关键词:WordNet,知识图谱,IC值,语义相似度,蒙古文内蒙古师范大学硕士学位论文ABSTRACTKnowledgegraphisakindofvisualwaytodisplayallkindsofknowledgeelementscontainedintheknowledgebase.Withthecontinuousinnovationofscienceandtechnologyinrecentyears,lan

7、guageinformationprocessingbegantofocusonthevisualdisplaymethodofknowledgegraph.Naturallanguageprocessing,especiallyMongolianinformationprocessing,currentlyfocusesonsolvingsemanticproblems.Therefore,studiesoflexicalsemanticnetworksandkno

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。