基于通用本体和自然语言处理技术领域本体半自动的构建

基于通用本体和自然语言处理技术领域本体半自动的构建

ID:32658435

大小:1.61 MB

页数:63页

时间:2019-02-14

基于通用本体和自然语言处理技术领域本体半自动的构建_第1页
基于通用本体和自然语言处理技术领域本体半自动的构建_第2页
基于通用本体和自然语言处理技术领域本体半自动的构建_第3页
基于通用本体和自然语言处理技术领域本体半自动的构建_第4页
基于通用本体和自然语言处理技术领域本体半自动的构建_第5页
资源描述:

《基于通用本体和自然语言处理技术领域本体半自动的构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海大学硕士学位论文!坐!!壁蟹!!坐!!塑!!!!墅¥垄型!!!:竺堕一摘要知识的获取以及表示方法一直是知识工程中重要的研究课题。本体作为知识表示的一种重要方法,已经得到了广泛的认可,特别是针对特定领域进行构建的本体,即领域本体,它的应用价值已经受到越来越多的重视。但是,在构建任何基于领域本体的应用系统之前,我们必须首先获得一个领域本体。现存的领域本体多数都是通过手工构建的,在构建过程中需要相关领域专家大量的专业知识指导,这是一个非常费时费力的过程。本文在研究当前各种本体构建方法和技术的基础上,提出了

2、一种基于通用本体和自然语言处理技术的半自动领域本体构建方法,该方法属于本体学习的一种,它将领域文献作为本体学习的知识来源。在领域本体的构建过程中,首先手工构建一个领域核心本体,领域核心本体中仅包含领域核心概念以及概念之间的关系,通常是最简单的分类关系;然后,利用通用本体中的概念以及概念之间的关系对领域核心本体进行扩展,扩展过程充分利用了对领域文献迸行自然语言处理得到的语义单元信息,利用通用本体对领域核心本体进行扩展的过程相当于对通用本体进行提炼,它充分抽取了通用本体中领域相关的概念以及关系;最后,通过自

3、然语言处理技术对已经得到的语义单元信息进一步处理,抽取更多的领域相关概念以及以动词语义关系表示的领域概念之间的关系,以丰富领域本体。该方法不仅继承了通用本体中特定领域相关的知识,而且通过对自然语言处理技术的利用,挖掘了更多传统领域本体构建方法所不能得到的概念之间的关系,实验证明,该方法能够大大提高领域本体的构建效率,并且在一定程度上能够保证结果本体的质量。关键词:领域本体,通用本体WordNet,自然语言处理,概念,关系上海大学硕士学位论文!坠!!壁型!竺!!壁垡!!坚§坚!坐墅生AbstractKno

4、wledgeacquisitionandrqn'cscntationisoneoftheimportantissuesinknowledgeengineeringresearch.Ontology,asamethodofknowledgerepresentation,hasbeenwidelyrcco霉1ize正Domainontologyiscom心呱舡:dintermofaspecialdomainandisbecomingmoreandmorevaluabletoallkindsofknowled

5、geengineeringapplication.Butwemustgetdomainontologybeforewecanapplyittotheapplicationsystem.Mostofontologiesready-madeWeremanIlalZyconstructed,whichisextremelytime-consumingandofhighcosts.Thispaperintroducesasemi-automaticontologyc0删沲仙池gmethodrootinginon

6、tologylearning,whichappliesageneralontologyinmdomainontologyconsm埘onwithnaturallanguageproccssingtechnology.ThiskindofontologylearningmethodtakesdomaindocumentsasknowledgeresoRree$.First,wegonstructacA)redomainontologythatcontainsonlyseveralconceptsandth

7、eirrelations.whichaleo盘enclassi矗catoryrelations.AndthenweextendtheCOredomainontologywiththeconceptsandrelationsfromgeneralontology.Intheprocessofenrichingthecoredomainontology,wemakethemostuseofthesemanticunitsfromthedomaindocuments,whicharea(1HKtedwilhn

8、aRlrallanguageprocessingtechnologies.Baseduponthetwostepsmentionedabove,wefurthanalyzetothesemanticunitsandextractmoredomainconceptsandrelationsaccordingtotheanalysisresults,whichhavenotbeenidentifiedbefore.Thelaststatisti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。