基于非结构中文数据源的本体学习

基于非结构中文数据源的本体学习

ID:33287591

大小:3.14 MB

页数:67页

时间:2019-02-23

基于非结构中文数据源的本体学习_第1页
基于非结构中文数据源的本体学习_第2页
基于非结构中文数据源的本体学习_第3页
基于非结构中文数据源的本体学习_第4页
基于非结构中文数据源的本体学习_第5页
资源描述:

《基于非结构中文数据源的本体学习》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:——UDC:——密级:——编号:——工学硕士学位论文基于非结构中文数据源的本体学习硕士研究生:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩日期:学位授予单位:陈绍琛刘大昕教授工学硕士计算机软件与理论计算机科学与技术学院2009年1月2009年2月哈尔滨工程大学哈尔滨工程大学硕士学位论文摘要近年来,本体在信息检索和语义网等领域中发挥着越来越重要的作用。但是手工构造本体却是一项繁琐的工作。如何从大量中文文献中自动或半自动地获得本体,成为本体在中文环境下推广、应用的一个重要课题。本体学习是指利用人工智能、自然语言处理等众多学科

2、技术来实现本体的半自动构建。本体学习任务主要包括本体所包含的各个元素的自动或半自动获取,例如概念获取以及概念间关系的获取等。本文在借鉴国内外现有本体学习理论、方法的基础上,结合中文自然语言的研究成果,针对特定领域的中文文本文档,对领域本体概念获取和概念间关系的获取展开了研究。在概念的获取方面,本文提出以一种多策略中文本体概念获取方法,综合统计、中文分词等技术半自动地提取领域概念,并以领域一致度、领域相关度等统计方法筛选提取的概念。在提取概念关系方面,本文重点研究以语境模式的方法提取概念间关系。本文对语境模式进行了较深入的研究,提出单旬模式、多句模式

3、和段模式三种不同的语境模式。另外,对语境模式的半自动生成作初步的研究,并提出了若干算法。最后,本文实现了一个中文本体学习系统用以试验本文提出的方法的可行性。关键词:本体;中文本体学习;语境模式;概念获取;领域概念间关系获取哈尔滨工程大学硕十学位论文AbstractIntherecentyears,ontologyisplayingamoreandmoreimportantroleinknowledgemanagementandthesemanticweb.Buttobuildtheontologybyhandisacomplicatedwork.I

4、thasbecomeanimportantsubjecttoacquireChineseOntologyfromcorpusofdifferentfieldsinordertoextendandimplementsemanticwebinChina.Theontologylearningaimsatbuildingontologyautomaticallyorsemi-automaticallybytheuseofartificialintelligence,naturallanguageprocessingandmanyotherareaofsc

5、ience.Theontologylearningreferstotheextractionoflearningcontentandusesthiscontenttoconstructontology.Themaintaskofontologylearningconsistsofautomaticorsemi-automaticacquisitionofeveryelementcontainedinontology,suchasconceptlearningandrelationlearning.BasedOiltheexistingontolog

6、ylearningtheory,methodsandtechniquesfromabroad,combiningtheresearchfruitsofChinesenaturallanguageprocessingfield,twoalgorithmsareraisedinthispaperontheconceptextractionandrelationextraction.Ontheconceptside,amethodcomesupwithbasedontheidea“differentconstructionofconceptondiffe

7、rentfield”.Andsiftconceptsbydomainrelevanceanddomainconsensus.Ontherelationextractionside,relationsareabstractedbythewayofsentencepattern.In-depthstudyWasdoneinthesentencepareranddivideditintosingle-sentencepattern、multi—sentencepatternandsegmentpattem.Somealgorithmsforsemi·au

8、tomaticgeneratingpattemareproposedhere.Finally,Chineseontolog

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。