欢迎来到天天文库
浏览记录
ID:33287591
大小:3.14 MB
页数:67页
时间:2019-02-23
《基于非结构中文数据源的本体学习》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:——UDC:——密级:——编号:——工学硕士学位论文基于非结构中文数据源的本体学习硕士研究生:指导教师:学位级别:学科、专业:所在单位:论文提交日期:论文答辩日期:学位授予单位:陈绍琛刘大昕教授工学硕士计算机软件与理论计算机科学与技术学院2009年1月2009年2月哈尔滨工程大学哈尔滨工程大学硕士学位论文摘要近年来,本体在信息检索和语义网等领域中发挥着越来越重要的作用。但是手工构造本体却是一项繁琐的工作。如何从大量中文文献中自动或半自动地获得本体,成为本体在中文环境下推广、应用的一个重要课题。本体学习是指利用人工智能、自然语言处理等众多学科
2、技术来实现本体的半自动构建。本体学习任务主要包括本体所包含的各个元素的自动或半自动获取,例如概念获取以及概念间关系的获取等。本文在借鉴国内外现有本体学习理论、方法的基础上,结合中文自然语言的研究成果,针对特定领域的中文文本文档,对领域本体概念获取和概念间关系的获取展开了研究。在概念的获取方面,本文提出以一种多策略中文本体概念获取方法,综合统计、中文分词等技术半自动地提取领域概念,并以领域一致度、领域相关度等统计方法筛选提取的概念。在提取概念关系方面,本文重点研究以语境模式的方法提取概念间关系。本文对语境模式进行了较深入的研究,提出单旬模式、多句模式
3、和段模式三种不同的语境模式。另外,对语境模式的半自动生成作初步的研究,并提出了若干算法。最后,本文实现了一个中文本体学习系统用以试验本文提出的方法的可行性。关键词:本体;中文本体学习;语境模式;概念获取;领域概念间关系获取哈尔滨工程大学硕十学位论文AbstractIntherecentyears,ontologyisplayingamoreandmoreimportantroleinknowledgemanagementandthesemanticweb.Buttobuildtheontologybyhandisacomplicatedwork.I
4、thasbecomeanimportantsubjecttoacquireChineseOntologyfromcorpusofdifferentfieldsinordertoextendandimplementsemanticwebinChina.Theontologylearningaimsatbuildingontologyautomaticallyorsemi-automaticallybytheuseofartificialintelligence,naturallanguageprocessingandmanyotherareaofsc
5、ience.Theontologylearningreferstotheextractionoflearningcontentandusesthiscontenttoconstructontology.Themaintaskofontologylearningconsistsofautomaticorsemi-automaticacquisitionofeveryelementcontainedinontology,suchasconceptlearningandrelationlearning.BasedOiltheexistingontolog
6、ylearningtheory,methodsandtechniquesfromabroad,combiningtheresearchfruitsofChinesenaturallanguageprocessingfield,twoalgorithmsareraisedinthispaperontheconceptextractionandrelationextraction.Ontheconceptside,amethodcomesupwithbasedontheidea“differentconstructionofconceptondiffe
7、rentfield”.Andsiftconceptsbydomainrelevanceanddomainconsensus.Ontherelationextractionside,relationsareabstractedbythewayofsentencepattern.In-depthstudyWasdoneinthesentencepareranddivideditintosingle-sentencepattern、multi—sentencepatternandsegmentpattem.Somealgorithmsforsemi·au
8、tomaticgeneratingpattemareproposedhere.Finally,Chineseontolog
此文档下载收益归作者所有