基于中文web的蔬菜领域本体概念及分类关系学习方法研究

基于中文web的蔬菜领域本体概念及分类关系学习方法研究

ID:33799029

大小:1.03 MB

页数:58页

时间:2019-03-01

基于中文web的蔬菜领域本体概念及分类关系学习方法研究_第1页
基于中文web的蔬菜领域本体概念及分类关系学习方法研究_第2页
基于中文web的蔬菜领域本体概念及分类关系学习方法研究_第3页
基于中文web的蔬菜领域本体概念及分类关系学习方法研究_第4页
基于中文web的蔬菜领域本体概念及分类关系学习方法研究_第5页
资源描述:

《基于中文web的蔬菜领域本体概念及分类关系学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分类号:单位代码:10019密级:学号:S10111232学位论文基于中文Web的蔬菜领域本体概念及分类关系学习方法研究LearningConceptsandTaxonomicRelationsfromChineseWebDataforVegetableDomainOntologyConstruction研究生:孙琛指导教师:赵明副教授合作指导教师:申请学位门类级别:理学硕士专业名称:地图学与地理信息系统研究方向:本体学习所在学院:信息与电气工程学院二○一二年五月独创性声明本人声明所呈交的论文是我

2、个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中国农业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:时间:年月日关于论文使用授权的说明本人完全了解中国农业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文

3、。同意中国农业大学可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。(保密的学位论文在解密后应遵守此协议)研究生签名:时间:年月日导师签名:时间:年月日中国农业大学硕士学位论文摘要摘要本体作为一种能在语义和知识层次上描述系统的概念模型,是语义Web的基础。本体还广泛应用于知识工程、信息提取和检索、搜索引擎、自然语言处理和电子商务等各个方面。农业本体是未来农业语义网的语义基础,同时也是农业本体服务的基础,在农业知识管理领域起着重要作用。本体的应用是在本体构建的基础上实现的。然而手工构建本

4、体存在的诸多问题导致手工构建无法适应当前本体构建及应用的需要。本体学习代替手工构建本体可以解决手工构建的各种不足。然而当前对本体学习研究的进展仍比较缓慢。对该领域继续深入的研究,尤其是对基于中文Web数据本体学习的研究,无论对本体构建还是对本体应用都至关重要。本文针对农业本体学习,尤其是基于中文Web数据进行农业本体学习相对薄弱的现状,以Web上的蔬菜文本为语料,开展蔬菜本体概念和分类关系学习方法的研究,研究建立基于中文Web数据的蔬菜本体概念体系结构学习的有效方法。本文的贡献包括:(1)将通用的

5、本体学习方法应用于农业领域本体学习中,作为对手工构建农业本体的补充,从而提高农业本体构建的效率。同时对这些方法进行了一定的改进,也将有利于通用方法的完善。(2)以Web上协同维护具有维基特点的网络百科全书百度百科的蔬菜文本为本体学习的语料,并探讨数据源所包含的结构化信息在本体学习过程中的作用。将百度百科应用于本体学习,并对其中结构化的信息进行探讨和利用,也是本研究区别于过去中文领域本体学习的一个特色。(3)研究了基于浅层自然语言处理的语言学和TFIDF、C-值等统计量的统计学混合策略进行蔬菜本体术

6、语抽取的方法、以及语义消歧和同义词识别的方法;并深入探讨了一些细节。TFIDF和C-值两个统计量相结合的统计方法大大提高了概念抽取的查准率。(4)在分类关系抽取时,针对同一领域的本体在面向不同应用时分类结构可能不同的情况,提出了基于预置的目标本体一个已知分支,并采用余弦距离进行语义相似度计算,从而面向不同应用目的抽取概念间分类关系的方法。这也是本文的创新之处。(5)研究开发相应的软件原型,并使用该原型来构建蔬菜领域本体的概念体系结构;评价概念和分类关系抽取的好坏,以此来验证本文提出的领域本体概念体

7、系结构学习方法的有效性和可行性。本文是对中文Web上百度百科数据用于农业领域本体学习,所进行的探索性研究。综合多种语言学要素、多个统计量、以及结构化信息等,在概念抽取方面达到了较好的查全率和查准率。基于预置的目标本体的分支构建分类关系的思路,提高了本体分类关系构建的准确度和效率,使得结果能够趋近于目标本体。从而能满足本体构建者和使用者的要求,同时也减轻了本体构建人员的工作量。关键词:中文Web,蔬菜本体,百度百科,概念学习,分类关系学习I中国农业大学硕士论文AbstractABSTRACTOnto

8、logieswhichprovidetheconceptualizationmodelofknowledgerepresentationarethebasisofSemanticWeb.Also,weareseeingagradualriseintheadoptionofontologiesacrossmanydomainssuchasknowledgeengineering,informationretrieval,NLP,e-commerceandsoon.Agricultur

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。