基于林业科学数据语义检索研究

基于林业科学数据语义检索研究

ID:33337611

大小:11.87 MB

页数:130页

时间:2019-02-24

基于林业科学数据语义检索研究_第1页
基于林业科学数据语义检索研究_第2页
基于林业科学数据语义检索研究_第3页
基于林业科学数据语义检索研究_第4页
基于林业科学数据语义检索研究_第5页
资源描述:

《基于林业科学数据语义检索研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、DissertationfortheDegreeIIlllIIIIlllIIIIIIIlY2405327Candidate:ZhangNaijingSupervisor:Prof.JuHongboAssociateSupervisor:AssociateProf.JiPingAcademicDegreeAppliedfor:DoctorSpeciality:ForestManagementDateofDefence:20June2013Degree·-Conferring-·Institution:ChineseAcade

2、myofForestry独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得本研究生培养单位或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:蔼调日期:j驴,3年∥月夕矿日学位论文版权使用授权书本学位论文作者完全了解中国林业科学研究院有关保留、使用学位论文的规定,中国林业科学研究院有权保留并向国家有

3、关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权中国林业科学研究院可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:硝谰2伊,岁if-莎月2.0日新签名:器易舻二9,弓年乡月.20日学位论文作者毕业联系方式工作单位:中国林业科学研究院资源信息所联系电话:电子邮件:Tfista@caf.ac.cn通讯地址、邮编:北京市海淀区颐和园后中国林科院资源所100091摘要随着技术的发展和观念的变更,We

4、b已经成为人们获取信息的主要来源之一,承载的信息量以爆炸方式急剧增长,它在带给人们大量信息的同时,也使准确检索所需信息变得困难。给Web赋予语义信息,将Web作为基于知识的资源共享平台,让人们更加方便快捷地获取信息,是Web发展的必然趋势。科学数据共享工程是国家科技创新体系建设的重要内容,也是我国科技发展基础条件大平台的重要组成部分。林业科学数据共享工程作为其中之一,门户网站林业科学数据中心在十多年的建设和运行服务中不断地深化和拓展,影响范围不断扩大,数据量也不断增加。面对如此大量的林业科学数据,如何让使用者更加快速、便捷

5、地查找到所需内容是平台不断探索和追求的目标。针对传统信息检索中存在的问题,本文尝试从语义的角度挖掘隐藏在数据背后的信息和规律,以期为用户提供更高质量的数据服务。语义信息检索是一种在传统信息检索方法的基础上与领域本体知识管理、数据挖掘和自然语言处理相结合的新技术。本文针对基于本体的语义信息检索进行了深入的研究,以林业科学数据本体为基础,提出了基于林业科学数据的语义信息检索模型,并从系统的角度对本体知识模型、文档的语义预处理、语义查询扩展以及语义检索等主要技术方法进行了分析和研究,主要内容和结论如下:(1)以本体的构建理论及技

6、术为指导,构建了林业科学数据本体模型。详细阐述了本体模型中,概念集的选取、核心概念的主要关系和属性及属性之间的关系。为基于林业科学数据本体的语义信息检索提供了重要的基础。(2)对语义Web框架进行研究,描述和分析了林业科学数据本体知识模型的维护、存储、推理及查询方法。经过比较研究发现:本体的TDB持久化存储方案比关系数据库更为高效,实验中,前者存储本体的效率最多优于后者60倍;同样,使用Jena和Pellet推理相结合的方法对林业科学数据本体进行陈述三元组推理比单独使用其中一种的推理方法的效率高10%以上。(3)对文档进行

7、语义预处理研究。经过对现有林业科学数据的分析,构建了领域词典,专业词汇达7万余条,提高了分词的精度;以向量空间表示词汇在文档中的特征权重,从林业科学数据本体中提取了特征概念集,并作为聚类中心,以余弦相似度作为距离函数,使用改进的缸均值模型对文档进行聚类,并对聚类文档的倒排索引方法进行分析。实验表明使用该聚类方法的聚类结果正确率为81.4%。(4)提出了一种语义查询扩展方法。将用户的查询请求分为单关键词、多关键词和疑问句3种情况进行分析处理。单关键词使用改进的语义相似度进行查询扩展;多关键词使用语义推理和语义相似度相结合的查

8、询扩展方法;对于疑问句探索性的提出了基于句法分析和语义推理相结合的查询扩展方法。这些语义查询扩展方法是实现语义信息检索的核心内容。(5)在前文介绍的相关理论和研究的基础之上,利用语义Web框架设计开发了基于林业科学数据的语义信息检索系统,实现了信息的语义查询方式。并且通过实验分析,与传统基于关键词匹配的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。