资源描述:
《基于知识库的渔业领域本体学习算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第26卷第2期大连海洋大学学报Vol.26No.22011年4月JOURNALOFDALIANOCEANUNIVERSITYApr.2011文章编号:2095-1388(2011)02-0168-05基于知识库的渔业领域本体学习算法于红,刘溪婧(大连海洋大学信息工程学院,辽宁大连116023)摘要:分析了现有本体学习方法的基本思想及其应用于渔业领域本体学习的局限性,结合渔业领域概念的特点,提出了一种基于知识库的渔业领域本体学习算法,给出了算法的详细描述,并用实验验证了算法的性能。结果表明,该算法的召回率较高,但准确率稍低一些。关键词:知识库;本体学习;渔业本体中图分类号:TP311郾
2、133摇摇摇摇文献标志码:A摇摇作为一种知识表示方式,本体被广泛应用于领组从关系模型到本体的映射规则。基于这些规则能域搜索引擎、语义Web、智能信息集成和知识管够直接得到一个候选本体,然后进一步对该候选本[1][5]理等领域。在建立渔业搜索引擎过程中,渔业体进行评价和精炼,生成最终的本体。Astrova提领域本体对提高搜索引擎的查全率和查准率起到重出,由于HTML表格是Web上用户和数据库交互要的作用。然而领域知识并不是一成不变的,它会最常用的界面,所以在无法获得数据库模式信息的随着时间的推移而不断变化,因此最初建立的本体情况下,可以通过分析这些HTML表格的结构和[2]库需要不断更
3、新。初始的渔业领域本体库是在数据来获取关系数据库的语义,从而构建本体。高[6]综合了若干渔业领域专家的意见之后采用手工方式军等提出了一种基于Ontology的半自动Web内建立的。用手工方式建立和更新本体是一项庞杂而容精确二阶段提取的方法,在提取过程中利用上下乏味的工作,而本体的更新则是一个连续的工作。文无关文法来表示并提取HTML节点内部数据,用手工方式更新渔业领域本体需要不断地与渔业领使得数据提取的粒度更小,提取精度更高,是一种[7]域专家沟通,在实际应用中有一定困难,因此,渔有监督自学习的方法。方卫东等为获取领域本业领域本体的更新成为渔业领域本体应用的瓶颈。体并量化概念关系的可
4、信度,提出了一种基于要想解决这一瓶颈,就必须研究渔业领域本体学习Web挖掘的学习模型。通过可扩展的模式集和分算法,采用自动或半自动的方法对渔业领域本体库布语义模型获取本体主干,使用关联规则发现概念进行更新,这对促进渔业领域本体的应用有着非常间的一般关系,对候选本体进行修剪和合并。模式重要的意义。可信度、概念语义距离与关联特征决定了概念间关本研究中,作者通过对基于知识库的渔业领域系的可信度。综合分析上述本体学习算法,不难发本体学习算法的相关工作进行分析,阐述了基于知现,现有的本体学习算法要么采用数据库属性中包识库的渔业领域本体学习算法的基本思想,并用实含的语义信息来进行本体学习,这需要
5、有特定数据验验证了该算法的效率。库的支持;要么用关联规则来进行本体学习,关联规则对学习概念间的相关关系效果较好,但是对概1摇相关工作念间关系种类的确定还需要人工干预,因此关联规本体学习的相关研究在欧洲开展得较为广泛。则是一种半自动本体学习方法。[3]Maedche等最先描述并评价了将关联规则应用于渔业领域本体库中概念间的模式规律性比较[4]本体学习的方法。Stojanovic等通过考察数据库强。既然已经建立了渔业领域本体库,则可利用本中的表、属性、主外键和包含依赖关系,给出了一体库中的本体从语料中学习渔业领域概念间的关系摇收稿日期:2010-04-09摇基金项目:辽宁省教育厅高等学校
6、科研计划项目(05L090);大连市青年基金资助项目(2005J22JH038);大连海洋大学博士启动基金资助项目(sybs200712)摇作者简介:于红(1968-),女,教授。E-mail:yuhong@dlou郾edu郾cn第2期摇摇摇摇摇摇摇摇摇摇于红,等:基于知识库的渔业领域本体学习算法169模式来发现新的本体,以完成本体更新工作,这是系统性能的影响不是很明显。随着本体库的不断更一种有效的本体自动更新手段。新,本体库的规模会逐渐增加,查询操作的速度对系统性能的影响很大。为了能对本体库进行有效索2摇基于知识库渔业领域本体学习算法引,提高对本体库的操作效率,需要修改本体的表2郾
7、1摇本体表示示方式。本研究中以三元组的形式来描述渔业领域的概念及概念间的关系,同时本体学习算法中需要本研究中建立的渔业领域本体库用OWL语言进行OWL文件到三元组文件的转换。描述渔业本体,用Prot佴g佴3郾1郾1作为本体建模工三元组是由OWL文件转换而来的,三元组的具,用手工的方式建立本体库,生成的本体是以[8]基本格式为掖概念1,概念2,关系业,在进行具体应OWL文件的形式存在。用时可以分别对关系、概念、概念对进行索引。OWL文件可以用Prot佴g佴建