欢迎来到天天文库
浏览记录
ID:20746539
大小:48.50 KB
页数:13页
时间:2018-10-15
《基于形式概念分析的领域本体描述模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于形式概念分析的领域本体描述模型研究[摘要]针对如何运用形式概念分析(FCA)协助完成领域本体的描述问题,先阐明基于FCA的颂域本体描述原理,进而提出基于FCA的领域本体描述模型,最后以脊椎动物领域为例,给出一个基于FCA的脊椎动物领域本体描述的实例。[关键词]概念格领域本体本体描述本体推理[分类号]G350领域本体描述是一切基于领域本体的知识工程活动的前提,提高领域本体描述的形式化与规范化程度、语义表达能力和本体知识推理能力就成为领域本体描述所一直追求的目标。形式概念分析(FCA)是应用数学的一个分支,它是建立在概念和概念层次的数学化基础之上的一种新的知识描述手段和数
2、据分析工具,运用形式概念分析的方法,可以发现、构造和展示由属性和对象构成的概念及其之间的关系。FCA和领域本体是两种形式化的知识表示方法,文献指出两者的差异主要体现在:本体的目的是对人能感觉到的现实世界建立共享的概念模型,提供一种共识以支持知识密集型应用。FCA不是为现实建模,而是为人工世界建模,目的是支持用户在给定数据的基础上进行颂域分析和建模。FCA中概念的外延和内涵是同样重要的两方面,而本体则强调概念的内涵部分。FCA已被尝试用于领域本体的描述,代表性的文献有[4-6]等,这为基于FCA的领域本体描述理论的产生提供新的契机。利用FCA可以完善领域概念的属性集和对象集
3、,提高领域本体的语义完备性和形式化程度,自动分析领域的隐藏概念,并对领域概念进行聚类,从而为本体分类关系提供参考,帮助建立领域本体原型。另外,概念格可以帮助完善用描述逻辑进行本体推理的实际情境,为本体推理的公理和规则的编写提供便利。本文旨在深入研究运用概念格协助完成领域本体描述的基本原理,并提出基于FCA的领域本体描述模型,为后续相关研究奠定基础和提供启发。1基于FCA的领域本体描述原理基于FCA的领域本体描述基本原理可简述如下:领域本体的描述,必须自始至终贯彻工程化的指导思想、标准化的表达方式和规范化的工作步骤。在需求分析的基础之上,通过预处理过程,将颂域的结构化、半结
4、构化及非结构化数据转换为领域核心术语集(即核心词汇集),进而将领域核心词汇集依据“对象一属性”的二元关系转换为形式背景,用形式背景来表达领域背景知识。形式背景形成后,在对其优化处理的基础上,通过造格过程,将形式背景转换成概念格,并用相关工具将概念格显化,接着根据实际需求对概念格进行规范化的编辑操作,得出满足领域本体使用需求的合理概念格,此时,可视化的概念格可以良好地展现出概念层次模型,概念层次清晰地体现了概念间的分类关系。在上述过程的基础上,将概念格通过相关操作转换成领域本体原模型,并在领域专家的参与下对领域本体原模型进行属性、实例、关系和公理规则等多方面的充实,最终通过
5、领域本体的形式化过程,用本体描述语言将领域本体表达出来。最后用领域本体推理过程,对领域本体进行检测,并推理出相关隐性知识。基于FCA的领域本体描述模型根据基于FCA的领域本体描述原理,本文将运用FCA描述领域本体的过程分为四个阶段:准备阶段、分析阶段、描述阶段和推理阶段。从实际操作的层面上来看,上述四个阶段每阶段都包涵着许多错综复杂、相互作用的要素和内容,这给理解和掌握基于FCA对颂域本体进行描述这一过程的本质造成了一定的困难。因此,本文采用模型化的思路,抓住这四个阶段中的主要要素并摒弃次要要素,进而深入研究各主要要素间的关系,对基于FCA的领域本体描述过程进行抽象,构建
6、了基于FCA的领域本体描述模型,如图1所示:各模块的主要任务概述如下:2.1准备模块该模块主要解决领域本体描述的前期准备问题。在知识工程专家、领域专家和领域本体用户三方面对所要建设的领域本体进行深入需求分析的基础上,搜集领域数据,并将其分为三类:结构化数据、半结构化数据、非结构化数据。随后使用相关技术(映射技术、NLP技术等)从各类数据中抽取出领域核心术语集,并将术语集的格式统一为“对象一属性”集,文献[7]阐述了具体的方法:①对结构化数据(一般为关系数据库表),利用逆向工程或映射技术将关系模型转换为已_R图,用数据库表的元组作为对象,而数据库表的属性作为属性,E_R模型
7、的关系表述概念间的关系;②对非结构化数据(一般是颂域纯文本)的处理比较复杂,一般是通过自然语言的解析器,将领域文本中的每一个句子转换成一棵语法树,由语法树来分析,将词汇关系分为动宾关系、并列关系、偏正关系、主谓关系等,进而将这些关系转换成“对象一属性”关系;③半结构化数据一般是大量的XML格式的网页以及它们遵循的文档类型定义(XMLSchema或DTD)等具有隐含结构的数据。半结构化数据具有结构化数据和非结构化数据的特征,从半结构化数据中抽取需要运用映射技术和自然语言分析技术相结合的办法来获取领域中的“对象一属性”关系。2.2
此文档下载收益归作者所有