面向结构化数据本体自动构建技术的研究

面向结构化数据本体自动构建技术的研究

ID:33368294

大小:4.28 MB

页数:91页

时间:2019-02-25

面向结构化数据本体自动构建技术的研究_第1页
面向结构化数据本体自动构建技术的研究_第2页
面向结构化数据本体自动构建技术的研究_第3页
面向结构化数据本体自动构建技术的研究_第4页
面向结构化数据本体自动构建技术的研究_第5页
资源描述:

《面向结构化数据本体自动构建技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着Internet的飞速发展,信息系统在各行各业被广泛应用于管理和使用信息。由于计算机应用技术的不断变化,信息系统的技术实现手段和信息处理方式不尽相同,这就很难实现数据共享、数据交换和数据一致性,因而形成了无数的“信息孤岛"。信息集成技术的核心任务是将相互关联的多个数据源进行有效集成,屏蔽它们的分布性和异构性。现有的信息集成技术能够解决系统异构、模式异构等问题。但是由于计算机不具有像人一样的语义理解能力,所以语义异构问题的解决比较困难。本体作为一种能在语义和知识层次上描述信息系统的概念模型和建模工具,被引入信息集成领域正是为了解决语义冲突。本体的构建工作是本体存在的前提,决定了本体的

2、质量。目前,大部分本体都依赖领域专家手工构建。手工构建本体存在自动化程度低、工程复杂、专家依赖性强、本体构建速度慢、本体术语描述不精确等缺陷,限制了本体的发展。因此如何从众多的数据源中进行本体的自动构建逐渐成为本体技术的一个很有意义的研究重点。由于关系数据库的广泛使用,对结构化数据源的研究主要是针对于关系数据库进行的。但是,模式信息中所包含的语义信息十分有限,构建的本体不够全面。人们已经开始关注从元组数据中获得更多的语义信息以构建本体。本课题的研究重点就是面向结构化数据的本体自动构建。本文分析了该领域的现有状况和相关技术,提出基于模式信息的规则转换和面向元组数据与属性数据的语义挖掘相结合的方法

3、,自动化地从结构化数据中抽取出本体。模式转换阶段的主要任务是根据规则将模式信息转换成语义信息。这个阶段是本体构建的基础,将形成本体的大部分本体元素。本文首先将转换过程分成三个层次,并对每个层次提出相关的模型,然后对三个模型分别进行了描述和分析,并且对它们做出概念定义,针对这三个模型分析它们所包含的元素,以及这些元素之间的对应关系。在此基础之上,本文制定了与这些元素相关的语义转换规则和规则执行的一些辅助函数,构建了规则执行引擎这个应用系统。语义挖掘阶段的主要工作是从数据中挖掘语义信息,以补充模式信息的不足。本文首先将挖掘过程分成元组数据挖掘和属性数据挖掘两种情况,然后针对两种情况的处理流程分别进

4、行了描述和分析,对选择的CURE算法做了一些有利于自动挖掘的改进,使用卡方统计量检测每次聚类的合理性程度,修改了簇代表点的选择方法。在针对元组挖掘时,在CUREA聚类基础上判定关联的置信程度。在面向属性的挖掘时,在CUREA聚类的基础上构建决策树分类器,以便发掘属性间相似度,做进一步元组数据挖掘。在这些过程的基础上形成数据挖掘机。关键词本体自动构建;语义转换规则;语义挖掘AbstractWiththedevelopmentofInteract,informationtechnologiesareappliedinwiderfield.Indifferenttime,thetechnologie

5、sofinformationsystemanddataprocessingaresodifferentthattheycannotbeshared.Sothe“informationislands”areshap。d.InformationintegrationtechnologiesCansolvethesystem,patternandintegralityheterogeneity.Butsemanticinformationcallnotbeunderstoodashumanbeingbycomputer,semanticheterogeneityisamoredi伍cultprobl

6、em.Sinceithasbeenpresented,ontologyispaidmoreandmoreattentionasaconceptualmodelthatCanrepresentinformationsystematsemanticaspect,andisappliedinmanydomains.Nowmostontologiesarebuiltmanuallybyexperts.Manualmethodhasmanydisadvantages,highcomplexity,relyheavilyonexpert,timeconsumingandimpreciserepresent

7、.SohowtobuildontologyautomaticfromSOmuchdatahasbecomeasignificantfocus.Comparedtothestudyofnon-structuralandsemi.structuraldata,lessattentioniSpaidtostructuraldata.Moststudyfocusonrelationdatabasebeca

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。