欢迎来到天天文库
浏览记录
ID:33174890
大小:1.99 MB
页数:70页
时间:2019-02-21
《基于本体的半结构化数据集成研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学技术大学硕士学位论文基于本体的半结构化数据集成研究姓名:杨洋申请学位级别:硕士专业:计算机软件与理论指导教师:岳丽华20040501中l母科学技术大学硕七论文墓=r奉体的半结构化数据集成研究摘要伴随着互联网的发展,信息来源种类的增多,信息复杂性的增加,传统的数据存储和交换方式已经不能够满足实际应用和研究的需要,XML作为半结构化数据存储和交换的标准,正在被广泛的应用,而对于半结构化数据源的集成也日益成为研究的热点。对于基于XML的半结构化数据源的集成不同于传统的数据库集成,XML的树型层次模型不同于扁平的实体对象模型,因此不能用传统的基于数据库
2、视图的集成方法。XML模式具有层次结构和约束关系,在数据模型中包含一定的结构信息,因此研究者提出了基于全局模式和局部模式的集成方法,通过在模式之间建立映射关系,将基于全局模式的查询转化为基于局部模式的查询,映射根据粒度可以在部分模式之间,路径之间,或者标签之间建立,基于模式映射的方法能够较好的解决部分应用范围的集成问题。因为模式是一个纯语法结构,对于复杂模式间的映射和查询通常较复杂,为了解决模式集成中的一些问题,本文提出一种基于本体的数据集成方案,可以看作是对模式集成方法的一种拓展,主要贡献在于提出一种语义驱动的查询建立模型,一种本体与数据源模式的映射
3、模型和基于此模型的查询分解算法,以及针对数据源的查询语言转换算法。基于本体的集成方法是一种自上而下的集成过程,与模式集成相比本体是一个有向图结构,没有根节点,每一条边都具有对应的语义,查询树可以从任意节点建立,基于本体和映射规则的查询处理算法可以很好的将摹于本体的查询转化为基于数据源的查询计划,并且具有较好的扩展性。最后通过~个原型系统来证明集成框架的功能性和可行性。关键词:本体数据源模式集成映射查询绑定查询分解巾J耐罩斗学技术人学硕七论土基于本体的半鲇构化数据集成研究ABSTRACTAlongwithtiledeVelopmentofinternet
4、.kindsofinformationsourcesandcomplexityofinformationaremoreandmore.Traditionaldatastorageandexchangemethodscan’tSuppl)enoughsupportt、orapplicationandresearchrequirementtoday.WithXMLappliedmoreⅦidely.ithasbeenthestandardforsemi-structureddatastorageandexchange,andtheintegrationof
5、semi-structureddatasoHrceshasbeenoneofthehotresearchtopicsnOW.Thexml·-basedintegrationmethodsaredifferentwiththetraditionaldatabase.-basedonesbecausetheyarebasedontotall)differentdatamodelsthatoneistree-likemodelandtheotherisplatE—Rmodel.XMLSchemaincludesstructureandrestrictioni
6、nformationwhichimplysomephraseknowledge.Someresearchersadvanceanintegrationmethodwhichisbasedonmappingrulesbetweenglobalschemaandlocalschema.Mappingcarlbemadebetweentags.pathsandDTDs.Thisisagood、、ayundersomeintegrationconditions.BecauseXMLschemaisapuresyntaxstructure,themappingr
7、ulesandquerytransformationsbet、~eenthemaremorecomplicated.Sothispaperproposesanontology—basedintegrationframework.Themaincontributionsareasemantic—drivedquer)model,amappingmodelbetv,eenontologyanddatasourcesschemas,querydecompositionalgorithmandquer)’languagetransformationalgori
8、thmaimingatdataSources.Ontology—basedintegratio
此文档下载收益归作者所有