基于数据元的数据集成技术研究

基于数据元的数据集成技术研究

ID:33545114

大小:358.79 KB

页数:5页

时间:2019-02-27

基于数据元的数据集成技术研究_第1页
基于数据元的数据集成技术研究_第2页
基于数据元的数据集成技术研究_第3页
基于数据元的数据集成技术研究_第4页
基于数据元的数据集成技术研究_第5页
资源描述:

《基于数据元的数据集成技术研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第11卷第18期2011年6月科学技术与工程Vol.11No.18June20111671—1815(2011)18-4223-05ScienceTechnologyandEngineering2011Sci.Tech.Engng.计算机技术基于数据元的数据集成技术研究时贵英文必龙王志宝(东北石油大学计算机与信息技术学院,大庆163318)摘要针对当前数据集成方法只能精确到属性级映射的缺陷,提出了基于数据元的数据集成方法。用数据元语义树对实体属性概念的内涵进行语义描述,使实体属性的语义能被计算机理解。然后通过语义计算实现精确到实例级的语义映射

2、,从而完成数据集成。关键词数据集成数据元语义树语义映射中图法分类号TP311.11;文献标志码A在我国信息化建设过程中,由于时间或部门不缺少对数据模式元素进行精确描述的语义方法。同,使得各企业开发了众多彼此独立的信息系统,本文提出的基于数据元的数据集成方法,通过对概积累了大量丰富的数据资源。随着企业规模的扩念的内涵进行形式化的语义描述,可以实现不同模大和计算机技术的发展,企业信息化建设势在必型之间,乃至实例级的语义映射。行。然而,由于建设时期不同,开发部门不同、使用设备不同、技术发展阶段不同等原因,使得数据存1数据元简介储管理极为分散,造成了大

3、量的数据冗余和数据不一致性,形成了众多的信息孤岛,使得数据资源难数据元是用一组属性描述定义、标识、表示和以共享访问。数据集成的核心任务是要将互相关允许值的数据单元,是在一定的环境下不必要再细联的分布式异构数据源集成到一起,使用户能够以分的最小数据单位。数据元是可识别和可定义的,透明的方式访问这些数据源[1]。每个数据元都有其基本属性,如:名称、定义、数据近年来,基于本体[2—5]的数据集成方法研究受类型、精度、值域等。一个数据元由数据元概念和到了高度的关注。基于本体的数据集成方法是建表示两部分组成。数据元概念(DataElementCon-ce

4、pt)是能以数据元的形式表示,且以任何特定的表立全局本体和具体数据源的局部本体,以及全局本示法无关的一种概念。当一个表示被联合到一个体和局部本体、局部本体之间的映射关系,完成异数据概念时就能够产生一个数据元。构数据源之间语义上的映射,最后将这种语义上的按照国家标准,数据元分为数据元概念、通用对应关系转换为数据查询,完成数据集成。但是基数据元、应用数据元。通用数据元提供的是一般的于本体的研究方法仅考虑了模型概念的外延即概内容,而非具体内容,具体内容则由应用数据元提念之间的关系,没有考虑概念的内涵,对实体属性出。如通用数据元可指“日期”、“姓名”,

5、而引伸出的语义只能依靠自然语言描述或分析模型的结构,来的应用数据元可以更为具体,如“考试日期”、“入2011年3月25日收到学日期”、“学生姓名”、“教师姓名”等。应用数据元第一作者简介:时贵英(1977—),女,汉族,河北石家庄人,硕士,东规定为一个独立应用的数据范畴。一个应用数据北石油大学计算机与信息技术学院讲师,研究方向:计算机软件工元必须来自某个通用数据元,遵循通用数据元给出程与集成技术。E-mail:dqpisgy@163.com。的框架。一个数据模型中的数据项由于限定于数4224科学技术与工程11卷据模型的应用范围,因此是一个应用数

6、据元。图1抽象语义树通常对应一个通用数据元,通过附加规描述了用于数据元结构的术语与传统的数据建模则节点可派生各种应用数据元。在数据元的语义术语的关联,在数据模型中,一个数据项可以等同树中,特定节点是根节点,对象类可被其它限定词于一个数据元,数据模型的数据元名称的典型形式进一步限定。在对数据模型中的数据项进行描述是实体名称和实体属性名称的合成,如图2所示。时,由于数据项与具体应用场景有关,所以在相应的数据元的语义描述上增加应用场景约束,才能真正地描述该数据项在数据模型中的语义。数据项数据元以属性、实体、约束为中心,通过对实体进行直接限定和间接限定

7、,构成对数据模型数据项语义的完整描述,图4所示。图1数据元结构图2数据模型中的数据元图4数据项的语义树[6]2数据元的语义树描述方法3基于数据元语义树的映射实现基于数据元的数据集成需要解决的一个关键3.1语义树中各节点的权值分配规则问题是语义的描述方法,本文采用的是语义树的描设N为语义树T中的任意一个节点,以N为根述方法,语义树提供了一种形式化的语义描述方的子树记为sub(N),N的子节点数为n,N的第i个式,可以方便地描述数据元的语义。子节点记为child(N,i),节点N的权记为W(T,N),子树sub(N)的权记为W(sub(N))。语义

8、树中各节点的权值分配规则如下:(1)W(T)=1;(2)W(sub(N))=W(T,N)+n∑W(sub(child(N,i)));i=11(3)W(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。