基于部分函数依赖的结构匹配方法

基于部分函数依赖的结构匹配方法

ID:14952699

大小:989.00 KB

页数:16页

时间:2018-07-31

基于部分函数依赖的结构匹配方法_第1页
基于部分函数依赖的结构匹配方法_第2页
基于部分函数依赖的结构匹配方法_第3页
基于部分函数依赖的结构匹配方法_第4页
基于部分函数依赖的结构匹配方法_第5页
资源描述:

《基于部分函数依赖的结构匹配方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于部分函数依赖的结构匹配方法本文工作受国家高技术863计划(项目编号:2007AA01Z309)、国家自然科学基金(项目编号:60873030)、国防预研基金(项目编号:9140A04010209JW0504、9140A15040208JW0501)及中央高校基本科研业务费专项资金资助的资助。E-mail:guohuili@hust.edu.cn,hustdxkun@163.com李国徽1)杜小坤1)杜建强2)1)(华中科技大学计算机学院武汉430074)2)(江西中医学院计算学院南昌330006)摘要模式匹配是模式集成、数据仓库、电子商务以及语义查询等领域

2、中的一个难点。它主要利用元素自身信息(如元素名、数据类型等信息)、数据实例信息(模式中的数据)和结构信息(模式元素相互关联的关系)来挖掘元素语义以获得正确的映射关系。本文介绍了一种将数据实例信息与结构信息相结合来辅助匹配的新方法。本方法首先根据模式对应的数据实例信息来计算模式元素间的部分函数依赖度(模式结构信息),然后根据部分函数依赖关系建立模式元素间的依赖图(图3),再根据元素依赖图计算元素间的结构相似度,最后得到模式元素间的映射关系。由于利用了更多的结构信息辅助匹配,所以本方法在性能上要优于其它仅使用完全函数依赖结构信息进行匹配的方法。实验表明本方法在查准

3、率、查全率以及全面性等各个指标上都优于已有的其它方法(图8、图9)。关键字模式匹配,部分函数依赖,结构匹配中图法分类号TP311.1311引言模式匹配是模式间的一个二元操作,它以源模式和目标模式为输入,以两个模式中元素(在关系型数据库中对应于关系的属性)间的映射关系为输出。随着数据库应用的日趋广泛,模式匹配在越来越多的应用领域中发挥着重要作用,如:模式集成、数据仓库、电子商务、语义WEB和P2P数据库等领域。目前的模式匹配工作大都是由操作人员手工进行,这就要求操作人员必须对数据库的模式结构以及每个模式元素的语义都很熟悉,这是一个枯燥、费时且容易出错的工作。随着

4、数据库技术的不断发展,数据库模式逐渐增大。数据库中有数百个关系、数千个属性都是比较常见的,而且它们由不同的设计人员设计,这就使得全面了解数据库的模式结构变得愈加困难,甚至是一个不太可能完成的任务,因此需要一种自动的模式匹配方法来代替费力、费时且容易出错的手工匹配。目前,这方面的研究成果已经相当丰富[1,2,3,4,5,6,7,8],它们分别利用模式中不同类型的信息来挖掘模式元素的语义,然后进行元素匹配。目前利用的信息主要有如下三种类型:(1)元素自身信息:元素自身信息(元素名,数据类型等)是模式中最基本的信息,是元素语义最直观的反映。早期对模式匹配的研究[2,

5、6,7,9]大多是基于元素自身信息。(2)数据实例信息:数据实例信息是模式描述的对象,所以也能够准确的反映元素语义,但是从大量的数据实例中提取准确的元素语义是一个很困难的过程。[10]是这方面的研究成果。(3)结构信息:模式中元素间的关联关系构成了模式的结构信息,结构信息能够有效地辅助匹配,但缺点是模式中定义的结构信息不够丰富(例如在关系型数据库中只存在元素间的主、外键关系)。16目前这方面的研究成果主要有[11,12]。目前模式匹配的研究中利用的结构信息主要是模式元素间的主、外键关系,它们由设计者在模式设计阶段指定。但主、外键关系并不能全面地反映出模式中元素

6、间的关联关系,因为设计者在设计模式结构时为了满足关系数据库严格的规范化定义,会省略某些关联关系或对其进行修正。如例1所示:例1:表1是某公司进销存管理系统数据库对供应商信息进行管理的一个关系,它包括供应商编号、名称、地址、电话、联系人、备注等信息。表1供应商信息表ManufaID(PK)CompanyNameAddressTelephoneLinkManSupTypeRemarkA02001南京通用电器有限公司南京苜蓿园大街128号025-84855496黄甘监控系统210007A02002深圳市新安锦辉电子厂深圳市宝安44区4号楼0755-29961658毛

7、维金电子器件518101A02003深圳市宝安区新安金海牛电子厂深圳市宝安44区4号楼0755-27837528梁鹭电子器件518101A03001慈溪市华威电子有限公司慈溪市桥头镇工业区0574-63550423毛维金电子器件315317A03002桂林市兴华探测器有限公司桂林市施家园路31-2号0773-5825656石伟安检门541004……………………………………从上表可以看出,关系以供应商编号(ManufaID)作为主键,因此属性ManufaID能够函数决定其它属性。除此之外,我们不能够发现其它的结构信息(元素间的关联),但通过与该关系的设计人员沟通

8、,我们发现它的各个属性间还存在着如下一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。