XML文档到数据库数据转换研究.pdf

XML文档到数据库数据转换研究.pdf

ID:54017043

大小:237.18 KB

页数:8页

时间:2020-04-28

XML文档到数据库数据转换研究.pdf_第1页
XML文档到数据库数据转换研究.pdf_第2页
XML文档到数据库数据转换研究.pdf_第3页
XML文档到数据库数据转换研究.pdf_第4页
XML文档到数据库数据转换研究.pdf_第5页
资源描述:

《XML文档到数据库数据转换研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2004年2月北京邮电大学学报Feb.2004第27卷第1期JOurnalOfBeijingUniversityOfPOstsandTelecOmmunicatiOnsVOl.27NO.1文章编号,1007-5321(2004)01-0084-05XML文档到数据库数据转换研究邓芳(北京邮电大学计算机科学与技术学院,北京100876)摘要,探讨了XML文档到数据库数据转换的方法,结合实例分别给出了基于XMLSchema的文档到关系数据库和对象-关系数据库转换的方法,可以在基于XML的数据交换和集成中得以应用关键词,

2、XMLSchema;关系数据库;对象-关系数据库中图分类号,TP301.2文献标识码,AConVersionfromXMLDocumentstoDatabaseDENGFang(COmputerScienceandTechnOlOgySchOOl,BeijingUniversityOfPOstsandTelecOmmunicatiOns,Beijing100876,China)Abstract,AmethOdtOcOnvertextensiblemarkuplanguage(XML)dOcumentstOdatas

3、tOredindatabaseisdiscussed.AexampleisgivenbaesdOnwhichwaysfrOmXMLSchematOrelatiOnalandObject-relatiOnaldatabaseareimplemented.ThewayscanbeappliedtOdataexchangingandintegratiOn.Keywords,XMLSchema;relatiOnaldatabase;Object-relatiOnaldatabaseXML(extensiblemarkupl

4、anguage)作为SGML的一个子集,1998年成为W3C推荐的Web上的数据表示和交换的标准.XML以其简单性~可扩展性~互操作性~开放性等特点受到关注和欢迎,在很多方面得到应用,如设计行业领域置标语言~进行文件保值~数据交换~支持Web应用的互操作和集成等,特别是在数据交换和互操作方面,XML以其显著的优势成为数据交换~存储的中介和工具[1].在这方面,人们主要从两个不同的角度进行了研究,一个是[2][3,4]XML数据本身的表示~存储和管理;另一个是XML数据和数据库数据之间的转换.本文主要从后一个角度进行

5、探讨.在研究XML数据与数据库之间进行转换中,常见的方法和方向是,(1)根据XMLDTD文档进行数据的转换;(2)研究XML数据到关系数据库或对象数据库之间的转换.本文在此基础上,主要从以下两个不同的方面进行讨论,(1)考虑以XMLSchema文档进行数据转换;(2)不仅考虑XML数据到关系数据库,也考虑到对象-关系数据库的转换,因为后者目前在市场上比纯关系数据库或纯对象数据库应用更为广泛.收稿日期,2002-07-10基金项目,国家自然科学基金项目(60242002)作者简介,邓芳(1972-),女,副教授E-m

6、ail,dengfang@bupt.edu.cn第1期邓芳XML文档到数据库数据转换研究851XML到关系数据库的数据转换在XML数据转换到数据库中时,考虑到有可能还需要再从数据库导出,我们不仅保存数据,还保存XMLSchema中定义的元素间关系.作为元数据存储,类似于关系数据库中数据字典存储内容.整个转换分为以下几步C1D建立元数据字典通过扫描Schema文件,XMLSchema中主要定义了文档中能够使用的元素和属性,即文档的信息结构,在这里元数据字典中用两张关系表ELEMENT和ATTRIBUTE来存储信息结构

7、和属性定义.XML文档描述的半结构化数据中大都表现为某种图和树的结构,所以在元素关系表ELEMENT中将这种结构表现出来ELEMENTCNAME,DATA-TYPE,ATTRIBUTE-TYPE,PARENT,FIRSTC~ILD,NEXT,0RDER,MIN0CCURS,MAX0CCURSDNAME元素名称DATA-TYPE元素数据类型ATTRIBUTE-TYPE元素属性类型或属性PARENT父元素名称,缺省为NULL,如果最终值为NULL,则说明此元素为某一R00T节点FIRSTC~ILD第一个子元素的名称,缺

8、省为NULL,如果最终值为NULL,则说明此元素为叶节点NEXT下一个兄弟元素的名称0RDER子元素是否严格遵循顺序,取值遵循Schema定义MIN0CCURS,MAX0CCURS元素值出现的次数,分别取O~1~%表示XML中可选子元素~-'型重复元素和%'型重复元素.在ATTRIBUTE中存储类型定义的相关信息ATTRIBUTECNAME,ELEMENT-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。