欢迎来到天天文库
浏览记录
ID:54017044
大小:440.57 KB
页数:11页
时间:2020-04-28
《XML数据的结构化处理方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第39卷第7期计算机研究与发展Voi.39,No.72002年7月JOURNALOFCOMPUTERRESEARCHANDDEVELOPMENTJuiy2002!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!XML数据的结构化处理方法施伟斌!"孙未未!施伯乐!!(复旦大学计算机与信息技术系上海200433)"(上海理工大学电子信息工程系上海200093)(iy008136@oniine.sh.cn)摘要越来越多的数据采用XML格式表示和交换
2、,对XML数据的有效访问方法是目前需要解决的关键问题之一.对通过面向对象数据库系统访问XML数据的方法进行了讨论,提出了将XML数据映射到对象模型的规则以及建立XML数据的OODB模式的方法.为了建立高效地访问路径提出了一种XML数据的结构索引,并介绍了利用结构索引实现基本的数据操作的方法.实验结果表明,提出的方法具有较高的效率.关键词XML,数据模型,面向对象的数据库,模式,结构索引中图法分类号TP311AMETHODFORSTRUCTURIZATIONOFXMLDATASHIWei-Bin!",SUNWei-Wei!
3、,andSHIBai-Le!!(DepartmentofComputerandInformationTechnology,FudanUniuersity,Shanghai200433)"(DepartmentofElectronicInformationEngineering,UniuersityofShanghaiforScienceandTechnology,Shanghai200093)AbstractInthispaper,theauthorsdiscussamethodforaccessingXMLdatath
4、roughobject-orienteddatabasesystem.TheyproposeruiesformappingXMLdatatoobjectmodeiandamethodtoestabiishOODBschemaforXMLdata.TheyaisogiveamethodtocreateatemporaryDTDbyextractingstructureinformationfromXMLdoc-umentontheneedofschemabuiiding.Inordertoestabiishefficien
5、taccesspath,theauthorsputforwardastruc-tureindexforXMLdata,andintroduceamethodofimpiementingoperationsbasedonstructureindex.Experi-mentswithreai-iifeXMLdocumentsindicatethatthismethodiseffective.KeywordsXML,datamodei,object-orienteddatabase,schema,structureindex的
6、模式可能非常庞大,文献[7]提出了改进的方法,但1引言也损失了精确性.文献[8]介绍了半结构化数据与XML正在被广泛接受成为Web上表示和交换数OODB集成的方法,所实现的系统Ozone是建立在对据的新的标准.XML允许用户自定义描述内容的标象数据库系统O2之上,其中对半结构化数据的处理识,因而可用于以文本格式保存结构化的数据.如何主要采用LORE系统中的方法.不少研究采用关系数有效地访问大量的XML文档中的数据是近来研究的据库的方法[3,4,9],将XML数据保存在关系数据库一个热点[15][2])采用半结构化的中,利
7、用关系数据库系统的查询机制实现对XML数.一些研究(如LORE模型,通过抽取结构信息来建立半结构化的模式[6],据的查询.由于关系模型不支持复杂类型的属性,因然后实现XML数据的查询.对于有环的情况所建立此采用这种方法处理XML数据存在一定的局限性.原稿收到日期:2001-04-24;修改稿收到日期:2002-04-02本课题得到国家自然科学基金资助(69933010)8l4计算机研究与发展2OO2年一个文档通常被转换为多个表,元素与表之间的关系同,为了便于查询处理应对这两种关系加以区别.为不够直观,查询常常涉及多个表的
8、连接,导致效率降此,我们对ODMG的对象模型进行了扩展,增加两种低.文献[5]讨论了将XML数据映射到关系或对象-特殊的联系,即从属联系和引用联系.次序是一种特关系数据库的优化处理方法,为了避免模式过于庞殊的关系,对于某些应用(如定义规范的文本)对象间大,只将一部分数据转换到数据库中,其余数据仍然的次序是重要的.为了
此文档下载收益归作者所有