基于xml的半结构化数据存储技术研究

基于xml的半结构化数据存储技术研究

ID:32966165

大小:487.95 KB

页数:59页

时间:2019-02-18

基于xml的半结构化数据存储技术研究_第1页
基于xml的半结构化数据存储技术研究_第2页
基于xml的半结构化数据存储技术研究_第3页
基于xml的半结构化数据存储技术研究_第4页
基于xml的半结构化数据存储技术研究_第5页
资源描述:

《基于xml的半结构化数据存储技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP311密级:公开UDC:单位代码:10424学位论文基于XML的半结构化数据存储技术研究王燕丽申请学位级别:硕士学位专业名称:计算机应用技术指导教师姓名:孙忠林职称:教授山东科技大学二零零八年五月论文题目:基于XML的半结构化数据存储技术研究作者姓名:王燕丽入学时间:2005年9月专业名称:计算机应用技术研究方向:网络工程与管理信息系统指导教师:孙忠林职称:教授论文提交日期:2008年5月论文答辩日期:2008年6月授予学位日期:RESEARCHOFSEMI-STRUCTUREDDATASTORAGETECHNOLOGYON

2、XMLADissertationsubmittedinfulfillmentoftherequirementsofthedegreeofMASTEROFPHILOSOPHYfromShandongUniversityofScienceandTechnologybyWangYanliSupervisor:ProfessorSunZhonglinCollegeofInformationScience&EngineeringMay2008声明本人呈交给山东科技大学的这篇硕士学位论文,除了所列参考文献和世所公认的文献外,全部是本人在导师指导下的

3、研究成果。该论文资料尚没有呈交于其它任何学术机关作鉴定。硕士生签名:日期:AFFIRMATIONIdeclarethatthisdissertation,submittedinfulfillmentoftherequirementsfortheawardofMasterofPhilosophyinShandongUniversityofScienceandTechnology,iswhollymyownworkunlessreferencedofacknowledge.Thedocumenthasnotbeensubmittedforq

4、ualificationatanyotheracademicinstitute.Signature:Date:山东科技大学硕士学位论文摘要摘要互联网的迅速发展,使得网上数据不断激增。这些数据缺乏统一的、固定的模式,而且往往是不规则、经常变化的。因此,半结构化数据模型应运而生,它是介于完全结构化数据和无结构化数据之间的一种数据类型。要想对这种半结构化数据进行有效的管理是十分困难的。如何对半结构化数据进行有效的管理成为研究的热点。XML技术的出现,推动了半结构化数据的发展。XML数据是一种自描述的半结构化数据,利用XML文档来管理半结构化数

5、据是一种有效的途径。由于关系数据库在各方面都相对成熟和稳定,因而采用关系数据库对XML数据进行存储和操作,将半结构化转化为结构化的数据,具有重大的理论意义和实用价值。论文的研究从分析半结构化数据和XML相关技术出发,旨在设计一种实现半结构化数据到XML数据的映射算法和一种半结构化数据的存储结构实现XML数据到关系数据库的映射。论文深入探讨了半结构化数据的定义及特点,分析半结构化数据的模式描述形式以及半结构化数据的模式抽取技术,详细介绍了XML和数据库的转换技术。目前最具有代表性的半结构化数据的模式描述形式是OEM模型,它是一种带有嵌套和

6、标记的自描述性有向图。论文采用邻接表表示法实现图的存储,并给出各对象相应的存储结构定义。通过对OEM模型图的遍历,把OEM模型所对应的图结构,转换为相应的XML文档,生成XML数据,实现半结构化数据向XML文档的映射。基于有向图的深度优先遍历思想,给出一个转换算法实现了XML数据的生成。转换得到的XML数据是一种无模式的数据文档,而且XML文档中不存在属性的成分,只有元素成分的存在。基于所生成的XML文档,通过分析XML文档和数据库技术的相互映射方法,采用一种基于前缀编码的模型映射方法,实现XML数据和数据库的映射。论文最后给出了一个简

7、单的半结构化电子病历数据,实现了半结构化数据向关系数据库的映射转换,并给出了几个典型的XML查询实例。真正的通过XML技术和现有关系数据库技术相联系,实现“以关系数据库为存储手段,以XML技术为交换载体”的数据管理模式。山东科技大学硕士学位论文摘要关键字:OEM模型图;XML技术;关系数据库;映射;半结构化数据山东科技大学硕士学位论文摘要AbstractWiththerapiddevelopmentofInternet,thedataonthenetisincreasingcontinuously.Thesedatalacksuniti

8、veandfixedmodel.Moreover,thesedataisalwaysirregularandmutativefrequently.So,themodelofsemi-structuredda

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。