xml文档解析技术研究

xml文档解析技术研究

ID:5318267

大小:348.88 KB

页数:6页

时间:2017-12-08

xml文档解析技术研究_第1页
xml文档解析技术研究_第2页
xml文档解析技术研究_第3页
xml文档解析技术研究_第4页
xml文档解析技术研究_第5页
xml文档解析技术研究_第6页
资源描述:

《xml文档解析技术研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第26卷第5期常州工学院学报VO1.26No.52013年l0月JournalofChangzhouInstituteofTechnologyOct.2013XML文档解析技术研究王磊,张红梅,姚保峰,郭有强(1.蚌埠学院计算机科学与技术系,安徽蚌埠233000;2.安徽电子信息职业技术学院软件学院,安徽蚌埠233000)摘要XML具有良好的可扩展性和跨平台性,随着XML的广泛应用,解析技术成为XML应用的关键。通过对四种常用解析策略的分析,明确选择解析技术的原则,并通过实验对比四种解析策略的优劣。关键词XML文档;XML解析;DOM;SAX中图分类号:TP311文献

2、标志码:A文章编号:1671—0436(2013)05—0036—06ResearchontheXMLDocumentParsingTechnologyWANGLei,ZHANGHongmei,YAOBaofeng,GUOYouqiang(1.DepartmentofComputerScienceandTechnology,BengbuCollege,Bengbu233000;2.SoftwareCollege,AnhuiElectronandInformationProfessionalTechnologyCollege,Bengbu233000)AbstractX

3、MLhasgoodscalabilityandcross—platform.WiththeextensiveuseofXML,XMLparsingtechnologyhasbecomeakeyforXMLapplication.Thepaperanalyzesfouranalyticalstrategies,andestabli-shestheprincipleofselectingparsingtechniques,whicharecomparedbyexperimentstoshowtheirrespec—tivemerits.KeywordsXMLdocumen

4、t;XMLparsing;DOM;SAX流。然而,当需要处理以GB为单位的大量XML0前言信息时,流处理和内存缓冲区显得力不从心。研XML逐渐成为互联网数据信息交换的事实究表明可以将XML数据解析出来,提取出有效标准。XML数据有自己独特的组织结构和特性,信息,置入某种人们熟悉的数据库中,以便程序员具有很好的自我描述能力。XML以结构化的方进一步使用熟悉的数据库标准查询语言(SQL)进式描述各种类型的数据,几乎可以描述所有领域行后台的查询处理。XML存储于关系数据表中,的数据。XML用严格的嵌套标记表示数据信息,需提供XML映射层_2;XML存储于面向对象数特别适合在

5、国际互联网的多点数据交换环境下使据库中,它将不再被拆分而是被描述成一个对象用。⋯无论是异构数据库信息的交换还是高效检存人数据库。索网页中的XML数据,都需要将XML数据包含定义1DOM(文档对象模型)。W3C实现的内容解析出来,从而得到有效信息节点。对于了DOM操作的规范化,并为多种语言提供了操较小的XML数据流,可以解析后直接在内存中作DOM的接口,如C,Java,Javascript等。对象模进行处理,然后在缓冲区中接收下一XML数据型的构建是以面向对象的思想为基础,通过对问收稿日期:2013.09.05基金项目:2011年度安徽省自然科学基金项目(1104060

6、6M151);蚌埠学院2013年度自然科学项目(2013ZR06);安徽电子信息职业技术学院2013年度自然科学项目(ADZX1303)作者简介:王磊(1978一),男,硕士,讲师。第5期王磊,张红梅,姚保峰,等:XML文档解析技术研究37题进行抽象,构造出一组相关的模型,从而能够全个元素、属性、文本等都代表着树中的一个节点。面捕捉问题空间的信息。文档对象模型通常是以树起始于文档节点,并由此继续伸出枝条,直到处树的形式对相关文档进行抽象,构建出由节点构于这棵树最低级别的所有文本节点为止。常用节成的文档树模型,从而能方便地对文档进行各种点类型有元素节点(Element)

7、、属性节点(Attfib—操作。ute)、文本节点(Text)、文档类型节点(Docu-定义2节点。XML文档中的所有节点组ment)和注释节点(Comment)。常用节点类型如成了一个文档树(或节点树)。XML文档中的每表1所示。表1常用节点类型定义3映射。由于关系数据是一种结构化层次,具有相同父节点的节点是兄弟节点(sib—的数据,它以扁平的二维关系表存储在关系数据ling);④一个节点的下一个层次的节点集合是节库,而XML数据是半结构化的,所以要实现存点后代(descendant);⑤父节点、祖父节点及所有储,需进行模式映射j,文献[4]提到结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。