欢迎来到天天文库
浏览记录
ID:31959717
大小:1.94 MB
页数:62页
时间:2019-01-29
《并行xml数据库查询处理算法的设计、实现与性能评价》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、东北大学硕士学位论文第一章前言随着Intemet向着社会各个角落的发展,人类已经进入了一个真正的“信息爆炸”时代。网络上纷繁复杂的信息既给人们带来了丰富的内容,同时也让人们感到了“乱花渐欲迷人眼”的困惑。也许太多的选择就是无从选择,太多的答案就是没有答案。如何利用这些大量存在的信息,在Intemet上快速找到自己需要的东西,这是摆在我们面前的一个问题。无疑,XML语言的提出是解决这个问题的一个亮点。但是作为一个新生的事务,XML还有很长的路要走。1.1XML发展和现状1.1.1XML起源和概况早在20世纪6
2、0年代,人们就想要将文件结构化成标准的格式,以促进数据的交换和操作。mM创建了GML(GeneralizedMarkupLanguage,通用标记语言)并已经在其出版系统内部实现这一需求。后来演化成为SGML(StandardGeneralizedMarkupLanguage,通用标记语言),它是第一个标准化的信息结构化技术。1986年,SGML成为ISO标准。尽管SGML功能极其强大,然而它非常复杂而且需要大量昂贵的软件来配合运行,这一定程度上影响了SGML的推广和应用。1989年,CERN(Partic
3、lePhysics欧洲实验室)的研究员创建了一种简化了的SGML应用,这就是HTML,现在已经成为了INTERNET上的信息标准格式。事实证明了HTML取得了巨大的成功,但HTML本身只是作为一种表示静态信息的方法而被设计的,所以它不像SGML那样具有可扩展型,结构化和有效性。1996年开始,W3C(WorldWideWebConsortium,万维网联盟)开始寻找一种在Web中使用SGML灵活性和强大功能的方法。1998年2月,W3C发布了XMLl.0规范,即可扩展标记语言(eXtertsibleMark
4、upLanguage)。XML是SGML的简化子集。它的伟大之处并不在于你能够通过它来创建标记语言,而在于你能够通过它来创建高度结构化的标记语言。XML实际上仅仅是一种标准化的,可以在Web上表示结构化信息的文本格式。当你为Web这样巨大的信息仓库提供结构的时候,就可以将结构化的数据在应用程序之间自动传递。搜索引擎变得聪明起来而且可以进行基于上下文而不是正文的搜索。Web东北大学硕士学位论文第一章前言上的数据变成了自我描述,这可以使程序更加充分的利用它们。基于XML在Intemet上的强大的功能和广泛的发展
5、前途,对XML的研究也在蓬勃地发展之中。W3C随后又提出了一系列关于XML的标准、草案等等。而各个主要的软件企业如Microsoft,IBM,Oracle等也都纷纷表示支持XML并推出了一系列的产品。目前,已经出现了许多与XML相关的技术。包括样式表(CSSCascadestylesheet),名字空间(NameSpaces),文档对象模型(DOM。DocumentObjectModel)它可以使程序访问XML文件的内部结构,DTD(DocumentTypeDefine,文档类型定义)和Schema技术用来
6、描述XML文件结构,XliIll【和Xpoint技术提供了一种在)m几资源之间建立高级连接的方法。1.1.2DTD简介DTD是W3C推荐的针对HTML和XML文档的类型定义标准。DTD可以抽象出一个XML文档的层次结构和内容。也可以在XML解析器中来验证XML文档的正确性。DTD用一种抽象机制来描述和定义XML文档的模式信息,它可以根据XML数据本身构造,也可以是事先定义某些符合同样结构特点的XML文档的DTD,然后根据DTD来生成符合这种模式的XML文档。同时DTD本身也可以动态改变,很方便对XML进行扩
7、展。XML作为一种自描述的半结构化文档,不仅仅提供了信息的内容,还加入了描述信息语义结构的,表示数据之间关系的自定义标记。确保文档具有较强的易读性、清晰的语义和易检索性。因此,一个完全意义上的XML文档不仅仅是“格式良好的”,而且还应该是使用了一些自定义标记的“有效的”XML文档,一个XML文档必须遵守文档类型定义DTD中已声明的种种规定。DTD描述了标识语言的语法和词汇表,也就是定义了文档的整体结构以及文档的语法,通过XML文档抽象出来的DTD信息,可以构造出一个解释该XML文档的语法分析器。一个DTD可
8、以定义在所描述的XML文档内部,作为XML文档头信息的一部分出现。也可以是外部的,单独定义成为一个文档,然后在符合该DTD的XML文档中标记对它的引用就可以了。单独定义的DTD文档可以很方便的被所有符合该DTD的)m也文档所引用。DTD中使用ETD(ElementTypeDeclaration,元素类型声明)来声明所有有效的文档元素。ETD应该采用如下的结构:。XML的标准将
此文档下载收益归作者所有