欢迎来到天天文库
浏览记录
ID:40584472
大小:36.94 KB
页数:10页
时间:2019-08-04
《xml考试复习资料整理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Chapter1XML概述HTML源于标准通用标记语言(StandardGeneralizedMarkupLanguage,SGML)。SGML是一种元语言,即描述标记语言的语言。HTML是SGML的一种应用。XML也由SGML衍生出来。XML的基本语法和HTML很相似,只不过HTML使用固定标签集,而XML创建新标签,基本示例如下。可以看到XML与HTML的结构基本相同,均分为元素、属性、值。每个XML文档都有一个且只能有一个根元素,而其他元素则都要包含在这个根元素中。只有注释和处理指令可以不包含在根元素中。元素是XML中用于识别和描述数据的基本单元。它们是XML
2、文档的编译块,和HTML,XML使用标签来表示元素。XML元素由三个部分组成:起始标签①、内容②、结束标签③属性是依附于元素存在的。元素可以具有属性,元素的每个属性由一个名称-值对组成,写在元素的开始标签中。属性值用单引号或者双引号括起来。预定义实体引用:字符字符实体&&‘'>><<“"Chapter2XML数据底层结构-DTDDTD的结构一般由元素类型声明、属性表声明、实体声明、记号(notation)声明构成。一个典型的文档类型定义文件会把将来所创建的XML文档的元素结构、属性类型、实体引用等预先进行定义。(1)EMPTY
3、类型EMPTY用于定义空元素,该元素只可能有属性而不会有字符数据或子元素。形如或者。(2)ANY类型这表明该元素可以包含DTD中定义的其他任何元素或已经编译的字符数据(#PCDATA)。(3)#PCDATA关键字#PCDATA说明元素包含字符数据。可以包含除标记外的一切字符,包括数字、字母和符号等。被定义包含PCDATA的元素不能包含任何其他子元素。(4)子元素类型·当一个元素只包含子元素,而没有字符数据时,则称此元素类型具有元素型内容(elementcontent)。在该类型的元素声明时,通过内容模型来指定在其内
4、容上的约束。·内容模型是决定元素类型和子元素出现顺序的一种简单语法。·子元素内容模型可以有两种可能的结构:序列和选择①序列。上述对employee元素的声明,其所有子元素必须出现且仅出现一次,而且要依次出现,这种结果称为序列。②选择。元素的选择可以进行如下的声明:
5、subelem2
6、subelem3)>(5)混合类型如果某个元素既包含子元素又包含已编译的字符数据,则该元素具有混合内容。如下所示。混合类型的文档声明语法:
7、subelem1
8、subelem2)*>·属性用于将名称-值对
9、与元素进行关联。与元素类似,在XML文档中使用的属性必须在DTD中声明。属性声明的语法:·默认声明可以有四种默认设置,#REQUIRED,#IMPLIED,#FIXED+默认值,只有默认值。Ø#REQUIRED说明必须为元素提供该属性。Ø#IMPLIED说明必须该元素可以包含该属性,也可以不包含该属性。Ø#FIXED+默认值说明一个固定的属性默认值,文档的编写者不能修改该属性的值。Ø只有默认值与FIXED+默认值一样,如果元素不包含该属性,XML处理器将以声明的默认值向应用程序报告该属性。不同的是,这种声明方式属性的值
10、是可以改变的。属性类型:在属性表声明时,总共有10中属性类型可以选择,分别是:CDATA、Enumerated、ID、IDREFS、ENTITY、ENTITIES、NMTOKEN、NMTOKENS、NOTATION。ØCDATA最常用的属性类型,表明属性值为字符数据,与元素内容声明中#PCDATA相同。如果属性值中要出现特殊的字符,如‘<’,‘&’,‘”’等,用预定义的实体引用,或用字符引用。ØEnumerated在声明属性时,可以限制属性的取值只能从一个列表中选择,这类属性属于枚举类型。注意,枚举类型的声明没有使用关键字Enumerated,此处为了说明而已。枚举
11、型属性声明如下:
12、female)#REQUIRED>ØID、IDREF、IDREFSID类型的属性值唯一标识XML文档中的一个元素。IDREF类型的属性值参照相应的ID类型的属性值。如果一个属性需要引用文档中多个ID类型的属性值,则可以将其声明为IDREFS类型。ØNMTOKEN、NMTOKENSNMTOKEN类型的属性的值必须为一个有效的XML名称,属性值不能含有空格字符(NMTOKEN是CDATA类型的一个子集)。NMTOKENS是NMTOKEN的复数形式,该类型的属性值可以包含若干个有效的XML名称,每个名称之
此文档下载收益归作者所有