欢迎来到天天文库
浏览记录
ID:1070893
大小:168.01 KB
页数:39页
时间:2017-11-07
《用c#编xml的编辑器毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、用C#编XML的编辑器用C#编XML的编辑器第一章Xml简介第一节XML历史:20世纪60年代,IBM创建GML(GeneralizedMarkupLanguage,通用标记语言),后经演变,发展成SGML(StandardGeneralizedMarkupLanguage,标准通用标记语言),成为第一个标准化的信息结构化技术,被用在IBM内部,1986年成为ISO标准。功能强大,但缺点是需要一大堆昂贵的软件来运行,所以在Internet发展的初期,不能成为表示超文本的最佳选择。于是后来HTML对SGML进行了极大的简化,从而成为现在Internet的标准。随着对网络需求进
2、一步增大,人们开始扩充HTML的功能,慢慢发展成现在这么庞大混乱的局面。于是W3C(WorldWideWebConsortium,万维网联盟)组织了一个SGML专家组,主要目标是创建一种新的标记技术,既要具备SGML的核心技术,还要具备HTML的简单性。1998年2月,W3C发布了XML1.0规范,即可扩展的标记语言(eXtensibleMarkupLanguage)是SGML简化的子集,继承了SGML重要的三个特性:可扩展性,结构化,有效性,成为表示结构化信息的一种标准文本格式。 第二节xml语法基础:基本构成单元叫实体(entity),包含解析的或未解析的数据.解析的数
3、据由字符构成,可以看成是标记,由XML处理函数处理,而未解析的字符数据被当成原始文本不被处理,例如Delfan,和就是标记,而Delfan是原始文本。标记用来描述文件的存储结构(实体)和逻辑结构(元素)。XML语法实际描述了用来定义XML文件的结构和布局的构造,也包含了约束关系,而XML需要XML处理函数来处理,所以必须遵守严格的语法。一个简单的例子:<我的电话本><记录><姓名>Delfan姓名><电子邮件>programer@21cn.com
4、电子邮件>记录><记录><姓名>某某姓名>第39页共39页用C#编XML的编辑器<电子邮件>a@b.c电子邮件>记录>我的电话本>一个XML文件只能有一个根,而且,XML是基于UNCODE编码的,标记都可以是汉字.还有,IE本身就是个XML的解析器,虽然不很完善。可以将以上代码写到一个文本文件中,例如文件名为test.xml,双击,IE就可以把这个XML文档解析成一棵树并按层次显示出来:第三节XML的术语XML文档:XML标识语言写成的XML原代码文件,实际上是ASCII的纯文本文件,可以用Notepad创建和修改。XML文档的后缀名为.XML,用I
5、E5.0以上浏览器可以直接打开并显示成树状结构,看到的就是XML文档.一般来说,XML文档包含三个部分:1.一个XML文档声明:2.一个关于文档类型的定义:如不需要可以省略3.用XML标识创建的内容.举例:<清单><入库><纸张规格="A4"单位="本">1000纸张><经手人>张三经手人>入库><出库><纸张规格="B5"单位="本">200纸张><经手人>张三经手人>出库><
6、/清单>其中第一行就是一个XML文档的声明,并指出使用GB2312,以下就是内容主体部分。::XML文档中有关的术语:1.Element(元素)元素是组成XML文档的最小单位,由标识来定义,包括其中的内容,如<经手人>张三经手人>,而且要由自己创建第39页共39页用C#编XML的编辑器2.Tag(标识)标识是用来定义元素的。在XML中,标识必须成对出现,将数据包围在中间。标识的名称和元素的名称是一样的。例如:<经手人>张三经手人>,其中<经手人>就是标识。3.Attribute(属性)例如<纸
7、张规格="B5"单位="本">中"规格"和"单位"就是属性,属性是对标识进一步的描述和说明,一个标识可以有多个属性,每个属性都有它自己的名字和数值,是标识的一部分,也是自己定义的,但尽量不要用属性,而是使用子元素,例如上面元素可以改成<纸张><规格>B5规格><单位>本单位>200纸张>,这么做的原因是属性不易扩充。4.Declaration(声明)所有XML文档的第一行都有一个L声明表示是一个XML文档,并指出遵循哪个版本的规范:说明是1.0版本的XML文档5.
此文档下载收益归作者所有