欢迎来到天天文库
浏览记录
ID:9007273
大小:39.50 KB
页数:4页
时间:2018-04-14
《在xhtml和html中使用语言信息》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、当我开始XHTML1.1的时候,我一直不知道应该在xml:lang上写什么好,我想使用中文,它的值是zh、zh-cn/zh-CN还是gb2312/gbk/gb18030或者utf8?通常遇到问题我都优先Google中文,无奈也是找不到答案。看到一些权威的网站上使用gb2312,我还差点相信了,但根据我使用Linux中设置语言的经验,我直觉告诉我这是错误的。于是开始了把范围缩小到W3C中去Google,找到了Tutorial:UsinglanguageinformationinXHTML,HTMLandCSS(DRAFT),细阅,终于走出误区,愿将经验与大家分享。依旧是翻译,但这篇文章太长了,
2、而且还有许多我们用不着的信息,这次我只选择了部分,希望能把问题说清楚就好。声明文档与文本语言为什么要声明语言关于文档语言的信息对于屏幕阅读器和易用性都极为重要,从一开始就有利。这些程序需要了解它们是否能从文本中生成输出,或者是否需要转到不同的语言模式。标记语言信息也对应用恰当的样式变更有好处。比如,需要改变字体来调节不同字符,依据语言来生成不用的引号等等。有的浏览器使用语言信息为中文简体,中文繁体,日文和韩文来侦测适合的字体。但是,在一个使用Unicode编码的页面中,这些语言可能共享相同的表意字符内码。操这些语言的人可能在使用这些字符上的一些小细节上有所不同。下面的插图演示了仅仅改变语言标
3、签,在Mozilla上的文本的效果:同一表一字符在不同语言中的形状标记语言信息也允许你使用脚本提取指定语言的元素。举个例子,使用XSLTlang()函数可以从一个文件中提取指定语言的文本,或者在XSL-FO转换的时候应用语言指定样式。在许多的案例中,第一次开发内容时,你可能不会意识到这些应用的重要性,虽然它们在创建的时候一般非常容易添加,这就会在需要样式翻新时遇上麻烦。另外,一些为语言标签标记的程序还在早期开发或者缺乏中,但是,从现在起你就应该为你的内容增加语言信息,以便在技术成熟的时候收获未来的好处。总体上始终为文档在标签中声明语言HTML文档总体上应该声明文档的语言,可以通过在html标
4、签中增加lang属性来实现。比如,下面声明了一个使用加拿大法语(CanadianFrench)的文档:稍后我们会更具体地讲述如何为语言属性指定值。当把XHTML伺服为text/html,你应该在html元素中都使用lang属性和xml:lang属性。xml:lang属性是在XML中确定语言信息的标准用法。以下演示你应该如何标记先前以text/html伺服的XHTML1.0的例子:xml:lang属性在处理HTML文件时并没有实际用处,但从lang属性继承过来意味着你要使脚本或校验器把该文档当作XML。如果你以XML(比如,使用像applications/xhtml+xml的MIME类型)或者
5、XHTML1.1来伺服XHTML的话,你不再需要lang属性,因为它已经跟HTML语言分离了。单独的xml:lang属性就已足够。始终声明文本的语言变更在与内容主要语言不同的文本中,应该指出该文本的语言。方法跟与总体上始终为文档在标签中声明语言这一节相同——使用lang或者xml:lang属性。例如,在HTML中你可以写作:TheFrenchforCatischat.lang属性可以用在除applet、base、basefont、br、frame、frameset、iframe、param和script之外的任何HTML元素上。又,以text/html伺服的XHTML1.0,可以一起使用两个
6、属性,比如:ThetitleinChineseisxml:lang="zh-CN">中国科学院文献情报中心.注意了,在最后一个例子中,在中文文本的周围没有让我们可以附加语言信息的标记,为达到目的所以引入了span元素。(请查看该段的源代码——译者注)如果以XML伺服XHTML,像上节所描述的那样,你应该只使用xml:lang属性。指定语言属性的值使用RFC3066规则RFC3066是定义如何使用语言标签来识别语言的标准。语言标签由一个主要的subtag,尾随零个或更多附属的subtag,由连字符分开。主subtag代表一种语言(有两种例外,i-和x-,在下面会讨论),任意尾随的subtag服
7、务于修饰该语言的方言或用法。后面的subtag一般代表国家,方言或文字体系。下面的例子表明了该文档不仅使用英语而且还是英式英语,就是说,跟美式英语相对的英语写成的。subtag对大小写是敏感的,包括从A到Z,a到z,0到9的字母和数字,而且不能多于8个字符。需要注意的是HTML规范仍然推荐使用RFC1766来确定语言。RFC3066是RFC1766的升级并且大大超越,而在HTML规范中有一个计划勘错表,因此你
此文档下载收益归作者所有