Web开发中乱码问题的研究与解决.pdf

Web开发中乱码问题的研究与解决.pdf

ID:52341257

大小:264.89 KB

页数:3页

时间:2020-03-26

Web开发中乱码问题的研究与解决.pdf_第1页
Web开发中乱码问题的研究与解决.pdf_第2页
Web开发中乱码问题的研究与解决.pdf_第3页
资源描述:

《Web开发中乱码问题的研究与解决.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2010年第8期科技管理研究ScienceandTechnologyManagementReseare,h2010No.8文章编号:1000—7695(2010)08—0124—03Web开发中乱码问题的研究与解决高菲(临沂师范学院美术学院,山东临沂276000)摘要:从计算机存储及传输字符的编码标准入手,介绍各种不同的字符编码标准,然后对开发过程中乱码产生的根本原因进行分析,并针对开发过程中的主要环节,提出解决乱码问题的可行方案。关键词;Web应用开发;中文乱码;字符编码;中图分类号:TP31I.52文献标识

2、码:A1引言2.2ANSI编码(双字节)(DBCS}double:by}ep}}晏弭(:ter程序员尤其是网络程序开发者不可避免地会和各类字符set)编码打交道,“字符与编码”也是一个被经常讨论的话题,随着计算机技术的发展,需要其能支持更多的语言,而但还是有很多程序员在遇到乱码问题时感到无从下手或对一用一个字节来表示字符显然不能满足像中文、韩文和日文这些字符编码感到迷惑不解。虽然有很多具体的方法可以用来样字符数量巨大I的谔肓需要,为此人们扩展使用二个字节消除乱码,但我们并不一定理解这些方法的原理,而有的乱来表示

3、一个字符。同时为了保持与码的兼容,约定第码产生的原因,实际上是由于底层代码本身有问题所导致的。一个字节的最高位为0时(≤l),某编表示与ASCII码因此,不仅初学者对字符编码感到模糊,有的底层开发人员相同,而最高位为1时(>l28),其与后雨的·个宰节柒同同样对字符编码缺乏准确的理解。本文主要针对Web应用开表示一个扩展语言字符。即第一个字节为l28—55时表示一发中常用的的字符编码进行介绍,并对JavaWeb应用开发中个扩展语言字符,其表示的字符个数为128十l28i常见的中文乱码问题进行分析并提出解决方案。

4、32896个,按照这种定义方式,不同的国家和地区制定了不同的标准,由此产生了简体中文GB2312、GBK、繁体中文2字符编码标准BIG5、日文sJIs等字符集。如字符串“北京2008”在计算机计算机存放字符串时,不是存储字符本身,而是存储字中GB2312编码的表示为:符相对应的二进制表示,即每个字符在字符编码集中的编号。从字符编码的发展历程分析,大致可以分为3个阶段:2.1ASCII编码(单字节)(SBCS:Single—bytecharacterset)计算机最初只支持英文,其它语言不能在计算机中存储这些从A

5、SCII扩展的编码方式,蕊享部分郝幕幕容的,和显示。而英文字符最常用的编码方式就是ASCII码(Amer-但扩展部分的编码由于采用不同的方式制定它们是不兼容icanStandardCodeforInformationInterchange,美国信息交换标的,虽然很多字在3种体系中写法一致(例如“中文”这两准代码)。它是基于罗马字母表的一套编码系统,其采用一个字),但在相应字符集中的坐标不一致,所以GB2312编码个字节的数字来代表一个字符在计算机中的表示,其能够表的字符用BIG5看就全是乱了。另外在浏览其他非英

6、语国达的字符数为28=256个,而所有的英文字符(大小写不家的页面时(比如包含有德语的人名肘)经常出现奇怪的汉同)、数字及一些常用控制符等只使用了其中一部分,即字字,就是由扩展位的编码冲突造成的。节最高位为0的128个字符编码,所以ASCII码实际上所表对于中文编码来说,GB231~字符集巾包括辱千多食常用达的字符数只有128个。如英文字符串“China2008”在内存汉字,但还是达不到包括全部汉字的要求因拙盾老取制寤中的存储方式为:了GBK以及GB18030标准,GBK字符集是G3l2的扩展,GBl(里大约有

7、2万9千多个字符,除了保持和GB2312兼容字符china2008外,繁体中文字,甚至连日文的假名字符也能显示。而编码4368696E6132303038GB18030则是一个更复杂的字符集,采用变长字节的编码方式,能够支持更多的字符iG辱l(及,GB18030标准向下与GB2312编码兼容,向上支持ISO10646国际标准。此外,利用大于128部分的空间的不同定义规则,就形2.3Unicode编码(双字节)成了对其它欧洲语言的扩展字符集ISO一8859系列,包括ISO为了使国际问信息交流更加方便,有必要制定一

8、种全球一8859—1(西欧字符)、ISO一8859—2(中欧和东欧字统一的字符编码,为此,国际组织制定了Unicode字符集,符)、ISO一8859—7(希腊字符)等。它们8位编码的最高为各种语言中的每一个字符设定了统一并且唯一的数字编位为1,又分别扩展出了128个各自的字符。号,以满足跨语言、跨平台进行文本转换处理的要求。目前一般采用2个字节来存放一个unieode字符,因此,这种方

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。