javaweb开发中中文乱码问题研究和解决方法

javaweb开发中中文乱码问题研究和解决方法

ID:32628388

大小:57.51 KB

页数:6页

时间:2019-02-13

javaweb开发中中文乱码问题研究和解决方法_第1页
javaweb开发中中文乱码问题研究和解决方法_第2页
javaweb开发中中文乱码问题研究和解决方法_第3页
javaweb开发中中文乱码问题研究和解决方法_第4页
javaweb开发中中文乱码问题研究和解决方法_第5页
资源描述:

《javaweb开发中中文乱码问题研究和解决方法》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、JavaWeb开发中中文乱码问题研究和解决方法摘要:从介绍Java常用字符编码集入手,详细分析了在JavaWeb开发中产生中文乱码的原因,并针对原因提出了可行性解决方法。关键词:JavaWeb开发;中文乱码;字符编码集中图分类号:TP311.101引言Java编程语言具有面向对象、可跨平台运行和分布应用等特点,因此使得Java语言成为主流的网络编程语言。而对于网络程序开发者来说,中文乱码问题是个由来已久和让人头疼的问题。探究其原因,在JavaWeb开发或是Web程序运行过程中,数据通常会通过Web服务器在应用程序和数据库中进行来回传输,而Web服务器,应用程序和数据库

2、中都有可能使用不同的字符编码集,这就导致了中文乱码问题的频繁出现。本文主要介绍JavaWeb应用中常用字符编码集,并分析了中文乱码产生的原因以及针对原因提出可行性的解决办法。2Java常用字符编码集ASCII,全称为:AmericanStandardCodeforInformationInterchange(美国信息互换标准代码),是一种包括数字、字母、通用符号、控制符号在内的字符编码集。ASCII码是一种7位二进制编码,能表示27=128种国际上最通用的西文字符,是目前计算机中,最普遍使用的单字节编码系统。ASCII码包括数字“0”-“9”、26个大、小写英文字母、

3、通用字符和控制符号四类最常用的字符。ASCII码虽是一种7位编码,但它存放时必须占全一个字节,即占用8位,其最高位是0。GB2312:为了适应计算机处理中文信息的需要,国家标准总局制定了"中华人民共和国国家标准信息交换汉字编码”,标准号为“GB2312-1980”。这种编码称为国标码。它适用于汉字处理、汉字通信等系统之间的信息交换。基本集共收入汉字6763个和非汉字图形字符682个。在GB2312中,一个字符通常使用两个字节的数字表示,而对于每个中文字符的每一个字节来说,其最高位使用的是数字1来表示的,这也是GB2312字符编码集与ASCII码的不同之处。GBK:自G

4、B2312标准之后,我国于1993年发布了GB13000标准,并在此基础上生成GBK字符集。它与GB2312完全兼容,收录了20902个简繁体汉字及符号。该标准仍然用两个字节表示一个汉字。IS0-8859-1:全称是IS0/IEC8859,是国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8位字符集的标准,现时定义了15个字符集。它是西方国家所使用的字符编码集,其编码范围是OxOO-OxFF,表示的字符范围很窄,无法表示中文字符。但是由于它是一种单字节的字符集,和计算机最基础的表示单位一致,所以在很多时候,仍然用ISO-8859-1。在此编码集中,收

5、录的字符包括:ASCII收录的字符以及泰语、希腊语、阿拉伯语、西欧语言、希伯来语对应的文字符号。Unicode:EBCDIC(扩展二~十进制交换码)和ASCII码所表示的字符对于使用英语和西欧地区语言的人们来说已经够用,但对于中国等亚洲国家所用的表意文字的表示则远远不够,于是就出现了Unicode码。它是一种通用的字符集,是一种16位的编码,即2个字节,能表示65000个字符或符号。因此Unicode码用于大多数的语言。它与ASCII码完全兼容。UTF-8:全称为:UnicodeTransformationFormat-8bit。是UNICODE的之中变长字符编码又称

6、万国码,由KenThompson于1992年创建。现在已经标准化为RFC3629°UTF-8用1到6个字节编码UNICODE字符。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF-8字符集的浏览器上显示。3中文乱码问题的产生原因在JavaWeb开发中,我们用到的数据通常会通过Web服务器在应用程序和数据库中进行双向的传输,而Web服务器,应用程序和数据库中都有可能使用不同的字符编码

7、集,从而就导致了传输过程中的乱码问题。在JavaWeb开发中,对中文的正确显示产生影响的方面主要有:(1)Web服务器:在JavaWeb开发中目前许多WEB服务器都是采用Tomcat,它是一个开放源代码、运行servlet和JSPWeb应用软件的基于Java的Web应用软件容器,它所默认的字符编码是ISO-8859-1o(1)Web应用程序:在Java语言中,可以依据应用程序中所使用的字符编码标准的不同进行具体的代码设置,它内部默认采用的是Unicode编码。另外在JSP网页中,也同样可以使用代码设置数据编码标准,包括页面脚本和输出到客户端的编码。(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。