欢迎来到天天文库
浏览记录
ID:6037925
大小:60.00 KB
页数:9页
时间:2017-12-31
《关于处理java web中中文乱码的问题》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、河北师范大学附属民族学院学生毕业论文(设计)题目关于JavaWeb技术开发中中文乱码问题的深入讨论作者姓名张天龙系别数信系专业计算机应用技术班级08专1班指导教师段继光完成日期2011年5月30日河北师范大学附属民族学院教务处编制关于JavaWeb技术开发中中文乱码问题的深入探讨数信系08专1班张天龙08221035指导老师:段继光摘要:在利用Servalete/Jsp技术开发Web应用程序的时候,不可避免的会遇到中文乱码问题。如:页面编码不一致;表单get提交时产生乱码问题;表单使用post方式时产生的乱码问题等。本文首先详细分析这
2、些中文乱码问题产生的原因,并以图例清晰具体的展现出来,最后在此基础上提出详细合理的解决方案。关键字:JavaWeb技术开发中文乱码字符集1.引言为了能在计算机中表示不同语言中字符,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的ASCII,中国GB2312和GBK,日本的JIS等。Java语言内部用Unicode来表示字符,Unicode被称为统一的字符编码标准集,它为几乎每种语言中的字符设定了唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。这也使得Java具有良好的可移植性,符合其国际化的思想。然而在
3、实际应用中,由于应用程序的运行环境不同,和各个本地字符集的补充、完善,以及系统或应用程序实现的不规范,转码时出现的中文乱码问题时时困扰着程序员和用户。2.中文乱码产生的原因Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性,进行字节码转换。还有一种方式是对J2EE容器进行编码设置,如果J2EE应用系统脱离该容器,则会发生乱码,而且指定容器配置不符合J2EE应用和容器分离的原则
4、。在Java内部运算中,涉及到的所有字符串都会被转化为UTF-8编码来进行运算。那么,在被Java转化之前,字符串是什么样的字符集?Java总是根据操作系统的默认编码字符集来决定字符串的初始编码,而且Java系统的输入和输出的都是采取操作系统的默认编码。因此,如果能统一Java系统的输入、输出和操作系统3者的编码字符集合,将能够使Java系统正确处理和显示汉字。这是处理Java系统汉字的一个原则,但是在实际项目中,能够正确抓住和控制住Java系统的输入和输出部分是比较难的。J2EE中,由于涉及到外部浏览器和数据库等,所以中文问题乱码显
5、得非常突出。J2EE应用程序是运行在J2EE容器中。在这个系统中,输入途径有很多种:一种是通过页面表单打包成请求(request)发往服务器的;第二种是通过数据库读入;还有第3种输入比较复杂,JSP在第一次运行时总是被编译成Servlet,JSP中常常包含中文字符,那么编译使用javac时,Java将根据默认的操作系统编码作为初始编码。除非特别指定,如在Jbuilder/eclipse中可以指定默认的字符集。输出途径也有几种:第一种是JSP页面的输出。由于JSP页面已经被编译成Servlet,那么在输出时,也将根据操作系统的默认编码来
6、选择输出编码,除非指定输出编码方式;还有输出途径是数据库,将字符串输出到数据库。由此看来,一个J2EE系统的输入输出是非常复杂,而且是动态变化的,而Java是跨平台运行的,在实际编译和运行中,都可能涉及到不同的操作系统,如果任由Java自由根据操作系统来决定输入输出的编码字符集,这将不可控制地出现乱码。正是由于Java的跨平台特性,使得字符集问题必须由具体系统来统一解决,所以在一个Java应用系统中,解决中文乱码的根本办法是明确指定整个应用系统统一字符集。指定统一字符集时,到底是指定ISO8859_1、GBK还是UTF-8呢?(1)如
7、统一指定为ISO8859_1,因为目前大多数软件都是西方人编制的,他们默认的字符集就是ISO8859_1,包括操作系统Linux和数据库MySQL等。这样,如果指定Jive统一编码为ISO8859_1,那么就有下面3个环节必须把握:A开发和编译代码时指定字符集为ISO8859_1。B运行操作系统的默认编码必须是ISO8859_1,如Linux。C在JSP头部声明:。(2)如果统一指定为GBK中文字符集,上述3个环节同样需要做到,不同的是只能运行在默认编码为GBK的操作系统,如中文Windows。统一编码为ISO8859_1和GBK虽然
8、带来编制代码的方便,但是各自只能在相应的操作系统上运行。但是也破坏了Java跨平台运行的优越性,只在一定范围内行得通。例如,为了使得GBK编码在linux上运行,设置Linux编码为GBK。那么有没有一种除了应用系统以外
此文档下载收益归作者所有