欢迎来到天天文库
浏览记录
ID:32535411
大小:72.80 KB
页数:8页
时间:2019-02-11
《linux中文乱码问题》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、1、linuxssh连接乱码问题原文件内容为:LANG="zh_CN.UTF-8"SUPPORTED="zh_CN.UTF-8:zh_CN:zh:en_US.UTF-8:en_US:en"SYSFONT="latarcyrheb-sun16"有的系统只有:LANG="zh_CN.UTF-8"更改为:LANG="zh_CN.UTF-8"LANG="zh_CN.GB18030"LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"SUPPORTED="zh_CN.UTF-8:zh_CN:zh:en_US.UTF-8:en_US:en"SYSFONT="latarc
2、yrheb-sun16"Linux中文乱码问题最近,公司在XP系统于LINUX之间传数据时出现了中文乱码问题!首先,解释一下字符集:汉字编码:*GB2312字集是简体字集,全称为GB2312(80)字集,共包括国标简体汉字6763个。*BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个。*GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号,共包括21003个字符。*GB18030是国家制定的一个强制性大字集标准,全称为GB18030-2000,它的推出使汉字集有了一个“大一统”的标准。ASCII:AmericanStandardCodeforInformationInter
3、change,美国信息交换标准码。目前计算机中用得最广泛的字符集及其编码,由美国国家标准局(ANSI)制定。它已被国际标准化组织(ISO)定为国际标准,称为ISO646标准。ASCII字符集由控制字符和图形字符组成。在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1。偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。UTF:Unicode的实
4、现方式不同于编码方式。一个字符的Unicode编码是确定的,但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式(UnicodeTranslationFormat,简称为UTF)。*UTF-8:8bit变长编码,对于大多数常用字符集(ASCII中0~127字符)它只使用单字节,而对其它常用字符(特别是朝鲜和汉语会意文字),它使用3字节。*UTF-16:16bit编码,是变长码,大致相当于20位编码,值在0到0x10FFFF之间,基本上就是unicode编码的实现,与CPU字序
5、有关。注意:ASCIIchar(2);UTF-8宽字符wchar4倍。兼容性最好的编码就是UTF-8!毕竟GBK/GB2312是国内的标准,当我们大量使用国外的开源软件时,UTF-8才是编码界最通用的语言。在Linux中通过locale来设置程序运行的不同语言环境,locale由ANSIC提供支持。locale的命名规则为<语言>_<地区>.<字符集编码>,如zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。在locale环境中,有一组变量,代表国际化环境中的不同设置:1. LC_COLLATE定义该环境的排序和比较规则2. LC_CTYPE用于字符分类和
6、字符串处理,控制所有字符的处理方式,包括字符编码,字符是单字节还是多字节,如何打印等。是最重要的一个环境变量。3. LC_MONETARY货币格式4. LC_NUMERIC非货币的数字显示格式5. LC_TIME时间和日期格式6. LC_MESSAGES提示信息的语言。另外还有一个LANGUAGE参数,它与LC_MESSAGES相似,但如果该参数一旦设置,则LC_MESSAGES参数就会失效。LANGUAGE参数可同时设置多种语言信息,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。7. LANGLC_*的默认值,是最低级别的设置
7、,如果LC_*没有设置,则使用该值。类似于LC_ALL。8. LC_ALL它是一个宏,如果该值设置了,则该值会覆盖所有LC_*的设置值。注意,LANG的值不受该宏影响。一个例子:设置前,使用默认locale:[root@db-wanggaofei~]#localeLANG="POSIX"LC_CTYPE="POSIX"LC_NUMERIC="POSIX"LC_TIME="POSIX"LC_COLLATE=
此文档下载收益归作者所有