Linux字符集

Linux字符集

ID:40749780

大小:407.07 KB

页数:19页

时间:2019-08-07

Linux字符集_第1页
Linux字符集_第2页
Linux字符集_第3页
Linux字符集_第4页
Linux字符集_第5页
资源描述:

《Linux字符集》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、目录基础知识11.概念1查看字符集21.查看环境变量字符集22.在Vim中可以直接查看文件编码3文件的转码4文件名编码转换:4修改字符集的方法51.直接设置变量的方式修改52.修改配置文件6涉及到字符集的一些问题8Apache中的乱码问题10Mysql乱码的问题12php中乱码的问题14基础知识1.概念字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集(Characterset)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、B

2、IG5字符集、GB18030字符集、Unicode字符集等ASCIIASCII(AmericanStandardCodeforInformationInterchange,美国信息互换标准编码)是基于罗马字母表的一套电脑编码系统。主要包含,控制字符:回车键、退格、换行键等。可显示字符:英文大小写字符、阿拉伯数字和西文符号。7位(bit)表示一个字符,共128字符,字符值从0到127,其中32到127是可打印的字符。GB2312GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码字符集·基本集》,由原中国国家标准总局发布,1981

3、年5月1日实施。GB2312是中国国家标准的简体中文字符集。它所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要。在中国大陆和新加坡获广泛使用。BIG5Big5码的产生,是因为当时台湾不同厂商各自推出不同的编码,如倚天码、IBMPS55、王安码等,彼此不能兼容;另一方面,台湾政府当时尚未推出官方的汉字编码,而中国大陆的GB2312编码亦未有收录繁体中文字。GB18030GB18030的全称是GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,是我国政府于2000年3月17日发布的新的汉字编码国家标准,2001

4、年8月31日后在中国市场上发布的软件必须符合本标准。Unicode在计算机科学领域中,Unicode(统一码、万国码、单一码、标准万国码)是业界的一种标准,它可以使电脑得以体现世界上数十种文字的系统。Unicode是基于通用字符集(UniversalCharacterSet)的标准来发展。它是字符集,UTF-32/UTF-16/UTF-8是三种字符编码方案。查看字符集1.查看环境变量字符集字符集在系统中体现形式是一个环境变量,以redhat为例(bshell)其查看当前终端使用字符集的方式可以有以下几种方式。locale命令将有关当前语言环境或全

5、部公共语言环境的信息写到标准输出上。公共语言环境是所有应用程序可以使用的语言环境。语言环境称为"locale".它不仅包括语言和货币单位,而且还包括数字标示格式,日期和时间格式.国际化了的软件含有一个"locale"的"参量",使用该"locale"参量便可以设置某一区域所用的语言环境。locale的命名规则为<语言>_<地区>.<字符集编码>,如zh_CN.UTF-8,zh代表中文,CN代表大陆地区,UTF-8表示字符集。在locale环境中,有一组变量,代表国际化环境中的不同设置。2.在Vim中可以直接查看文件编码Vim中关于字符的几个选项在

6、Vim中,有四个与编码有关的选项,它们是:fileencodings、fileencoding、encoding和termencoding。在实际使用中,任何一个选项出现错误,都会导致出现乱码。因此,每一个Vim用户都应该明确这四个选项的含义。下面,我们详细介绍一下这四个选项的含义和作用。1.encodingencoding是Vim内部使用的字符编码方式。当我们设置了encoding之后,Vim内部所有的buffer、寄存器、脚本中的字符串等,全都使用这个编码。Vim在工作的时候,如果编码方式与它的内部编码不一致,它会先把编码转换成内部编码。如果

7、工作用的编码中含有无法转换为内部编码的字符,在这些字符就会丢失。因此,在选择Vim的内部编码的时候,一定要使用一种表现能力足够强的编码,以免影响正常工作。由于encoding选项涉及到Vim中所有字符的内部表示,因此只能在Vim启动的时候设置一次。在Vim工作过程中修改encoding会造成非常多的问题。如果没有特别的理由,请始终将encoding设置为utf-8。为了避免在非UTF-8的系统如Windows下,菜单和系统提示出现乱码,可同时做这几项设置:setencoding=utf-8(这个是必须的)(下面两个可以为备份的)setlangme

8、nu=zh_CN.UTF-8languagemessagezh_CN.UTF-82. termencodingtermencoding 

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。