oracle数据库常见字符集问题解析

oracle数据库常见字符集问题解析

ID:32535721

大小:563.80 KB

页数:17页

时间:2019-02-11

oracle数据库常见字符集问题解析_第1页
oracle数据库常见字符集问题解析_第2页
oracle数据库常见字符集问题解析_第3页
oracle数据库常见字符集问题解析_第4页
oracle数据库常见字符集问题解析_第5页
资源描述:

《oracle数据库常见字符集问题解析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、Oracle数据库常见字符集问题解析Author:ZengYungangDOCUMENTNUMBER:NGNMSPRODUCT:RELEASE:ConfidentialLevel:NetmanGroupDate:2005-8-23DISTRIBUTETO:QA&PTREVISIONHISTORYDateVersion#AuthorRevisionDescription2005-08-230.9ZengYungangDraftOracle数据库常见字符集问题解析1常用字符集合介绍41.1字符集ASCII介绍41.2字符集ISO8859介绍41.3字符集GB2312介绍41.4字符集

2、UTF8介绍52Oracle数据库中数据库字符集的选择62.1Oracle数据库字符集选用原则62.1.1测试结论:62.1.2测试方法概述:72.2数据库服务器字符集为ASCII的测试说明72.2.1客户端字符集为ASCII的情况82.2.2客户端字符集为ISO8859的情况92.2.3客户端字符集为GB2312的情况92.2.4客户端字符集为UTF8的情况102.3数据库服务器字符集为ISO8859的测试说明112.3.1客户端字符集为ASCII的情况112.3.2客户端字符集为ISO8859的情况112.3.3客户端字符集为GB2312的情况122.3.4客户端字符集为UT

3、F8的情况122.4数据库服务器字符集为GB2312的测试说明132.4.1客户端字符集为ASCII的情况132.4.2客户端字符集为ISO8859的情况132.4.3客户端字符集为GB2312的情况142.4.4客户端字符集为UTF8的情况142.5数据库服务器字符集为UTF8的测试说明152.5.1客户端字符集为ASCII的情况152.5.2客户端字符集为ISO8859的情况152.5.3客户端字符集为GB2312的情况162.5.4客户端字符集为UTF8的情况162.6GB2312,UTF8和UTF16存储性能对比173Java编程中字符集的选择17Oracle数据库乱码,

4、Java乱码是每个开发者经常碰到的问题,如何解决,如果避免乱码问题是每个开发者需要解决的问题。同时,随着Netman国际化的发展,其需要存储越来越多的国际字符,如何让我们Netman支持这一点?以下通过一些测试案例,来说明乱码的产生的原因,解决方法,以及我们Netman系统字符集的设置原则!1常用字符集合介绍我们知道,电子计算机最初是用来进行科学计算的(所以叫做“计算机”),但随着技术的发展,还需要计算机进行其它方面的应用处理。这就要求计算机不仅能处理数值,还能处理诸如文字、特殊符号等其它信息,而计算机本身能直接处理的只有数值信息,所以就要求对这些文字、符号信息进行数值编码!字符

5、集的实质就是对一组特定的符号,分别赋予不同的数值编码,以便于计算机的处理。最初的字符集是我们都非常熟悉的ASCII,它是用7个二进制位来表示128个字符,而后来随着不同国家、组织的需要,出现了许许多多的字符集,如表示西欧字符的ISO8859系列的字符集,表示汉字的GB2312-80、GBK等字符集。1.1字符集ASCII介绍ASCII是我们非常熟悉的字符集,它是用7个二进制位来表示128个字符!目前,目前几乎所有的其他字符集都兼容ASCII,这也是英文字符不会出现乱码的原因!1.2字符集ISO8859介绍ISO8859是表示西欧字符的字符集,他是一个8位的字符集!在Oracle数

6、据库中,WE8ISO8859P1就是表示这种字符集,在网络上,这种字符集合有时候被错误的认为是:”万能字符集”,有时候,很多人用他来存储中文(我们的Netman很大一部分也是这么做的)!事实上,这种字符集并不支持中文,如果用他来存储中文是错误的,以下我们会通过一些测试例子来说明这一点!1.3字符集GB2312介绍为了处理汉字,程序员设计了用于简体中文的GB2312,GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。G

7、B2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030。从ASCII、GB2312、GBK到GB18030,这些编码方法是向下兼容的,即同一个字符在这些方案中总是有相同的编码,后面的标准支持更多的字符。在这些编码中,英

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。