bit、byte、位、字节、汉字的关系

bit、byte、位、字节、汉字的关系

ID:8801391

大小:125.00 KB

页数:5页

时间:2018-04-08

bit、byte、位、字节、汉字的关系_第1页
bit、byte、位、字节、汉字的关系_第2页
bit、byte、位、字节、汉字的关系_第3页
bit、byte、位、字节、汉字的关系_第4页
bit、byte、位、字节、汉字的关系_第5页
资源描述:

《bit、byte、位、字节、汉字的关系》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、bit、byte、位、字节、汉字的关系        1 bit     =1 二进制数据        1 byte  =8 bit        1字母= 1 byte=8bit        1汉字=2 byte=16bit1.bit:位    一个二进制数据0或1,是1bit;2.byte:字节    存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45) 即是指45个字节;    1byte=8bit3.一个英文字符占一个字节;    1字母=1byte=8bit4.一个汉字占2个字节;    1汉字=2byte=16bit5.标点符号    A>

2、. 汉字输入状态下,默认为全角输入方式;    B>. 英文输入状态下,默认为半角输入方式;    C>. 全角输入方式下,标点符号占2字节;    D>. 半角输入方式下,标点符号占1字节;    故:汉字输入状态下的字符,占2个字节(但不排除,自己更改了默认设置);            英文输入状态下的字符,占1个字节(但不排除,自己更改了默认设置);        老美在发明电脑时,肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位,于是也就有了不规范的1字符=1byte,岂不知还有我们伟大的汉字计量单位,NND,一个汉字也是一个字符,我们的1汉字字符

3、就等于2byte,后来,他们可能意识到这个尴尬的问题,于是又标榜为:一个字母为一个标准字符,去球吧,谁整天没事说个字符还“标准字符”,所以啊,个人认为:字符,不能用于标准的计量单位。--------------------------------补充:    计算机对各国语言的支持度,可分为以下三个阶段,如图:转载:http://blog.csdn.net/Zevin/article/details/5772670 Byte(字节)与bit的区别:在计算机科学中,bit是表示信息的最小单位,叫做二进制位;一般用0和1表示。Byte叫做字节,由8个位(8bit)组成一个字节

4、(1Byte),用于表示计算机中的一个字符。bit与Byte之间可以进行换算,其换算关系为:1Byte=8bit(或简写为:1B=8b);在实际应用中一般用简称,即1bit简写为1b(注意是小写英文字母b),1Byte简写为1B(注意是大写英文字母B)。我们所说的硬盘容量是40GB、80GB、100GB,这里的B指是的Byte也就是“字节”。 1KB=1024Bytes=2^10Bytes 1MB=1024KB=2^20Bytes 1GB=1024MB=2^30Bytes 字符又是什么呢?字符是可使用多种不同字符方案或代码页来表示的抽象实体。例如,UnicodeUTF-1

5、6编码将字符表示为16位整数序列,而 UnicodeUTF-8编码则将相同的字符表示为8位字节序列。公共语言运行库使用UnicodeUTF-16(Unicode转换格式,16位编码形式)表示字符。针对公共语言运行库的应用程序使用编码将字符表式形式从本机字符方案映射至其他方案。应用程序使用解码将字符从非本机方案映射至本机方案。字节(Byte):字节是通过网络传输信息(或在硬盘或内存中存储信息)的单位。一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间.符号:英文标点占一个字节,中文标点占两个字节.一个二进制数字序列,在计算机中作为一个数字单元,一般为8

6、位二进制数,如一个ASCII码就是一个字节。理解编码的关键:是要把字符的概念和字节的概念理解准确。这两个概念容易混淆,我们在此做一下区分:概念描述举例 字符人们使用的记号,抽象意义上的一个符号。'1','中','a','$','¥',…… 字节计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。0x01,0x45,0xFA,…… ANSI字符串:(多字节字符)在内存中,如果“字符”是以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为ANSI字符串或者多字节字符串。"中文123"(占7字节) UNICODE字符串:(宽

7、字符)在内存中,如果“字符”是以在UNICODE中的序号存在的,那么我们称这种字符串为UNICODE字符串或者宽字节字符串。L"中文123"(占10字节)  由于不同ANSI编码所规定的标准是不相同的,因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能够知道它包含了哪些“字符”。而对于UNICODE字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。什么是C语言中的宽字符与多字节字符?C语言原本是在英文环境中设计的,主要的字符集是7位的ASCII码,8位的byte(字节)是最常见的字符编码

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。