欢迎来到天天文库
浏览记录
ID:53032630
大小:382.44 KB
页数:2页
时间:2020-04-14
《人变“猪”的魔术——Windows编码揭秘-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、漫步者的十年证明了中国的声音数码业能做得和国外大企业一样好,甚至超越它!KNOWLEDGECFan加油站(137*****733)电脑爱好者10周年用户感言责任编辑:狂PKsystem@cfan.com.cn人变“猪”的魔术Windows编码揭秘■熊国红“在QQ聊天窗口按住Alt键,接着用小键盘输入‘29482’,松开Alt后就会看到你的名字了!”收到好友发来的消息,忍不住试了一下,结果自己的名字就成了“猪”。虽然只是一个玩笑,但你难道不想知道人为什么会变“猪”吗?示在屏幕上,这样就能够在屏幕上看编码作为一个引导字节(Leading
2、到该文字,这就是文字解码。Byte),紧跟在引导字节后的第二(甚至向MM表白的经典方案试着在QQ的聊天窗口中按住也就是说,在文字输入到显示在第三)个字符与引导字节一起形成新的Alt,然后通过小键盘依次输入屏幕需要经过两个过程—编码和解文字编码。这样的字符集有很多,我们73、76、85、90641、94769、小实验85856。这就是说,能够用这码,在编码和解码的过程中都需要通常见的GB2312、Big5、Shift-JIS、种方法输入的不仅有“猪”,所有的文字都可以。怎么把喜欢的MM的名过文字编码规则,于是就产生这样的IS08859
3、等编码。字变成代码?接着往下看吧!疑问,编码和解码过程中的文字编码3.“字符集冲突”的拯救者规则是不是一样的呢?由于每种语言都制定了自己的字汉字或其他字符都可以通过按住符集,导致最后存在的各种字符集实Alt+小键盘数字的方式输入,而且它战国风云录!从ASCII到Unicode在太多,甚至中文的简繁体之间字符们和数字是一一对应的关系。要找出1.翻倍后的扩展ASCII集也不同,十分不便(比如玩繁体字游这种对应关系,就需要先了解计算机人类的语言是相当丰富的,不同戏时就会出现乱码,必须使用“南极星”的字符编码规则。国家甚至民族所使用的文字有
4、很大的等内码转换工具)。为了方便信息交流,区别,所以产生了许多不同的文字编人们又重新收录了字符集—文字是如何输入和显示出来的码。最初的时候,人们收录了字符并按Unicode,它为所有字符都分配了一个1.不认图只认数照一定规则组成了一个字符编码集合唯一对应的编码,这样的编码无须考我们知道计算机所认识的数字只——ANSI(即美国国家标准化组织,各虑平台、程序、语言的区别,在Unicode有两个,即0和1,不同0、1组合组成项国际标准的制定者,包括ANSI文字内核的平台上都能正常显示。也就是二进制数字,这些二进制数字可以转编码标准)的AS
5、CII码(美国信息交换标说Unicode编码收集了人类几乎所有换为八进制、十进制或十六进制的数准代码),它使用7位(Bits)来表示一个语言的字符信息,所以Unicode编码还字。我们在显示器上看到的文字对计字符,如字符“a”的ASCII码为1100001,可称为通用文字编码。此外,Unicode算机而言其实是一种不认识的图形,这样共能表示2的7次方(即128)个字编码中包含了单、双甚至多字节的字计算机是不能直接处理图形的,所以符,其中包括了英文字母、数字、标点符,于是Unicode可以细分为多种编码我们需要将文字的图形保存在电脑的
6、符号等常用字符。后来为了能表达更形式,常见的有UTF-7、UTF-8、UTF-存储器中,然后操作系统中制定一个多字符,人们又将其进行了扩展,使用16和UTF-32,这些编码都属于Unicode对应的规则让文字图形和数字逐一对8位表示一个字符,共能表示256个字字符集。应。其中,文字图形的集合就是我们符(2的8次方),主要在原来的7位字的字体库,而对应的规则就是文字编符集的基础上加入了一些特殊符号,码了。扩展ASCII码向下兼容原来的ANSIUnicode的前世今生历史上存在两个试图独立2.编码和解码ASCII码。设计Unicode的
7、组织,即当我们通过输入法输入文字后,2.扩展了还是不够国际标准化组织(ISO)和一个软件制造商的协会(unicode.org)。系统核对文字图形后根据文字编码规随着计算机的普及,而ASCII最ISO开发了ISO-10646项目,也称为则将文字信息转换成为十六进制的数UCS,而Unicode协会开发了Unicode多能只能表达256个字符集,显然不项目。其中ISO-10646的CodeSpace字代码,然后变成计算机可以处理的能满足需求了(中文的常用汉字就有几(编码空间)为U+0000—U+10FFFF,而Unicode的CodeSp
8、ace为U+0000—二进制代码,这就是文字的编码过程。千个,区区256实在是⋯⋯)。为了能U+FFFF,这就是Unicode1.0,也是当计算机处理完文字信息后,以表示各国文字,各国在ASCII的基础上我们平时说的Unicode。后
此文档下载收益归作者所有