欢迎来到天天文库
浏览记录
ID:34776026
大小:114.53 KB
页数:8页
时间:2019-03-10
《机器语言与字符编码》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、字符编码机器语言机器语言是指一台计算机全部的指令集合电子计算机所使用的是由"0"和"1"组成的二进制数,二进制是计算机的语言的基础。计算机发明之初,人们只能降贵纡尊,用计算机的语言去命令计算机干这干那,一句话,就是写出一串串由"0"和"1"组成的指令序列交由计算机执行,这种计算机能够认识的语言,就是机器语言。使用机器语言是十分痛苦的,特别是在程序有错需要修改时,更是如此。因此程序就是一个个的二进制文件。一条机器语言成为一条指令。指令是不可分割的最小功能单元。而且,由于每台计算机的指令系统往往各不相同,所以,在一台计算机上执行
2、的程序,要想在另一台计算机上执行,必须另编程序,造成了重复工作。但由于使用的是针对特定型号计算机的语言,故而运算效率是所有语言中最高的。机器语言,是第一代计算机语言。汇编语言为了减轻使用机器语言编程的痛苦,人们进行了一种有益的改进:用一些简洁的英文字母、符号串来替代一个特定的指令的二进制串,比如,用"ADD"代表加法,"MOV"代表数据传递等等,这样一来,人们很容易读懂并理解程序在干什么,纠错及维护都变得方便了,这种程序设计语言就称为汇编语言,即第二代计算机语言。然而计算机是不认识这些符号的,这就需要一个专门的程序,专门负责
3、将这些符号翻译成二进制数的机器语言,这种翻译程序被称为汇编程序。汇编语言同样十分依赖于机器硬件,移植性不好,但效率仍十分高,针对计算机特定硬件而编制的汇编语言程序,能准确发挥计算机硬件的功能和特长,程序精炼而质量高,所以至今仍是一种常用而强有力的软件开发工具。高级语言从最初与计算机交流的痛苦经历中,人们意识到,应该设计一种这样的语言,这种语言接近于数学语言或人的自然语言,同时又不依赖于计算机硬件,编出的程序能在所有机器上通用。经过努力,1954年,第一个完全脱离机器硬件的高级语言--FORTRAN问世了,40多年来,共有几百
4、种高级语言出现,有重要意义的有几十种,影响较大、使用较普遍的有FORTRAN、ALGOL、COBOL、BASIC、LISP、SNOBOL、PL/1、Pascal、C、PROLOG、Ada、C++、VC、VB、Delphi、JAVA等。ASCII与二进制英文字母和其它字符按一定的规则用二进制编码后在计算机上使用。目前在微型计算机中普通采用的编码是ASCII码。ASCII的机器内码为每个字符占8个二进制位,其中最高位用作奇偶校验,剩下7位用于编码,如b表示为1100010,这8个二进制位合叫一个字节。即8个二进制表示一个ASCI
5、I码,一个ASCII码就是代表一个字节。特点:主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统ASCII码包含内容:ASCII码共能表示128个字符,其中包括数字字符(0~9)、大小写英文字母、西文符号、回车键、退格、换行键等。附图:7位ASCII编码表ISO-8859-1ASCII码是针对英语设计的,当处理带有音调标号(形如汉语的拼音)的欧洲文字时就会出现问题。为了表示更多的欧洲常用字符,原ASCII码最高位用来参与表示字符。这样ASCII码就能表示256个字符。多出的128个字符用来表示表格符号、计算符
6、号、希腊字母和特殊的拉丁符号。即ISO-8859-1是ASCII码的扩展UNICODE对所有语言的文字进行了统一编码,对每一个字符都用2个字节来表示,对于单字节字符如英文字符采取前面加“0”字节的策略实现等长兼容。例:“a”的ASCII码为0x61,UNICODE就为0x00,0x61。1.名称的由来Unicode字符集编码是UniversalMultiple-OctetCodedCharacterSet通用多八位编码字符集的简称,是由一个名为Unicode学术学会(UnicodeConsortium)的机构制订的字符编码系
7、统,支持现今世界各种不同语言的书面文本的交换、处理及显示。该编码于1990年开始研发,1994年正式公布,最新版本是2005年3月31日的Unicode4.1.0。2.特征Unicode是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。UTF-8UTF-8是Unicode的其中一个使用方式。UTF是UnicodeTranslationFormat,即把Unicode转做某种格式的意思。Unicode还有其它一些使用方式,如UTF-16、UTF
8、-32等。背景:由于Unicode编码采用双字节存储,因而对于英文等存储空间浪费较大,在这种情况下变长字节存储成为需要,于是UTF系列编码出现。特点:UTF-8便于不同的计算机之间使用网络传输不同语言和编码的文字,使得双字节的Unicode能够在现存的处理单字节的系统上正确传输。字节存储:
此文档下载收益归作者所有