《基本编用语说明》PPT课件

《基本编用语说明》PPT课件

ID:39461304

大小:274.34 KB

页数:27页

时间:2019-07-03

《基本编用语说明》PPT课件_第1页
《基本编用语说明》PPT课件_第2页
《基本编用语说明》PPT课件_第3页
《基本编用语说明》PPT课件_第4页
《基本编用语说明》PPT课件_第5页
资源描述:

《《基本编用语说明》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基本編の用語説明 その2エディタと日本語入力エディタエディタ(editor):文書を作成、編集するアプリケーションソフトウェア教育用計算機システムのエディタは、テキストエディット基本的な編集方法はここカーソル:文字が入力される位置を表している目印カッペ、コピペ検索と置換編集結果の保存文系のみなさんには興味はないだろうがemacsというエディタもあるさて、いよいよ日本語入力だが。。。文字コード:コンピュータの内部対応画面やキーボードで見える文字(2進数で表現)文字コード(人間に読める:フォント)フォント:画面にみ

2、える字の形Unicode:世界の主な文字を文字集合として16ビットの文字コード詳しくはここアスキーコード:7ビットで英数字を表す文字コードビット:2進数1桁のこと。計算機で情報を表す最小単位漢字コード:漢字は8ビットでは表現できないので、16ビット以上使うコードになるShiftJIS(SJIS),EUC,JISなどが混在。これらのコードが混在した状態でいったいどうやって文字コードを認識するのだろうか?ISO646(ASCII)文字セット0123456789ABCDEF2!“#$%&‘()*+,./301234567

3、89:;<=>?4@ABCDEFGHIJKLMNO5PQRSTUVWXYZ[]^_6`abcdefghijklmno7pqrstuvwxyz{

4、}~JIS漢字JIS漢字sjissjissjissjissjissjis00215E5F7E819FE0EF第2バイト0021407E80第1バイト(アスキーコード)JISカタカナ   JISX0201ここは1バイト文字シフトJIS(sjis)の漢字領域のシフトこの行き来(1バイト文字と2バイト文字の行き来)は特殊文字列(ISO2022エスケープシーケンス)で行うJIS

5、コードSJISコードMacOSでの日本語入力はここ全角と半角半角カタカナや全角英文字は避けましょう。ここから先は難しいので、根性の無い人は、これ以上進んではいけません:コードの歴史ASCII(AmericanStandardCodeforInformationInterchange)ANSIISO646=95文字のラテン文字アルファベット+数字+特殊文字制御コード: LF,CRなどの表示制御と   ACK,DELなどの通信制御 、などJISX0201ではASCIIの特殊文字の一部が異なる(¥の使用など)日本語コー

6、ドの話1バイトでは最大256文字字種の多い言語では多バイトコード1バイトコードで事足りる欧米言語と多バイトコードが必要なアジアの言語とのバトルグランド文字コードのような基本的情報インフラの標準化は社会への影響莫大ISO2022エスケープシーケンスにより文字を拡張するための各種のメカニズム各国のISO646 (アメリカならASCII、日本ならJISX0201) を別個の文字集合として指定し切り替えて使える。ちなみに西ヨーロッパの文字では、ISO8859/1ISO2022 エスケープシーケンス変化先の文字コードエスケー

7、プシーケンスASCIIESC(BJIS X0201(ASCII対応部分)ESC ( JJIS カタカナESC ( IJIS 0208ESC $ BJISコードの歴史JISX0208(1978) 当時はJISC6226 カタカナ(いわゆる半角カタカナ)および全角英字はいまや無用の長物ないしは有害半角カタカナと全角英字は97JISでは使わないことに決めたシフトJIS78JIS 83JIS 90JIS97JIS内部状態を持つ文字コードと 持たない文字コード1バイトコードのASCIIは内部状態なし2バイトの内部状態な

8、しコードを目指したのがユニコードエスケープシーケンスのある文字コードISO2022に則るコードは内部状態を持つ。内部状態を持つと何がまずいのか?JISコードにおける漢字78JISの第1水準 2965文字=都道府県     名、市町村名を全て記述できる。      第2水準 3384文字JISX0212の補助漢字 5801文字日本語EUCUnixで常用される2バイトコード第1バイト最上位ビット=0JISX0201(ASCII対応部分)第1バイト最上位ビット=1 かつ第2バイト最上位ビット=1JIS漢字第1バイト=

9、8Eかつ第2バイト最上位ビット=1JISカタカナ第1バイト=8Eかつ第2バイト最上位ビット=1かつ第3バイト最上位ビット=1JIS補助漢字上位ビットを見るだけで字種を判別できるシフトJISJISX0208で使用していない文字を漢字の1バイト目に使う。すなわち、1バイト目、最上位ビット=0JISX0201(英数字などASCII対応部分)最上位ビット=1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。