欢迎来到天天文库
浏览记录
ID:39461304
大小:274.34 KB
页数:27页
时间:2019-07-03
《《基本编用语说明》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基本編の用語説明 その2エディタと日本語入力エディタエディタ(editor):文書を作成、編集するアプリケーションソフトウェア教育用計算機システムのエディタは、テキストエディット基本的な編集方法はここカーソル:文字が入力される位置を表している目印カッペ、コピペ検索と置換編集結果の保存文系のみなさんには興味はないだろうがemacsというエディタもあるさて、いよいよ日本語入力だが。。。文字コード:コンピュータの内部対応画面やキーボードで見える文字(2進数で表現)文字コード(人間に読める:フォント)フォント:画面にみ
2、える字の形Unicode:世界の主な文字を文字集合として16ビットの文字コード詳しくはここアスキーコード:7ビットで英数字を表す文字コードビット:2進数1桁のこと。計算機で情報を表す最小単位漢字コード:漢字は8ビットでは表現できないので、16ビット以上使うコードになるShiftJIS(SJIS),EUC,JISなどが混在。これらのコードが混在した状態でいったいどうやって文字コードを認識するのだろうか?ISO646(ASCII)文字セット0123456789ABCDEF2!“#$%&‘()*+,./301234567
3、89:;<=>?4@ABCDEFGHIJKLMNO5PQRSTUVWXYZ[]^_6`abcdefghijklmno7pqrstuvwxyz{
4、}~JIS漢字JIS漢字sjissjissjissjissjissjis00215E5F7E819FE0EF第2バイト0021407E80第1バイト(アスキーコード)JISカタカナ JISX0201ここは1バイト文字シフトJIS(sjis)の漢字領域のシフトこの行き来(1バイト文字と2バイト文字の行き来)は特殊文字列(ISO2022エスケープシーケンス)で行うJIS
5、コードSJISコードMacOSでの日本語入力はここ全角と半角半角カタカナや全角英文字は避けましょう。ここから先は難しいので、根性の無い人は、これ以上進んではいけません:コードの歴史ASCII(AmericanStandardCodeforInformationInterchange)ANSIISO646=95文字のラテン文字アルファベット+数字+特殊文字制御コード: LF,CRなどの表示制御と ACK,DELなどの通信制御 、などJISX0201ではASCIIの特殊文字の一部が異なる(¥の使用など)日本語コー
6、ドの話1バイトでは最大256文字字種の多い言語では多バイトコード1バイトコードで事足りる欧米言語と多バイトコードが必要なアジアの言語とのバトルグランド文字コードのような基本的情報インフラの標準化は社会への影響莫大ISO2022エスケープシーケンスにより文字を拡張するための各種のメカニズム各国のISO646 (アメリカならASCII、日本ならJISX0201) を別個の文字集合として指定し切り替えて使える。ちなみに西ヨーロッパの文字では、ISO8859/1ISO2022 エスケープシーケンス変化先の文字コードエスケー
7、プシーケンスASCIIESC(BJIS X0201(ASCII対応部分)ESC ( JJIS カタカナESC ( IJIS 0208ESC $ BJISコードの歴史JISX0208(1978) 当時はJISC6226 カタカナ(いわゆる半角カタカナ)および全角英字はいまや無用の長物ないしは有害半角カタカナと全角英字は97JISでは使わないことに決めたシフトJIS78JIS 83JIS 90JIS97JIS内部状態を持つ文字コードと持たない文字コード1バイトコードのASCIIは内部状態なし2バイトの内部状態な
8、しコードを目指したのがユニコードエスケープシーケンスのある文字コードISO2022に則るコードは内部状態を持つ。内部状態を持つと何がまずいのか?JISコードにおける漢字78JISの第1水準 2965文字=都道府県 名、市町村名を全て記述できる。 第2水準 3384文字JISX0212の補助漢字 5801文字日本語EUCUnixで常用される2バイトコード第1バイト最上位ビット=0JISX0201(ASCII対応部分)第1バイト最上位ビット=1 かつ第2バイト最上位ビット=1JIS漢字第1バイト=
9、8Eかつ第2バイト最上位ビット=1JISカタカナ第1バイト=8Eかつ第2バイト最上位ビット=1かつ第3バイト最上位ビット=1JIS補助漢字上位ビットを見るだけで字種を判別できるシフトJISJISX0208で使用していない文字を漢字の1バイト目に使う。すなわち、1バイト目、最上位ビット=0JISX0201(英数字などASCII対応部分)最上位ビット=1
此文档下载收益归作者所有