|
|
キャラクタコード (character code) |
キャラクタコードは、文字 (および記号や数字、制御機能など) を
コンピュータで処理するために定められたコードです。
8ビットの2進数
(=1バイト) は、256種類の情報を表すことができます。
たとえば、01000001 という2進数は、16進数では
41、10進数では 65 という数字です。
この 01000001 という8ビットの2進数を、0100 と 0001 の2つに分けて、
前者を「上位4ビット」、後者を「下位4ビット」と呼ぶことにします。
4ビットの2進数は 16種類の情報を表すことができますから、16列×16行の表を作ると下図のようになります。
表の中には、もとの8ビットの2進数が表している値を 10進数で表示してあります。
0から 255 までの、256 個の数字で埋められます
(下の 「数字」 ボタンをクリックすると、その状態が表示されます)。
表中、A と表示されているところへマウスのカーソルをあわせてみて下さい。
A が 65 に変わり、
表の下に CODE = 41 と表示されます。
マウスをクリックすると 65 表示に切り替わります。
同様にして、B は 66 で、
そのコードは 42、
C は 67 で、
コードは 43 です。
このように、文字データを処理するのに必要な文字 (アルファベット大文字・小文字やカナ) 、
数字と記号 (%,=,+,- など)、コンピュータの制御に使われる符号などを定めたものが
キャラクタコードです。
小さな文字で表示されているのは制御用の符号です。
たとえばコード 08 の "BS" は、
キーボードの Back Space キーを押したときに使用されます。
このコードを受け付けると、コンピュータはディスプレイのカーソルの左の文字を消去し、
カーソルを左に移動させます。
コード 09 の "HT" は、
キーボードの Tab キーを押したときに使用されます。
このコードを受け付けると、コンピュータはディスプレイのカーソルを一定の桁数 (一般的には8文字分)
スキップさせます。
制御符号は文字としてではなく、
コンピュータの各装置をさまざまに制御するために使用されます。
キャラクタコードには様々なものがあります。このページで最初に表示されるのは、
JIS 8単位コード (JIS X 0201) です。
他には EBCDIC
(Extended Binary Coded Decimal Interchange Code)
などがあります。
EBCDIC は IBM が独自に作ったキャラクタコードで、「EBCDIC」 ボタンをクリックすると表示されます。
関連事項: 講義資料/キャラクタコード
update: 2001.04.06 ueyama@infonet.co.jp