戻る キャラクタコード (character code)

キャラクタコードは、文字 (および記号や数字、制御機能など) を コンピュータで処理するために定められたコードです。


ビット2進数 (=1バイト) は、256種類の情報を表すことができます。

たとえば、01000001 という2進数は、16進数では 41、10進数では 65 という数字です。

この 01000001 という8ビットの2進数を、01000001 の2つに分けて、 前者を「上位4ビット」、後者を「下位4ビット」と呼ぶことにします。

4ビットの2進数は 16種類の情報を表すことができますから、16列×16行の表を作ると下図のようになります。 表の中には、もとの8ビットの2進数が表している値を 10進数で表示してあります。 0から 255 までの、256 個の数字で埋められます (下の 「数字」 ボタンをクリックすると、その状態が表示されます)


表中、A と表示されているところへマウスのカーソルをあわせてみて下さい。 A65 に変わり、 表の下に CODE = 41 と表示されます。 マウスをクリックすると 65 表示に切り替わります。
同様にして、B66 で、 そのコードは 42C67 で、 コードは 43 です。

このように、文字データを処理するのに必要な文字 (アルファベット大文字・小文字やカナ) 、 数字と記号 (%,=,+,- など)、コンピュータの制御に使われる符号などを定めたものが キャラクタコードです。

小さな文字で表示されているのは制御用の符号です。
たとえばコード 08 の "BS" は、 キーボードの Back Space キーを押したときに使用されます。 このコードを受け付けると、コンピュータはディスプレイのカーソルの左の文字を消去し、 カーソルを左に移動させます。
コード 09 の "HT" は、 キーボードの Tab キーを押したときに使用されます。 このコードを受け付けると、コンピュータはディスプレイのカーソルを一定の桁数 (一般的には8文字分) スキップさせます。
制御符号は文字としてではなく、 コンピュータの各装置をさまざまに制御するために使用されます。

キャラクタコードには様々なものがあります。このページで最初に表示されるのは、 JIS 8単位コード (JIS X 0201) です。 他には EBCDIC (Extended Binary Coded Decimal Interchange Code) などがあります。
EBCDIC は IBM が独自に作ったキャラクタコードで、「EBCDIC」 ボタンをクリックすると表示されます。


関連事項: 講義資料/キャラクタコード


情報処理概論 に戻る   用語解説 に戻る   戻る  

update: 2001.04.06  ueyama@infonet.co.jp