 |
ASCII (American Standard Code for Information Interchange) |
ASCII は ANSI
(American National Standards Institute; 米国規格協会)
が 1963年に定めた
キャラクタコードです。
「アスキー」 と読みます。
コンピュータが扱えるのは 2 進数の数値だけですから、
文書データをコンピュータで処理するには、 文字を数字に置き換えなくてはなりません。
ASCII では文字を 7
ビットの数字
(2 進数)
で表わしています。
下図は ASCII コード表です。
8 列 × 16 行、 全部で 128 文字が入る表の中で、 たとえば "
A" という文字は
0 から数えて 4 列目、 0 から数えて 1 行目にあります。
表のいちばん上と左にあるのは
16 進数 で表したこの列・行の数字で、
横方向には 0 から 7 までの 8 列、 縦方向には 0 から F まで 16 行あります。
"
A" は 4 列目の 1 行目なので、 列・行の順に読んで
41 が "
A" の文字コードです。
16 進数の 41 を 2 進数にすると 1000001、 10進数だと 65 です。
これが "
A" につけられた背番号です。
文字が数字に置き換えられたので、 2 進数の数値だけしか扱えないコンピュータにも、
背番号を頼りに、 文字データを扱うことができるようになります。
ASCII を使うコンピュータはみな、 「65 番目の文字といえば "
A"」 というわけで、
互いに文書データの交換や処理ができます。
しかし ASCII は "American Standard Code for Information Interchange"、
つまり 「情報交換のためのアメリカ標準コード」 です。
英語にはよくても、 このままでは使えない国もあります。
そこで 1967年に国際規格化
(ISO 646
)
されるにあたって、 上図の青い部分、
23 は "
#" か "
£"、
24 は "
$" か "

" を選択し、
ピンクの部分は各国で自由に定めてよいことになりました。
イギリスやイタリアなどは
23 を "
£" にし、 ドイツやフランスはピンクの部分に
"

"、 "

" などの文字を割り当てています。
日本は
5C の "
\"
(バックスラッシュ) を
"
¥"
(円記号) に、
7E の "
~"
(チルダ) を
"
 ̄"
(オーバーライン) に置き換えて
JIS コード
(JIS X 0201) としています。
00 〜
1F および
20 と
7F、 図では薄いグレーの部分に収められているのは文字ではなく、
制御文字
(control character) と呼ばれるものです。
例えば
08 の "
BS"
(Backspace) はキーボードの "BS" キーのコードで、
カーソルを戻して一文字削除する機能があります。
09 の "
HT"
(Horizontal Tabulation) は "TAB&" キーに対応していて、
カーソルの位置を一定の桁数だけジャンプさせます。
また
20 の "
SP" は間隔
(スペース) です。