|
キャラクタコード (character code) |
キャラクタコードは、 文字をコンピュータで処理するために定められたコードです。
コンピュータが本来扱えるのは、
2 進数の数字だけです。
コンピュータのメモリは、 無数のメモリセルがただ単に 0 か 1 かを記憶しているだけだし、
演算装置も 2 進数の演算だけしかできません。
にもかかわらずコンピュータでレポートが書けたりメールを送れたりするのは、
文字に背番号をつけて数値化し、 文章は数字の羅列に置き換えてあるからです。
メールを送信するときも、 コンピュータは単に何個も何個も数字を送り続けている…、 と信じているはずです。
一方、 数字の羅列のメールを受け取ったら、 同じルールを使って元の文字に戻さなくてはなりません。
でないと、 とんでもないことになります。
イチローのつもりの 51 がバーニー・ウィリアムスに化けたりします。
そこで簡潔で合理的な文字の並べ方を検討し、 順に番号つけて、 みんなが同じものを使おうというわけです。
下図はその一例です。
表中、 たとえば
A と表示されているところへマウスのカーソルをあわせて下さい。
表の下に
[A] : 41 (65)10 と表示されます。
A という文字のコードは
41 で、
これは
16 進数 なので、
10 進数で表すと
65 だという意味です。
マウスをクリックするとその文字のコード表示が固定され、
ボタンで解除されます。
このように、必要な文字
(アルファベット大文字・小文字、カナ)や
数字、 記号
(%、=、+、− など)、 制御文字
(コンピュータの制御に使われる符号) などに番号を付け、
文字データをコンピュータで扱えるようにしたものがキャラクタコードです。
キャラクタコードには様々なものがありますが、
上図では JIS コード
(JIS X 0201) と
EBCDIC
(Extended Binary Coded Decimal Interchange Code)
が表示できるようにしてあります。
JIS コードは
ASCII に準拠していますが、
1 ビット拡張してカタカナを扱えるようにしてあります。
EBCDIC は IBM が1963年に同社のメインフレーム用として独自に作ったキャラクタコードです。