戻る   キャラクタコード (character code)



キャラクタコードは、 文字をコンピュータで処理するために定められたコードです。

コンピュータが本来扱えるのは、 2 進数の数字だけです。
コンピュータのメモリは、 無数のメモリセルがただ単に 0 か 1 かを記憶しているだけだし、 演算装置も 2 進数の演算だけしかできません。
にもかかわらずコンピュータでレポートが書けたりメールを送れたりするのは、 文字に背番号をつけて数値化し、 文章は数字の羅列に置き換えてあるからです。 メールを送信するときも、 コンピュータは単に何個も何個も数字を送り続けている…、 と信じているはずです。
一方、 数字の羅列のメールを受け取ったら、 同じルールを使って元の文字に戻さなくてはなりません。 でないと、 とんでもないことになります。 イチローのつもりの 51 がバーニー・ウィリアムスに化けたりします。

そこで簡潔で合理的な文字の並べ方を検討し、 順に番号つけて、 みんなが同じものを使おうというわけです。
下図はその一例です。



表中、 たとえば A と表示されているところへマウスのカーソルをあわせて下さい。 表の下に  [A] : 41 (65)10 と表示されます。 A という文字のコードは 41 で、 これは 16 進数 なので、 10 進数で表すと 65 だという意味です。
マウスをクリックするとその文字のコード表示が固定され、 ボタンで解除されます。

このように、必要な文字 (アルファベット大文字・小文字、カナ)や 数字、 記号 (%、=、+、− など)、 制御文字 (コンピュータの制御に使われる符号) などに番号を付け、 文字データをコンピュータで扱えるようにしたものがキャラクタコードです。
キャラクタコードには様々なものがありますが、 上図では JIS コード (JIS X 0201)EBCDIC (Extended Binary Coded Decimal Interchange Code) が表示できるようにしてあります。
JIS コードは ASCII に準拠していますが、 1 ビット拡張してカタカナを扱えるようにしてあります。
EBCDIC は IBM が1963年に同社のメインフレーム用として独自に作ったキャラクタコードです。



関連事項: キャラクタコード  2 進数  16 進数  ASCII  EBCDIC


情報処理概論 に戻る   用語解説 に戻る   戻る  

Java applet 圧縮アーカイブファイル    自由利用マーク
update; 2013.02.17  address