科目学習書●[メディアテクノロジー論]/[マルチメディア活用論]

符号



http://www.infonet.co.jp/apt/March/syllabus/MedTech/code.html



この単元は 単元[数+数列]または[文字+文章]と並行して学習する場合があります
単独に学習してもかまいませんが その場合は ほかの単元を学習するよりも先に済ませておきましょう




情報の通信/記録
種類がそれほど多くない場合


 ほとんどの情報は、そのままの形式では通信/記録することができない。ふつうのことばや絵で表現すれば、時間をかけてそれほど距離が開いていない所に通信/記録することは可能だけれど、距離があって時間がかけられない場合にはこの手法も使えない。
 通信/記録する情報の区別がそんなに多くない場合は(=数万種類ぐらいまでなら)、現れるかもしれない情報の値のそれぞれに対して異なる(そしてもちろん通信/記録しやすい)名前をあらかじめ対応づけておき、それを代わりに通信/記録することが行なわれる。もちろん、送り出す(書く)側と受け取る(読む)側とでどの値とどの名前とが対応しているのかは打ち合わせておかなければならない。
 この名前を符号(code=規定)という。符号としては、ふつうの文字を何字かつないだもの(名前)や、数(番号)や、ビット列が使われることが多い。特別な記号を使う場合もある。

必ず学習しておきなさい
[符号]

 情報からそれに対応する符号を生成する処理を符号化(coding)といい、逆に符号からもとの情報を再現する処理を復号(decoding)という。この二つは必ず対応しているので、合せてコーデック(codec<coding-decoding)という。

情報
符号化 復号
符号
通信/記録



符号系


 情報を記録/通信するためには、情報と符号とを対応させるための取り決め(手順などのしくみ)が必要だ。このしくみを符号系(coding system)という

 実験
 いろいろな符号系がまとめられている資料を見て、JISでは茨城県、水戸市、常磐大学などにはどんな符号を対応させることになっているか調べてみよう。

 ほとんどの符号系では(特に電子的なしくみを使う場合には)、ビット列を符号として使っている。ビット列は、必要に応じて長さを伸ばしさえすれば、たった2種類の要素からなのに、いくらでも多くの種類の符号が使えるようになるという長所がある。

 符号系には(文字のためのとか数のためのとかに限ってもそのそれぞれに対して)いろんな種類があって、事情によって使い分けられている(→[文字])。こうしたいろいろな名前の割り振り方がどう生まれ、どう変わっていこうとしているのか知っておこう。また、JIS1/2単位符号系などの特に重要な符号系については、文字の選び方や並べ方がどうなっているか確かめておこう(→[文字符号系])。
 文字を表現している符号だということが分かっていたとしても、表現されている本体を見ただけでは、それがどの符号系に基づいているのかは区別できない。

 実験
 間違った符号系を使ってテキストを復号するどうなってしまうか、海外のウェブを日本字用の符号系で読もうとしてみるなどの実験によって確かめてみよう。


情報の通信/記録
種類がとても多い場合


 文字テキストは似ているけれど全く違う。文字はたかだか6万種類しかないが、テキストには無限の種類がある。
 文字を1字だけ通信/記録することが決まっていれば文字符号系にしたがって符号化/復号することが可能だけれど、テキストではそのような手法は使えない。

 脇道
 Hugoには、出版社との間でおかしな手紙を交わした有名なエピソードがある。(学習とは全く関係ないが勢いで)聞いておこう。

 テキストだけでなく、スチル、オーディオ、ビデオなどの情報も、内容がほとんど無限に変化する。そのため、これらのタイプの情報については、あらかじめ内容と符号とを対応させておくことはできない。
 これらの情報は、原子に当たる無数の情報(テキストでは文字)が組みになったり列になったりして構成されている。したがって、うまく分解すれば(文字や数のような)単純で種類の少ない(しかし個数はかなり多い)情報にしてしまうことができる。これらの要素をそれぞれ符号化して一列に並べれば、1個だけの符号の場合と同じように通信/記録することが可能になる。
 このように、もとの情報からの分解と符号の一列化を前後にともなった処理も、(拡張した意味での)符号化という。こうして通信/記録された符号列は、逆に符号の個別化ともとの情報への結合をともなう(拡張した意味での)復号によって情報に復元することができる(▽図)。

情報
分解 統合
たくさんの情報の原子
それぞれ
符号化
それぞれ
復号
たくさんの符号
一列化 分離
符号列
通信/記録


 情報を、単独の符号や無数の一連の符号として、記録/通信できるように書き表わしたものを、その情報の表現(representation)という。
 複雑な情報のコーデックで大切なのは、原子にあたる情報を符号化/復号することはもちろんとして、複雑な情報をどう分解し、原子をどう統合するかにある。

 符号とよく似たものに暗号(cypher)がある。
 暗号は、書き方と読み方を秘密にしておくことによって、特定の送り手の受け手との間だけにしか記録/通信が成り立たないようにするためのものだ。たとえば、電子メールは暗号にして送ることができるが、これを途中で誰かが割り込んで読もうとしても意味が分からない。
 符号は困難な環境(たとえば距離が開いているとか)で通信/記録が実現できるようにするためのもので、一般には、書いてあることを秘密にしたくて使うわけではない。逆に、符号を使わない暗号もある。この二つは混同されることが多いけれど、ちゃんと区別しなくてはいけない。

 鑑賞
 DoyleのHormesシリーズの[踊る人形]というエピソードにはおもしろい暗号が登場する。HormesシリーズはTVシリーズになっているので、そのうちの同名のエピソードを見てみよう。Hormesが暗号の解読について(ほんのちょっとだけ)解説してくれるので、聞かせてもらおう。



 鑑賞
 [DaVinci Code]は秀れた小説(映画になったのも)だけれど、暗号の話しだから "code" という術語が題名になっているのは(野暮な言い方だけど)間違っている。
 でもせっかくなので、予告編ぐらいは見ておこう。




デジタル:アナログ


 現代の技術では、ビット列による符号(の列)がいろんな情報を通信/記録するのに広く使われている。このような技術を、デジタル(digital)な技術という。
 1900年ごろからの約100年間は、スチルやオーディオのような情報では、電場や磁場などの強弱の変化に置き換えて通信/記録することが広く行なわれていた。このような技術は、アナログ(analogous)な技術とよばれている。
 スチル(モノクロなら明るさ)やオーディオ(圧力)は時間や空間に沿って広がっている関数(function)と見なすことができる。このことは、スチルやオーディオのような視覚的な情報や聴覚的な情報までもが記録/通信できるということを意味している。実際にも、デジタル技術はアナログ技術よりも柔軟で単純なので、デジタル技術が確立した80年ごろからは、デジタル技術への切り替えが急速に進んでいる。




学習の成果を自己評価してみよう
もっと深く学習してみたい人のための課題




コンピュータ


Copyleft(C) 2003-08, by Studio-ID(ISIHARA WATARU). All rights reserved.


最新更新
08-11-18