データ伝送web講座

1. データやり取りの方法

line

1.2. データを表す方法

1.2.(1) 数の表現

1.2.(1-A) 2 進数

◆ 情報には、ディジタル情報とアナログ情報とがあります (図.4) (コラム.1.1)。
図の時計のディジタルは、10 進数 ですが、 コンピュータや伝送で使用するディジタルは、2 進数 が基本です。10 進数が、0 から 9 までの数があるのに対して、 2 進数は、0 と 1 の 2 つの数だけからなります(表.1)。

[表.1] 10 進数と 2 進数との対応

10 進数 2 進数
10 
11 
100 
101 
110 
111 
10 進数 2 進数
1000 
1001 
10  1010 
11  1011 
12  1100 
13  1101 
14  1110 
15  1111 


◆ 2 進数の 1 桁は、ゼロか 1 かの 2 つを識別できるだけです。 2 進数の 1 桁を、ビット (bit )といいます。 1 ビットは、ディジタル量の最小単位です。
コンピュータでは、8 ビットを一つの単位として、これを バイト (Byte )といいます。この後に述べるように、 文字は、英数字の場合 7〜8 ビットで表されます (1.2.(2-A))。また漢字などは、 14〜16ビットで表します (1.2.(2-C))。 したがって、8ビットは、手頃な単位です。 1 バイトは、10 進数で 256 です。
◆ ビットとバイトは共に、よく用いられます。ところが頭文字が両方とも "b"ですから、1 文字で略記すると非常に紛らわしいのです。たとえば 伝送速度 (/秒) を、bps と書くとどちらであるか分かりません。 この講座では、
   ビット/秒 : bps
   バイト/秒 : B ps
のように、ビットは小文字、バイトは大文字で表して区別しています。 しかし、間違えやすいので、かな書きを使用し、またはかな書きを併記するなどして、 間違えないようにしています。

1.2.(1-B) 16 進数

◆ 表.1から分かるように、2 進数を 10 進数で表すと、数の区切りが悪く、相互の換算が面倒です。 かといって、2 進数を直接取り扱うと、桁数が多くて分かり難い という欠点があります。そこで、16 進数 が考え出されました(表.2)。

[表.2] 16 進数

16 進数 2 進数
10 
11 
100 
101 
110 
111 
16 進数 2 進数
1000 
1001 
1010 
1011 
1100 
1101 
1110 
1111 


◆ 16 進数では、数字が 16 種類必要です。0 から 9 までの、 元々の数字に、A から F までの英字を加えて、16 種類になっています。
16 進数は、コンピュータの内部で使用される数ではありません。 コンピュータの内部やデータ伝送では、あくまでも、 2 進数を使用します。16 進数は、2 進数を人間が読み書きするのに、 分かりやすく、取り扱いやすいようにする手段です。
◆ なお、16 進数が考え出される前に、8 進数がありましたが、 現在では、あまり使われていません。
以上のように、数の表現には、幾つもの種類があります。 どれで表記されているかを間違えると、大変です。紛らわしい場合には、 表.3 のように表します。


[表.3] 進数の識別表記

  2 進数 1001(2) 1001b 1001B _
 10 進数 15(10) 15d 15D _
 16 進数 10(16) 10h 10H 0x10


◆ 16 進数で、数の後に H をつける方式の場合、たとえば、 「0ABH」のように、最初の数字が A〜F のときに、 さらにその前に数字の 0 をつけます。
この例から分かるように、数がA〜Fの文字だけでできているときは、 数ではなく、文字の記号と見誤る恐れがあるからです。

1.2.(1-C) B C D

◆ コンピュータが直接取り扱うことができるのは 2 進数ですが、 我々は 10 進数の世界に住んでいます。したがって、 10 進数を取り扱うことができる方が便利です。この目的のために、 BCD と呼ばれるものがあります(表.4)。

[表.4] B C D

10 進数 BCD
0000 
0001 
0010 
0011 
0100 
0101 
0110 
10 進数 BCD
0111 
1000 
1001 
10  00010000 
11  00010001 
20  00100000 
25  00100101 


◆ 表から分かるように、4 ビットの2 進数で、10 進数の 1 桁を表します。 このように、2 進数を使用して特定の意味を表したものを、 コード といいます。


1.2.(2) 文字の表現

1.2.(2-A) 英 数 字

◆ コンピュータでは、文字情報も取り扱います。文字コード には、国際規格 ISO があり、この ISO に基づいて、 各国の文字コードが制定されています。
英文字(ローマ字)と数字とを合わせて英数字 といいます。 英数字は、7 ビットの JIS コード (日本規格)があります (表.5)。

[表.5] JIS X0201 情報交換用符号(ローマ文字用 7 単位符号)

JIS の英数字コード

[表の見方] 列と行の交点が文字を表します。
列と行の順で作る 2 進数が、コードを表します。
たとえば、

   表の見方の例

◆ この JIS コードは、下記の 2 字だけが、米国規格 ASCII の文字コードと異なります。

_
JISとASCIIの違い

◆ ASCII は、ISO そのものですが、通常 ASCII と呼んでいます。 JIS は、ISO によって、国毎に変更を認められているコードを、 日本用に変更したものです。
ただし日本でも、オーバーライン(コード1111110のJIS)については、 チルダ(コード1111110のASCII)になっていることも多いようです。

[注] ディスプレイの表示や、プリンタで印字される文字は、 コンピュータ内部または、プリンタ内部で使用しているコード表 によって決まります。 したがって、キーボードのキートップの表示とは異なる場合があります。
また、たとえば、日本語非対応のプログラムを使用すると、 ディスプレイや印字の文字が異なります。

◆ この英数字は、後に示す漢字よりも、通常、 文字幅が狭く印字されるので、通称、半角文字 と呼ばれています。
表.5 の第 1 列と第 2 列は、 通常の文字ではなく、制御コードです。制御コード は、 各種の制御を行うコードです。たとえば、
   0000010 STX : テキスト(通信文)の開始を示す
   0000011 ETX : テキストの終了を示す
   0001010  LF : プリンタのラインフィード
   0001101  CR : プリンタのキャリッジレターン
などです。

1.2.(2-B) カナ文字

◆ この他、JIS には、カナ文字の 7 ビット コード、英数字とカナ文字を 組み合わせた 8 ビット コードが規定されています。 このカナ文字 も、印字すると文字幅が狭いので、 俗に半角カナ文字 と呼んでいます。
◆ しかし、このコードは、たとえば、インターネットでは使用できない などの制約があり、使用したとき、文字化けを起こす可能性があります。
文字化け とは、コンピュータが、コードを別のコードと 読み間違えて、元のコードとは関係の無い、全くデタラメな文字列 が表示されてしまう現象です。

1.2.(2-C) 漢   字

1.2.(2-C-a) 概   要

◆ 漢字 も JIS コードがあります(JIS X 0208)。 日本語(漢字)は文字数が多いので、1 文字が 2 バイトのコードです (表.6)。

[表.6] 漢字コード(JIS X0208)の構成

漢字コードの構成

◆ 元々は、10 進数の「」と「」で文字の位置を指定していましたが、 コンピュータ用に、2 進数に換算したコードが示されています。 「区」と「点」の数が 10 進で各 94 のマトリックスで、 約 6900文字が含まれています。
◆ 2 進数で 7 ビットに収まりますから、表は各 7 ビットで 示してあります。インターネットは、伝送に 7 ビットコードが 使用されていますので、ちょうど都合よく使用できます。
プリントしたときの文字幅が、英数字や半角カナ文字よりも広いので、 全角文字 と呼んでいます。

1.2.(2-C-b) 詳   細

◆ JIS 漢字コードには、漢字だけでなく、全角の英数文字、 全角のカナ/ひらかな、ギリシャ文字、ロシア文字、 各種記号も含まれています(表.7)。

[表.7] コードの割り付け

内容
1〜2区 各種記号
3区 算用数字、大小ローマ字
4区 ひらがな
5区 カタカナ
6区 大小ギリシア文字
7区 大小ロシア文字
8区 罫線素片
9〜15区 未定義
16〜47区 第一水準漢字
48〜84区 第二水準漢字
85〜94区 未定義


◆ カナまたはかな文字は、この全角文字を使用するのが良いでしょう。 漢字コード自体が文字化けするときは、どうしようもありませんが、 半角カナ文字のような文字化けを起こすことはありません。
罫線素片は、罫線や枠線を作るのに使用します。通常の文字と異なり、 文字間をつないで、連続した線を作ることができます。
◆ 漢字は、第一水準 と、第二水準 とに 分かれています。第一水準の方が、使用頻度が高い文字です。
漢字コードの例を表.8 に示します。

[表.8] 漢字コードの例

漢字コードの例


◆ JIS X0208 の漢字の文字数は少ないので、これを補うために、 さらに補助漢字 (JIS X0212)が制定されています。
◆ コンピュータでは、通常、日本語(漢字コード)は、JIS を使用しないで、 コードの位置を JIS からずらした、シフト JIS コード が使用されています。
通常文章は、半角の英数文字と、全角の日本語文字とを混用します。 シフト JIS は、半角の英数文字と、全角の日本語文字とが、 コード見ただけで容易に判定できるように、 コードの位置をずらしたものです。

1.2.(3) 画像の表現

1.2.(3-A) ビットマップ

◆ コンピュータでは、画像情報も、取り扱うことができます。文字は、文字コードで表現したときは、文字の種類は分かりますが、具体的な形、すなわち字体は、文字コードだけでは、分かりません。具体的な形を表現するのが、画像 情報です。勿論、画像は、文字だけでなく、各種の 2 次元情報を取り扱うことができます。
◆ 通常、コンピュータのディスプレイは、2 次元であり、3 次元を直接取り扱うことはできません。したがって、3 次元情報は、2 次元で、擬似的に表現します。
コンピュータで、2 次元情報を取り扱うときは、2 次元を、多数の方眼状の点で表わします。その最小単位を、ピクセル といいます。単色(通常は黒)の有無は、1ビット/ピクセルで表わすことができます図.7(a) は、7 × 7 ピクセルで、文字の A を描いたものです。

[図.7] 画像をピクセルで表わす

画像をピクセルで表わす

◆ 図は、1 ビット/ピクセルで、階調はありません。階調 (色の濃さ)を表わすときは、色の濃さに段階を付け、それを複数ビット/ピクセルで、表わします。たとえば、4 ビットで 16 階調、8 ビットで 256 階調を表わすことができます。
以上のように、画像を、多数のピクセルで表わし、各ピクセルを、1 または複数ビットで表現したものを、ビットマップ と言います。
◆ 色は、光の波長の違いによって生じます。しかし、任意の色は、3 原色 (3 つの基本色)の、混合の割合によって、作り出すことができます。また、3 色に、1、2 色を付け加えて、さらに精細な色を表現することができます。写真画質のプリンタでは、4 または 5 色使用しています。色を表現するときは、各原色毎に、ビットマップを作ります。

1.2.(3-B) F A X

◆ 画像伝送の、代表的なものが、FAX (ファクシミリ ) です。FAX は、ビットマップの伝送です。階調や、さらには、カラーを送れるものもありますが、基本は、1ビット/ピクセルです。FAX は、ビットマップの伝送です。2 次元のビットマップを、1 次元に変換して伝送します(図.7(b))。
この変換のことを、スキャン と呼んでいます。紙に書かれた情報を読み取って、コンピュータに入力する装置をスキャナといいますが、そのスキャンです。
◆ FAX では、文字や図形を送ることが多く、1 ビット/ピクセルの送信になります。この場合は、0 または 1 が連続することが多いので、そのまま、まともに送らないで、図.8 のように送り、効率を高めています。

[図.8] データを圧縮して送る

データを圧縮して送る

◆ 同じ値が多数連続するとき、図.8 の例では、最初に 0 が、11 ビット、次いで 1 が 3 ビット、そして 0 が 11 ビット続いています。これを、図の下のような情報に変換します。このように、情報を減らすこと無く、データ量を減らすことを、圧縮 と呼んでいます。
◆ 圧縮は、画像情報だけでなく、文字情報、その他各種のデータを送ったり、蓄えたりするのに、多く使用されている技術です。ここで、簡単に、圧縮について、説明しておきます。圧縮は、大きく 2 つに分けられます(図.9)。

[図.9] 圧縮の種類

圧縮の種類

◆ 圧縮したデータを使用するときは、復元します(図.10)。この復元のことを、解凍 といいます。

[図.10] 圧縮と解凍の手順

圧縮と解凍の手順

◆ 図は、アナログデータを、やり取りする場合です。アナログ/ディジタルの変換を含んでいます。
圧縮/解凍は、対象のデータの種類によって、適切なものが異なります(表.8)。種類は、プログラムの拡張子で、示してあります(プログラムの名称が、xxxx.yyy の形式となっているとき、後半の yyy の部分を、拡張子といいます)。

[表.8] 代表的な圧縮/解凍の種類

 種類   用   途 
.lzh 文字データ、プログラムなどの 2 進データ
.zip 文字データ、プログラムなどの 2 進データ
.gif 図形などの画像
.jpg 写真などの画像
.mpg 動画像




目次に戻る   前に戻る   次に進む