2進数による表現

はじめに
情報科学 第04回 前半
2進数と様々なデータ


計算機はすべでのデータを2進数で表現しています。
画像や音声、文字などは、どのように2進数で表現され
るデータとして持っているのでしょうか?
画像
文字
音
文字
音データ(1):音とは
アナログとデジタル


自然界
連続量のものが多い。その変化等もなめらか。
計算機が扱えるもの
離散値。その変化等も0,1単位で表現される。


音は空気などを伝わる波。
ざっくりと言えば、波の振幅が音の強さに、形が音色に、
周波数が音の高さに関係する。
振幅
時間
波をデジタルデータとして扱うには
どうしたらよいでしょうか?
この間の差は、どうやって埋めるのでしょうか?
音データ(2):標本化

音データ(3):量子化
一定時間毎に、その波の強さを測定します。

振幅
波の振幅も、離散値で近似します。
振幅
時間
これで、時間方向は離散化されました。
時間
これで、波の振幅も離散化されました。
音データ(4):デジタルデータ

量子化してサンプリングすると、以下のようになります。
画像データ(1):画素

今のパソコンのディスプレイは、(多くの場合、)細かい
点の集合。ビットマップ画像。

個々の点が何色かを指定する。
振幅
時間
量子化が細かく、
標本化する回数が多いと、
よりよいデータ化が行える。
例:
16bit
441000Hz
画像データ(2):光の3原色



原色:
混ぜ合わせると "すべての色" を表現できる色
人間の目だと、3色であることが多い
色材の三原色:
シアン、マゼンダ、イエロー(CMY)
絵の具とか。
光の三原色:
赤、青、黄色(RGB)
PCとか
画像データ(3):色の表現

文字と文字コード


RGB:赤緑青の混合による色の表現方法。
24bitカラー
RGBそれぞれに8bit。
人の目には十分。
32bitカラー
人の目には24bitと
大差ない。
32が2の累乗で
あるため扱いやすい。
おわりに
各文字は文字コードというコードにより、計算機内部で
は扱われている。
さまざまなコードの割り当て方が存在している
SHIFT_JIS
:94 4c
ISO-2022-JP(JIS) :47 2d
EUC-JP
:c7 ad
UTF-8
:e7 8c ab
”猫”という文字は、
このように表現。


さまざまなものが計算機内部でどのように扱われてい
るか、その基礎的な部分を扱いました。
実際には、多くの方式・技術があります。
動画を扱う
データを圧縮する。可逆圧縮、不可逆圧縮。