情報処理概論

2012/4/16
猫マーク付き
情報処理概論
情報の表現
情報の表現方法
„
人間の世界:10進数
„
コンピュータの世界:2進数
すべてのデータ(プログラム、データ(数値・文
字・画像・音声など)を0と1で表現
(プログラム) 110100100111010111011100011・・・・・
(データ)
0010000100100010 00100011・・・・・
・電気が流れている/流れていない (電圧が5V/0V)
・ 磁性がN極/S極
などを0と1に対応
1
2012/4/16
ビットと2進数,10進数
n‐1 ビット目
(MSB: Most Significant Bit
ともいう)
○
2 ビット目
・・・・・
2n‐1
0 ビット目
1 ビット目 (LSB: Least Significant Bit
ともいう)
○ ○ ○ ○
全体でnビット
22=4 21=2 20=1
【例】
01011100
26 + 24 + 23 +22
=64+16+8+4=92
良く使う2進数
2のべ
き乗
10進数
2のべき
乗
10進数
20
21
22
23
24
1
2
4
8
16
28
29
210
211
212
256
512
1024
2048
4096
25
26
27
32
64
128
2
2012/4/16
10進数整数から
2進数整数への変換例
小数
• (0.1011)2=1×2-1+0×2-2+1×2-3+1×2-4
=0.5+0.125+0.0625
=(0.6875)10
3
2012/4/16
10進数小数から
2進数小数への変換例
数値の表現
• 固定小数点形式
• 浮動小数点形式
4
2012/4/16
固定小数点形式
• 整数の表現に使用
• 小数点の位置を固定して、2進数で表現
(例)データ長が4ビットの場合
(+6)10 → (0110)2
• 負の整数は、2の補数で表現
(-6)10
→
(1010)2
あふれは無視
0110
+1010
10000
元の数
2の補数
足して0
2の補数表現
• 何故2の補数か?
2つの整数の加算を行う時、符号を
考慮せず、加算のみを行えばよい
• 2の補数の求め方
(1) 各ビットを反転させる
(2) 最下位ビットに1を加える
• n ビットの固定小数点形式は
-2n-1 ~ +2n-1-1
までの整数を表現可能
• 一般に、n=16, 32
0110
1001
+
1
1010
n=4 の例
10進数
+7
+6
+5
+4
+3
+2
+1
0
-1
-2
-3
-4
-5
-6
-7
-8
固定小数点形式
0111
0110
0101
0100
0011
0010
0001
0000
1111
1110
1101
1100
1011
1010
1001
1000
5
2012/4/16
浮動小数点形式
• 423.5の10のべき乗(指数)を使った表現
4235×10-1
423.5×10 0
42.35×10 1
4.235×10 2
0.4235×10 3
+ 0.4235×10
符号
仮数
3
底 指数
実際の表現
• コンピュータでは,
仮数; 1/2以上,1より小さい数
底: 2
とする
N = ±m × 2e (m; 仮数 e: 指数)
6
2012/4/16
文字の表現
• 英数文字
o 1文字を1バイトで表現
o 256(=28)種類の文字表現が可能
• 日本語文字
o 1文字を2バイトで表現
o 65536種類の文字表現が可能
英数文字コードの種類
• ASCIIコード(American Standard Code for
Information Interchange)
o 米国規格協会が制定
o パソコンの標準的コード
o 7ビットを使用
• EBCDICコード(Extended Binary Coded Decimal
Interchange Code)
o IBM社が制定
o 汎用コンピュータの標準的コード
o 8ビットを使用
7
2012/4/16
ASCIIコード(再掲)
U
L
0
1
2
3
4
5
0
NUL
DEL
SP
0
@
P
6
7
1
SOH
DC1
!
1
A
Q
a
q
2
STX
DC2
2
B
R
b
r
3
ETX
DC3
#
3
C
S
c
s
:
:
:
:
:
:
:
:
:
9
HT
FM
)
9
I
Y
i
y
A
LF
SUB
*
:
J
Z
j
z
B
VT
ESC
+
;
K
[
k
{
C
FF
FS
,
<
L
¥
l
|
D
CR
GS
-
=
M
]
m
}
E
SO
RS
.
>
N
^
n
F
SI
US
/
?
O
_
o
8
p
日本語文字コードの種類(その1)
• JIS漢字コード
o JISで規格化
o 漢字(第一水準、第二水準)、かな、英数字、記号など
6,879文字を表現
o 1バイト文字と2バイト文字の切替えのための特殊な文字
列(エスケープシーケンス)を使用
• シフトJISコード
o 1バイト文字との重なりが生じないよう、文字の割り当て
領域をシフト
o パソコンで使用
8
2012/4/16
日本語文字コードの種類(その2)
• EUCコード(Extended UNIX Code)
o AT&T社が制定
o UNIX用のコード
• Unicode
o ISOで標準化
o 世界各国の文字を統一的に扱うことを目的に開発された文字コード
漢字コードの文字割り当て領域
9
2012/4/16
• 例えば,「あ」
JIS: (2422)16
ただし漢字コードの前後に特別な識別コードを付加する必要
がある
SJIS: (82A0)16
EUC: (A4A2)16
標準化の組織
• ISO
International Organization for Standardization(国際標準化
機構) 工業および科学技術に関する国際規格の制定を目
的とした国際機関
• ITU-T(旧CCITT)
International Telecommunication Union-Telecommunication
Standardization Sector(国際電気通信連合電気通信標準化
部門)国際連合の電気通信に関する専門機関
各国間の通信の互換性確保を目的に電気通
信の技術や運用法を標準化
• JIS
Japanese Industrial Standards (日本工業規格)
日本における鉱工業製品の国家規格
10
2012/4/16
画像の表現方法
• ラスタ表現
画素(ピクセル)
o 細かい正方形のます目が縦横に並んだものとし
て画像を表現
o 1つのます目を、画素(ピクセル)あるいはドットと
呼ぶ
o 写真の表現に向いている
o ペイント系ソフトウェア(Photoshop、ペイントなど)
• ベクタ表現
o 点・直線・円などの幾何学的な情報により図形を
表現
o 移動・回転・拡大・縮小などが容易だが、写真の
表現には向かない
o ドロー系ソフトウェア(Illustrator、PowerPointなど)
画像の情報量
• 画素あたりの情報量
o 白黒画像 → 1ビット
o フルカラー:赤(R),緑(G),青(B)の三原色それぞれを256種
類で表現(2563=約1670万色)
→ 24ビット
• 画像の情報量
o 横1280×縦1024ピクセルのフルカラー表示
1280×1024×24bit=3.75MB
データ圧縮技術が必要
11
2012/4/16
画像のファイル形式(その1)
• BMP (Bitmap)
o
o
o
o
マイクロソフト社が開発
Windowsの標準形式(ペイントソフトで使用)
標準は無圧縮のため、データ量が大
フルカラー(1670万色)
• GIF (Graphics Interchange Format)
o
o
o
o
米国CompServe社が開発
インターネットで使用
256色まで
可逆圧縮方式
画像のファイル形式(その2)
• JPEG (Joint Photographic Experts Group)
o
o
o
o
ISOとITU-Tの共同作業部会で制定した静止画圧縮方式
インターネット、デジタルカメラなどで使用
不可逆圧縮方式
フルカラー(1670万色)
• PNG (Portable Network Graphics)
o GIFに代わるインターネット用の画像ファイル規格として
開発
o 可逆圧縮方式
o フルカラー(1670万色)
12
2012/4/16
動画の表現方法
• 静止画像(フレーム)を連続的に切り替えることにより、動
きを表現
• フレームレート:1秒間に表示するフレーム数(fps: frame
per second)
o 日米のテレビ: 30fps
o 欧州系テレビ: 25fps
o 映画
: 24fps
• 動画のデータ量
フレームの画像サイズが720×480ピクセル、フルカラー表示、フ
レームレート30fpsの動画1時間分のデータ量は、
720×480(dot/frame)×24(bit/dot)×30(frame/sec)×3600(sec)=
約104GB
• コーデック:データを圧縮・伸張するソフトウェアや装置
動画のファイル形式
• AVI (Audio Video Interleave)
o Windows用の動画ファイル形式
o デジカメ動画の主流
• MPEG (Moving Picture Experts Group)
o ISOで制定した動画像用の国際標準の圧縮方式
o MPEG-1: CD-ROMへの保存用、1.5Mbps
o MPEG-2: DVDやデジタル放送用、2Mbps~80Mbps
o MPEG-4: モバイル端末やインターネット用、数kbps~
数十kbps
• WMV (Windows Media Video)
o MPEG-4をもとに、マイクロソフト社が開発
o インターネット用
o ストリーミングのサポート
13
2012/4/16
音声データのデジタル化
標本化:一定時間間隔毎に信号レベ
ルの値を記録
量子化:標本点のデータを整数に変換
符号化:この整数値を2進のデジタル
符号に変換
音声データのデータ量
• 標準的な音楽用CD
o 標本化周波数:44.1kHz
o 量子化ビット数:16ビット
• 2チャンネルステレオで1時間録音したときのデータ量
44.1kHz×16bit×2ch×3600sec=約605.6MB
14
2012/4/16
音楽データのファイル形式(その1)
• WAV (あるいはWAVE)
o マイクロソフト社とIBM社が開発したWindows標準の音声
ファイル形式
o 通常は非圧縮
• MP3 (MPEG Audio Layer-3)
o MPEG-1で使用される音声圧縮方式
• AAC (Advanced Audio Coding)
o MPEG-2またはMPEG-4で使用される音声圧縮方式
o iTunes, iPod, 着うたなどで利用
音声データのファイル形式(その2)
• Real Audio
o 米国RealNetworks社が開発した音声ファイル形式
o ストリーミングに対応しており、インターネットで利用
• WMA (Windows Media Audio)
o Windows標準の音声圧縮方式
o ストリーミングに対応
15
2012/4/16
(参考)BMPファイル
‘BM’
ファイルの
大きさ
幅
高さ
データ
1画素(B, G, R)
(注)数値はバイト逆順に並べられている(little endian)
(参考)WAVファイル
RIFF: Resource Interchange File Format
16
2012/4/16
演習問題(その2)
• 問2.6 ASCIIコードで、(4A6170616E)16で表される文
字列を示しなさい。
• 問2.7 横1024ピクセル×縦768ピクセルのフルカラー
画像が無圧縮のビットマップファイル形式で保存さ
れているとき、そのファイルサイズは何MBか。ただし、
1MB=220Bとして計算すること。
17