2012/4/16 猫マーク付き 情報処理概論 情報の表現 情報の表現方法 人間の世界:10進数 コンピュータの世界:2進数 すべてのデータ(プログラム、データ(数値・文 字・画像・音声など)を0と1で表現 (プログラム) 110100100111010111011100011・・・・・ (データ) 0010000100100010 00100011・・・・・ ・電気が流れている/流れていない (電圧が5V/0V) ・ 磁性がN極/S極 などを0と1に対応 1 2012/4/16 ビットと2進数,10進数 n‐1 ビット目 (MSB: Most Significant Bit ともいう) ○ 2 ビット目 ・・・・・ 2n‐1 0 ビット目 1 ビット目 (LSB: Least Significant Bit ともいう) ○ ○ ○ ○ 全体でnビット 22=4 21=2 20=1 【例】 01011100 26 + 24 + 23 +22 =64+16+8+4=92 良く使う2進数 2のべ き乗 10進数 2のべき 乗 10進数 20 21 22 23 24 1 2 4 8 16 28 29 210 211 212 256 512 1024 2048 4096 25 26 27 32 64 128 2 2012/4/16 10進数整数から 2進数整数への変換例 小数 • (0.1011)2=1×2-1+0×2-2+1×2-3+1×2-4 =0.5+0.125+0.0625 =(0.6875)10 3 2012/4/16 10進数小数から 2進数小数への変換例 数値の表現 • 固定小数点形式 • 浮動小数点形式 4 2012/4/16 固定小数点形式 • 整数の表現に使用 • 小数点の位置を固定して、2進数で表現 (例)データ長が4ビットの場合 (+6)10 → (0110)2 • 負の整数は、2の補数で表現 (-6)10 → (1010)2 あふれは無視 0110 +1010 10000 元の数 2の補数 足して0 2の補数表現 • 何故2の補数か? 2つの整数の加算を行う時、符号を 考慮せず、加算のみを行えばよい • 2の補数の求め方 (1) 各ビットを反転させる (2) 最下位ビットに1を加える • n ビットの固定小数点形式は -2n-1 ~ +2n-1-1 までの整数を表現可能 • 一般に、n=16, 32 0110 1001 + 1 1010 n=4 の例 10進数 +7 +6 +5 +4 +3 +2 +1 0 -1 -2 -3 -4 -5 -6 -7 -8 固定小数点形式 0111 0110 0101 0100 0011 0010 0001 0000 1111 1110 1101 1100 1011 1010 1001 1000 5 2012/4/16 浮動小数点形式 • 423.5の10のべき乗(指数)を使った表現 4235×10-1 423.5×10 0 42.35×10 1 4.235×10 2 0.4235×10 3 + 0.4235×10 符号 仮数 3 底 指数 実際の表現 • コンピュータでは, 仮数; 1/2以上,1より小さい数 底: 2 とする N = ±m × 2e (m; 仮数 e: 指数) 6 2012/4/16 文字の表現 • 英数文字 o 1文字を1バイトで表現 o 256(=28)種類の文字表現が可能 • 日本語文字 o 1文字を2バイトで表現 o 65536種類の文字表現が可能 英数文字コードの種類 • ASCIIコード(American Standard Code for Information Interchange) o 米国規格協会が制定 o パソコンの標準的コード o 7ビットを使用 • EBCDICコード(Extended Binary Coded Decimal Interchange Code) o IBM社が制定 o 汎用コンピュータの標準的コード o 8ビットを使用 7 2012/4/16 ASCIIコード(再掲) U L 0 1 2 3 4 5 0 NUL DEL SP 0 @ P 6 7 1 SOH DC1 ! 1 A Q a q 2 STX DC2 2 B R b r 3 ETX DC3 # 3 C S c s : : : : : : : : : 9 HT FM ) 9 I Y i y A LF SUB * : J Z j z B VT ESC + ; K [ k { C FF FS , < L ¥ l | D CR GS - = M ] m } E SO RS . > N ^ n F SI US / ? O _ o 8 p 日本語文字コードの種類(その1) • JIS漢字コード o JISで規格化 o 漢字(第一水準、第二水準)、かな、英数字、記号など 6,879文字を表現 o 1バイト文字と2バイト文字の切替えのための特殊な文字 列(エスケープシーケンス)を使用 • シフトJISコード o 1バイト文字との重なりが生じないよう、文字の割り当て 領域をシフト o パソコンで使用 8 2012/4/16 日本語文字コードの種類(その2) • EUCコード(Extended UNIX Code) o AT&T社が制定 o UNIX用のコード • Unicode o ISOで標準化 o 世界各国の文字を統一的に扱うことを目的に開発された文字コード 漢字コードの文字割り当て領域 9 2012/4/16 • 例えば,「あ」 JIS: (2422)16 ただし漢字コードの前後に特別な識別コードを付加する必要 がある SJIS: (82A0)16 EUC: (A4A2)16 標準化の組織 • ISO International Organization for Standardization(国際標準化 機構) 工業および科学技術に関する国際規格の制定を目 的とした国際機関 • ITU-T(旧CCITT) International Telecommunication Union-Telecommunication Standardization Sector(国際電気通信連合電気通信標準化 部門)国際連合の電気通信に関する専門機関 各国間の通信の互換性確保を目的に電気通 信の技術や運用法を標準化 • JIS Japanese Industrial Standards (日本工業規格) 日本における鉱工業製品の国家規格 10 2012/4/16 画像の表現方法 • ラスタ表現 画素(ピクセル) o 細かい正方形のます目が縦横に並んだものとし て画像を表現 o 1つのます目を、画素(ピクセル)あるいはドットと 呼ぶ o 写真の表現に向いている o ペイント系ソフトウェア(Photoshop、ペイントなど) • ベクタ表現 o 点・直線・円などの幾何学的な情報により図形を 表現 o 移動・回転・拡大・縮小などが容易だが、写真の 表現には向かない o ドロー系ソフトウェア(Illustrator、PowerPointなど) 画像の情報量 • 画素あたりの情報量 o 白黒画像 → 1ビット o フルカラー:赤(R),緑(G),青(B)の三原色それぞれを256種 類で表現(2563=約1670万色) → 24ビット • 画像の情報量 o 横1280×縦1024ピクセルのフルカラー表示 1280×1024×24bit=3.75MB データ圧縮技術が必要 11 2012/4/16 画像のファイル形式(その1) • BMP (Bitmap) o o o o マイクロソフト社が開発 Windowsの標準形式(ペイントソフトで使用) 標準は無圧縮のため、データ量が大 フルカラー(1670万色) • GIF (Graphics Interchange Format) o o o o 米国CompServe社が開発 インターネットで使用 256色まで 可逆圧縮方式 画像のファイル形式(その2) • JPEG (Joint Photographic Experts Group) o o o o ISOとITU-Tの共同作業部会で制定した静止画圧縮方式 インターネット、デジタルカメラなどで使用 不可逆圧縮方式 フルカラー(1670万色) • PNG (Portable Network Graphics) o GIFに代わるインターネット用の画像ファイル規格として 開発 o 可逆圧縮方式 o フルカラー(1670万色) 12 2012/4/16 動画の表現方法 • 静止画像(フレーム)を連続的に切り替えることにより、動 きを表現 • フレームレート:1秒間に表示するフレーム数(fps: frame per second) o 日米のテレビ: 30fps o 欧州系テレビ: 25fps o 映画 : 24fps • 動画のデータ量 フレームの画像サイズが720×480ピクセル、フルカラー表示、フ レームレート30fpsの動画1時間分のデータ量は、 720×480(dot/frame)×24(bit/dot)×30(frame/sec)×3600(sec)= 約104GB • コーデック:データを圧縮・伸張するソフトウェアや装置 動画のファイル形式 • AVI (Audio Video Interleave) o Windows用の動画ファイル形式 o デジカメ動画の主流 • MPEG (Moving Picture Experts Group) o ISOで制定した動画像用の国際標準の圧縮方式 o MPEG-1: CD-ROMへの保存用、1.5Mbps o MPEG-2: DVDやデジタル放送用、2Mbps~80Mbps o MPEG-4: モバイル端末やインターネット用、数kbps~ 数十kbps • WMV (Windows Media Video) o MPEG-4をもとに、マイクロソフト社が開発 o インターネット用 o ストリーミングのサポート 13 2012/4/16 音声データのデジタル化 標本化:一定時間間隔毎に信号レベ ルの値を記録 量子化:標本点のデータを整数に変換 符号化:この整数値を2進のデジタル 符号に変換 音声データのデータ量 • 標準的な音楽用CD o 標本化周波数:44.1kHz o 量子化ビット数:16ビット • 2チャンネルステレオで1時間録音したときのデータ量 44.1kHz×16bit×2ch×3600sec=約605.6MB 14 2012/4/16 音楽データのファイル形式(その1) • WAV (あるいはWAVE) o マイクロソフト社とIBM社が開発したWindows標準の音声 ファイル形式 o 通常は非圧縮 • MP3 (MPEG Audio Layer-3) o MPEG-1で使用される音声圧縮方式 • AAC (Advanced Audio Coding) o MPEG-2またはMPEG-4で使用される音声圧縮方式 o iTunes, iPod, 着うたなどで利用 音声データのファイル形式(その2) • Real Audio o 米国RealNetworks社が開発した音声ファイル形式 o ストリーミングに対応しており、インターネットで利用 • WMA (Windows Media Audio) o Windows標準の音声圧縮方式 o ストリーミングに対応 15 2012/4/16 (参考)BMPファイル ‘BM’ ファイルの 大きさ 幅 高さ データ 1画素(B, G, R) (注)数値はバイト逆順に並べられている(little endian) (参考)WAVファイル RIFF: Resource Interchange File Format 16 2012/4/16 演習問題(その2) • 問2.6 ASCIIコードで、(4A6170616E)16で表される文 字列を示しなさい。 • 問2.7 横1024ピクセル×縦768ピクセルのフルカラー 画像が無圧縮のビットマップファイル形式で保存さ れているとき、そのファイルサイズは何MBか。ただし、 1MB=220Bとして計算すること。 17
© Copyright 2024 Paperzz