第7 章 基礎理論 基数、集合、確率、統計の基本的な考え方や、情 報のディジタル化、アルゴリズムなどについて 解説します。 7-1 7-2 7-3 基礎理論 …………………… 215 アルゴリズムとプログラミング … 232 章末問題 …………………… 248 7-1 基礎理論 7-1-1 離散数学 コンピュータが扱う情報は、ディジタル量などを扱う 「離散数学」と密 接な関係にあります。離散数学は、コンピュータの論理回路、データ構 造、言語理論などの幅広い分野の基礎となるものです。 1 数と表現 コンピュータ内部では、命令やデータはすべて2進数で表現されてい ます。データ表現の基礎となる2進数やほかの進数について、基本的な 理論を理解しておくことはプログラミングなどをする際にとても重 要です。 (1)2進数・8進数・10進数・16進数 コンピュータ内部では、電流の有無や電圧の高低などによってデータ を認識し処理しています。電流の有無や電圧の高低などによって認識 されたデータは、 「0」 と 「1」 で組み合わされた数値で表現されます。こ の方法を 「2進数」 といいます。 「0」 と 「1」 の羅列のため、人間にとって使いづら しかし、この2進数は、 いものです。そこで、人間が普段使っている 「0」 ∼ 「9」 の10種類の数字 を使った 「10進数」 に置き換えて表現します。さらに、 「0」 ∼ 「7」 の数字 を使った 「8進数」 、 「0」∼ 「9」の数字と 「A」∼ 「F」のアルファベットを 使った 「16進数」 などで表現する場合があります。 2進数 10進数 8進数 16進数 10進数 8進数 16進数 0 0 0 0 2進数 1001 9 11 9 A 1 1 1 1 1010 10 12 10 2 2 2 1011 11 13 B 11 3 3 3 1100 12 14 C 100 4 4 4 1101 13 15 D 101 5 5 5 1110 14 16 E 110 6 6 6 1111 15 17 F 111 7 7 7 10000 16 20 10 1000 8 10 8 ※16進数では、10から15までをAからFで表現します。 215 (2)基数変換 「基数変換」 とは、ある進数から別の進数に置き換えることです。 基数変換の方法は、次のとおりです。 ●2進数から10進数への変換 ( 1 0 3 2 0 )2 0 =(10)10 ●10進数から2進数への変換 10進数を2で割っていくと、簡単に変換できます。 例 10を2進数に変換するとどうなるか。 (10) 2 5 …1 2 2 …0 1 0 3 )10 = 1000×1 +100×2 +10×0 +1×3 = 2 ×1 + 2 ×0 + 2 ×1 + 2 ×0 = 8 ×1 + 4 ×0 + 2 ×1 + 1 ×0 = 8 + 0 + 2 + 0 10 …0 2 = 103×1 +102×2 +101×0 +100×3 1 1 7 基礎理論 2を10進数に変換するとどうなるか。 (1010) 章 参考 10進数の数字 (1 例 2 基数 「基数」 とは、1桁で表現できる数のこと。 たとえば、2進数は 「0」 と 「1」の2種類な ので、基数は 「2」 となる。 第 10進数の各位の数字が、100、101、102…の何倍なのかを表しているの 0 1 2 と同じように、2進数の各位の数字は、2 、2 、2 …の何倍なのかを表し ています。この性質を利用して、2進数から10進数へ変換します。 参考 ← 余りを書く。 = 1000 +200 + 0 +3 = 1203 参考 2進数の書き方・読み方 「1010」 と書くと10進数の数字と区別 がつかないため、2進数を表すときは、 2」 「 (1010) のように、数字を括弧でくく 2は り横に2を付ける。また、 (1010) 「イ チ、ゼロ、イチ、ゼロ」 と1桁ずつ読む。 参考 n0 0 nがどのような値でも、n =1 (ゼロ乗は1) と定義されている。 ← 商が「1」になるまで、2で割る。 矢印の順に、最後の商と余りを前から並べて書く と2進数に変換できる。 (10)10 → (1010)2 216 ●2進数から8進数または16進数への変換 2進数から8進数または16進数への変換は、次のように行います。 ・2進数3桁は、8進数1桁に変換できる。 ・2進数4桁は、16進数1桁に変換できる。 例 2を8進数、16進数に変換するとどうなるか。 (11010) 2進数から8進数への変換 下位の桁から3桁ずつ区切る 11 2進数から16進数への変換 下位の桁から4桁ずつ区切る 010 3 区切った数字ごとに、 10進数へ変換する 2 (32)8 1 1010 1 10 (1A)16 ●8進数または16進数から2進数への変換 8進数または16進数から2進数への変換は、次のように行います。 ・8進数1桁は、2進数3桁に変換できる。 ・16進数1桁は、2進数4桁に変換できる。 例 8、 16をそれぞれ2進数にするとどうなるか。 (43) (F5) 8進数から2進数への変換 4 100 100 16進数から2進数への変換 3 F 1桁ずつ2進数に 11 変換する 011(3桁にする) 2 (100011) 1111 1111 5 101 0101(4桁にする) (11110101)2 基数変換のまとめ 10 進数の値を 2 で割り、商と余りを求める。商が 1 になるまで繰り返す。最後の商 1 と余りを下から列 挙することで、2 進数に変換できる。 10進数 (30) 10 2 進数の値を下位の桁から 3 桁ずつ区切り、各桁の値に 20、21、22をかけて、その結果を加えることで、8 進数に変 換できる。 同様に、4 桁ずつ区切り、20、21、22、23をかけて、 その結果を加えることで、 16 進数に変換できる。 2進数 (11110)2 8進数 16進数 (11 110)2 (1 1110)2 (3 6)8 2進数の値を下位の桁から順番に、 20、 21、 22・・・をかけ て、 その結果を加えることで、 10進数に変換できる。 (1 E) 16 8 進数、16 進数の値を 1 桁ずつ 2 で割り、商と余りを求 め、 商が 1 になるまで繰り返す。最後の商1と余りを下か ら列挙する。各桁で求められた 2 進数の値を上位の桁か ら順番に並べることで、 2 進数に変換できる。 ※2 進数に変換した各桁の値が、 3 桁、 4 桁にならない場合は、上位に 0を付加して、 8 進数の場合は 3 桁、 16 進数の場合は 4 桁にする。 217 (3)符号付き2進数 「符号付き2進数」 とは、2進数で負の数を扱うための表現方法のことで 「符号ビット」として扱うこと す。符号付き2進数では、最上位ビットを 「0」の によって、 「+」と 「−」の符号を区別します。最上位の1ビットが 場合は正の数を表し、 「1」 の場合は負の数を表します。 参考 MSB 「MSB」 とは、2進数の一番左側のビット のこと。 「Most Significant Bit」の略。 第 章 参考 7 符号ビット 0 ならば正の数、1 ならば負の数を表す 符号なし2進数 (通常の2進数) 8ビットでは、0から255の値を表現でき ます。しかし、符号付き2進数の場合は、最上位の1ビットを符号ビッ トとして使用するため、値を表現できる桁数は7桁です。そのため、符 号付き2進数8ビットでは、最大で−128から127の値を表現できます。 ビット 数 符号なし2進数 4 0∼15 −8∼7 8 0∼255 −128∼127 12 0∼4095 −2048∼2047 16 0∼65535 −32768∼ 32 0∼ −2147483648 4294967295 ∼2147483647 代表的な符号付き2進数の種類は、次のとおりです。 ●1の補数 符号付き2進数 基礎理論 表現できる値の範囲 ビット数に応じた表現できる値の範囲は、 次のとおりである。 32767 「1の補数」 とは、正の数のビットを反転させて、負の数を表現します。 参考 −3の場合 ①正の数3のビットを求める ②ビットを反転させる 00000011 11111100 ………1の補数 補数 「補数」 とは、ある数に足すと、桁がひと つ繰り上がる数のこと。 ●2の補数 「2の補数」 とは、1の補数に1を加えて、負の数を表現します。 −3の場合 ①1の補数を求める ②1の補数に1を加える 11111100 + 1 11111101 ………2の補数 218 (4)2進数の加算・減算 2進数を加算・減算するときは、10進数と同じように桁をそろえて、 下の桁から計算します。 ●加算 2+ 2= 2」 (1) (10) と計 加算をするときに重要なのは、桁を上げて、 「 (1) 算することです。 例 2+ 2を計算するとどうなるか。 (1001) (011) 1 1 桁上げ (1001)2 + (011)2 (1100)2 ●減算 2− 2= 2」 (1) (1) と計 減算をするときに重要なのは、桁を下げて、 「 (10) 算することです。 例 2− 2を計算するとどうなるか。 (1001) (011) 0 1 桁下げ (1001)2 − (011)2 (110)2 例 8ビットの数値で符号化された景品の一覧表がある。景品の種類は、 チケットA、Bのそれぞれに書かれている数値を加算した結果で決 まる。チケットA、Bの数値が表のとおりの場合、ア∼オのそれぞれ の景品は何になるか。 〔チケット一覧表〕 219 〔景品一覧表〕 商品A 商品B 景品 番号 ア 01001000 01111001 ポケットティッシュ 00000001∼01100100 イ 01000101 01100010 芳香剤 01100101∼10010110 ウ 00111111 10001000 洗剤セット 10010111∼10110100 エ 00101100 00111000 コーヒーギフト 10110101∼11000010 オ 00011111 00111001 旅行券 11000011∼11001000 ア…01001000+01111001=11000001 したがって、景品はコーヒーギフトになる。 イ…01000101+01100010=10100111 したがって、景品は洗剤セットになる。 ウ…00111111+10001000=11000111 第 したがって、景品は旅行券になる。 章 エ…00101100+00111000=01100100 7 したがって、景品はポケットティッシュになる。 基礎理論 オ…00011111+00111001=01011000 したがって、景品はポケットティッシュになる。 2 集合 「集合」 とは、ある明確な条件にもとづきグループ化されたデータの集 まりのことです。 集合は、 「AまたはB」 などの文章で表現することができ、この表現の方 法を 「命題」 といいます。 命題によって表現した集合は、 「ベン図」 によって図式化することがで きます。 代表的な命題とベン図の関係は、次のとおりです。 命題 AまたはB (A+B) A ベン図 B AかつB (A・B) A Aではない (A) A B 参考 このベン図を解釈するには、 「真理値」を求めます。 「真理値」とは、1 ならば 「真」 を、0ならば 「偽」 を意味します。 たとえば、Aに含まれ、Bに含まれないならば、それぞれの真理値は A=1、B=0となります。 参考 これを、命題 「AまたはB」 にあてはめた場合、 「1または0」 となり、命題の 論理が成立します。しかし、命題 「AかつB」 にあてはめた場合は、 「1か つ0」 となり、命題の論理は成立しません。 この真理値をまとめたものを、 「真理値表」 といいます。 論理和 (OR) 真 理 値 表 論理演算 「論理演算」 とは、複数の条件 (論理) の 組み合わせを、式で表したときの演算方 法のこと。 論理積 (AND) 否定 (NOT) A B AORB A B AANDB A NOT A 0 0 0 0 0 0 0 1 1 0 1 1 0 1 0 0 1 1 0 1 1 1 1 1 0 1 0 1 排他的論理和(XOR) 「排他的論理和」 とは、論理積と論理和 と否定を組み合わせた論理演算のこと。 排他的論理和では、2つの真理値が同 じなら0、異なるなら1という論理が成立す る。 A B A XOR B 0 0 0 0 1 1 1 0 1 1 1 0 220 7-1-2 応用数学 収集したデータを分析することにより業務上の問題点を発見し、業務 改善の手がかりとします。データを分析するには、 「応用数学」 を使い ます。応用数学とは、数学的な知識をほかの分野に適用することを目 的とした数学のことで、 「確率」 や 「統計」 などがあります。 1 確率 「確率」 とは、 収集したデータの総数や度合いを判断する手法のことです。 (1)順列 「順列」 とは、あるデータの集まりの中から任意の個数を取り出して並 べたときの並べ方の総数のことです。 異なるn個から任意にr個を取り出して、1列に並べた順列の数をn P rと 表した場合、次の式で求めることができます。 順列を求める計算式 Pr = n× (n−1) × (n−2) ×・・・× (n−r+1) n 例 1、2、3、4、5、6の数字から4個の異なる数字を取り出し、4桁の数を 作る場合 6P4=6× (6−1) × (6−2) × (6−3) =6×5×4×3=360通り 参考 ! 「!」 は階乗を表す記号。 たとえば「3!=3×2×1」 となる。 (2)組み合わせ 「組み合わせ」とは、あるデータの集まりの中から、任意の個数を取り 出すときの取り出し方の総数のことです。 異なるn個から任意のr個を取り出す組み合わせの数をn C rと表した場 合、次の式で求めることができます。 組み合わせを求める計算式 n! nPr Cr = = (n−r) ! r! r! n 例 1、2、3、4、5、6の数字から4個の異なる数字を取り出す場合 6P4 = 4! 221 6×5×4×3 = 15通り 4×3×2×1 例 ある会合の参加者8人が1対1で連絡を取り合うために必要な経路 の数 次の2通りの方法で組み合わせの数を算出できる。 第 章 8P2 8×7 nPr = = = 28通り r! 2! 2×1 7 8×7×6×5×4×3×2×1 = = 28通り (n−r) !r! 6×5×4×3×2×1×2×1 n! 基礎理論 または 樹形図を使って求める場合は、次のようになる。 なお、参加者8人はA∼Hで表すものとする。 A B C D E F G H B C D E F G H C D E F G H 5通り G H D E F G H 4通り 6通り 7通り E F G H 3通り F G H 2通り 1通り したがって、7+6+5+4+3+2+1=28通り (3)確率 「確率」 とは、全事象の場合の数に対する、ある事象の起こりうる数の 割合のことです。 全体の事象の数がn通りで、事象Aがそのうちのr通り起こる確率をP (A) と表した場合、次の式で求めることができます。 確率を求める計算式 P(A) = r n 222 例 10本のくじの中に当たりが3本あるとき、2本のくじを引いて2本と も当たりくじである確率 〔すべての事象の組み合わせ〕 10本のくじから2本のくじを引く組み合わせを求める。 10×9 10C2 = = 45通り 2×1 〔2本とも当たりの場合の組み合わせ〕 3本の当たりくじから2本の当たりくじを引く組み合わせを求める。 3×2 3C2 = = 3通り 2×1 したがって、求める確率は次のようになる。 3 1 = 45 15 例 10本のくじの中に当たりが3本あるとき、2本のくじを引いて2本と も当たりくじである確率 (その他の方法) 1回だけくじを引いて、当たりくじである確率は、 当たりくじの数 くじの総数 であるから、2回くじを引くと考えて解く。 3 10 2 2回目当たりくじを引く確率 … 9 1回目当たりくじを引く確率 … したがって、求める確率は次のようになる。 3 × 10 223 2 = 1 9 15 統計 2 「統計」 とは、収集したデータの規則性を調べたり、先のことを予想し たりするための手法のことです。 (1)データの代表値 第 「データの代表値」とは、データ全体の特性をひとつの数値で表現する 値 章 ものです。データの代表値として、次のような値が使われます。 7 説 明 全体の合計をデータ数で割った値のこと。一般的に"平均値"と呼 基礎理論 平均値 んでいるものは、"算術平均"のことである。 メジアン (中央値) データを昇順、 または降順に並べた場合に中央に位置する値のこ と。データの個数が偶数の場合には中央に位置する2つの値の 平均を採用する。 モード (最頻値) データの出現度数の最も高い値のこと。 (2)データの散布度 参考 「データの散布度」とは、個々のデータが平均値のまわりでどのように ばらついているかの度合いを数値で表現するものです。 同じ平均値を持つデータの集まりでも、次のように特徴が異なる場合 があります。 データ Aグループ 20、21、 22、19、18 平均値 20+21+22+19+18 5 Bグループ 10、30、 5、25、30 10+30+5+25+30 5 ワークサンプリング法 「ワークサンプリング法」 とは、観測回数 を決めて、ランダムな瞬間に、ある作業 者の作業状況を観測し、設備や作業時 間などを分析する手法である。「瞬間観 測法」 とも呼ばれる。 =20 =20 この違いを表現する数値が、 散布度の指標となる 「分散」 、 「標準偏差」 、 「レンジ」 などです。 値 分散 説 明 (個々のデータの値−平均) を2乗した値の合計をデータ数で割った値のこと。 標準偏差 分散の平方根をとった値のこと。 レンジ(範囲) データの最大値と最小値との差のこと。 224 AグループとBグループの平均値は同じですが、散布度を計算すると 次のようになります。 Aグループ 平均値 分散 Bグループ 20 2 20 2 2 2 2 2 2 2 (20−20) { + (21−20)+ (22−20) (10−20) { + (30−20)+ (5−20)+ 2 2 + (19−20)+ (18−20)}÷5 (25−20)+ (30−20)}÷5 = (0+1+4+1+4) ÷5 = (100+100+225+25+100) ÷5 =10÷5 =550÷5 =2 =110 標準偏差 2≒1.414 レンジ (範囲) 110≒10.488 22−18=4 30−5=25 平均値だけではデータがどのようになっているかを正確に分析でき ませんが、散布度をみると、全体の分布状態を正確に把握できます。 (3)正規分布 事象が起こる確率が変数によって決まる場合、変数と各事象が起こる 確率との関係を 「確率分布」といい、この変数を 「確率変数」といいま す。確率分布の代表的なものに、 「正規分布」 があります。 参考 度数分布表 「度数分布表」 とは、データの分析状態 を表形式でまとめたもの。 参考 ヒストグラム データの分布状態を表すには、バラツキ を棒グラフで表示するヒストグラムを使う こともできる。 ヒストグラムでは、データの全体像、中心 の位置、バラツキの大きさなどを確認でき る。 「正規分布」 とは、データの分布状態をグラフで表したときに、グラフ の形が 「正規曲線」 と呼ばれる曲線になるような分布のことです。正規 曲線は、平均値を中心とした左右対称のつりがね型の曲線です。 正規分布の特徴として、平均値±標準偏差の範囲に約68%、平均値± (標準偏差×3)の範囲に約 (標準偏差×2)の範囲に約95%、平均値± 99%のデータが含まれます。 正規分布に従うデータとしてよく知られているものに、 多人数の身長、 同じ工程で作られる多数の製品の重さ、測定の誤差などがあります。 このような性質から、工業製品の不良品の数といった、平均値から大 きくずれているデータの数を予測する場合などに利用します。 デ ー タ の 個 数 約68% 標準偏差 平均値 225 データの値 参考 例 サイコロを振って、出た目の数だけスゴロクの駒を進める。サイコ ロを1回投げたときの進める駒数の期待値はいくらか。ただし、出 た目が1と2のときは駒を進めないものとする。 のとする。 また、ここでの確率変数は進める駒数となるため、3∼6の目が出現す る期待値を求める計算式は、次のとおりである。 1 3 6 1 4 6 1 5 6 1 6 6 ×3= 3の目… 6 4の目… ×4= 6 5の目… ×5= 6 6の目… ×6= 6 参考 一様乱数 「一様乱数」 とは、ある範囲の数値からラ ンダムに数値を選んだ場合に、すべての 数値が等しい確率で出現すること。 7 基礎理論 1 となる。 れぞれの目が出る確率は 6 章 ここでは、サイコロを振って目が出る確率は一様乱数であるため、そ 第 また、サイコロは1∼6までの数値を一様乱数として出現させるも 期待値 「期待値」 とは、ある物事に対して試行を 行った結果、得られる数値の平均値のこ と。たとえば、サイコロを何回か振ったとき に平均してどのくらいの目が出るかという もの。 期待値は、ある事象が起こる確率と確 率変数をかけ合わせた値の合計で求め られる。 したがって、サイコロを1回投げたときの進める駒数の期待値は、次の とおりである。 3 + 6 4 + 5 + 6 6 6 6 =3 226 7-1-3 情報に関する理論 コンピュータで扱う数値やデータに関する基礎的な理論を知るため には、情報量の表現方法、ディジタル化の考え方、文字の表現など を理解する必要があります。 情報量の単位 1 コンピュータの記憶容量や性能を表す情報量の単位には、 「ビット」と 「バイト」 があります。情報量の単位を知っておくことは、パソコンの性 能やメモリ、ハードディスクの空き容量などを知る際にも役立ちま す。 参考 ビットで表現できるデータの種類 1 1ビット 2 =2種類 2 2ビット 2 =4種類 3 3ビット 2 =8種類 4 4ビット 2 =16種類 5 5ビット 2 =32種類 6 6ビット 2 =64種類 7 7ビット 2 =128種類 8 8ビット 2 =256種類 (1)ビットとバイト 「ビット」 とは、 コンピュータが扱うデータの最小単位のことです。 「1ビッ ト (1bitまたは1b) 」 は、2進数と同様に0と1で表されます。また、8ビット を 「1バイト (1Byteまたは1B) 」 で表します。 00000000 00000001 00000010 8 2 =256種類のデータを表現できる 11111110 11111111 1ビット 8ビット=1バイト 参考 接頭語 「接頭語」 とは、ビットやバイトの大きさを 表すときに使われるK (キロ) 、M (メガ) 、G (ギガ) などのこと。接頭語は、それだけで は独立して使われず、ほかの単位と一緒 に使われ、その単位の10の整数乗倍を 表すときに使用する。 (2)情報量を表す単位 バイトより大きな情報を表す単位は、次のとおりです。 単 位 読み方 意 味 3 10 KB キロバイト 10 =1000バイト (1KB=2 =1024バイト) MB メガバイト (2 =1024Kバイト) 10 =1000kバイト GB ギガバイト (2 =1024Mバイト) 10 =1000Mバイト TB テラバイト (2 =1024Gバイト) 10 =1000Gバイト PB ペタバイト (2 =1024Tバイト) 10 =1000Tバイト 6 10 9 20 30 12 40 15 50 ※記憶容量を表すときは、2 倍で単位を変換するのが一般的です。通常、1000倍 10 を表す場合は 「k」 と小文字で書きますが、2 を表す場合は、「K」 と大文字で書い て区別します。 227 (3)時間を表す単位 コンピュータの処理速度を表すときに使われる、1秒未満の時間を表 す単位は、次のとおりです。 単 位 読み方 ms ミリ秒 1ms=10 s = 10 s −3 1 マイクロ秒 −6 1 1μs=10 s = 10 s ナノ秒 −9 1 1ns=10 s = 10 s ピコ秒 −12 ps 7 9 1ps=10 1 s = 10 s 12 基礎理論 2 6 章 ns 3 第 μs 意 味 ディジタル化 文書、帳票、写真、絵画などの 「アナログデータ」をコンピュータで取り 扱えるようにするには、データをディジタル信号 (0と1からなるコー ド)に変換して 「ディジタル化」する必要があります。ディジタル化する ことで、画像加工、コピー、通信などを高速にし、データの利用範囲を 広げることができます。 さらに、ディジタルデータを活用することでオリジナルであるアナログ データの劣化を防止したり、データ活用の効率化を実現したりできます。 ●A/D変換 「A/D変換」とは、アナログ信号からディジタル信号へ変換すること です。逆に、ディジタル信号をアナログ信号に戻すことを 「D/A変換」 といいます。 音楽などのアナログデータを一定時間ごとに区切って取 り出す。 標本化 (サンプリング) 16 14 12 10 8 6 4 2 0 量子化 エンコード 「エンコード」 とは、データを一定の規則に もとづいて変換すること。エンコードを行う ソフトウェアのことを 「エンコーダ」 という。 参考 1 2 サンプリングで取り出したものを数値(ビット) で表す。 16 14 12 10 8 6 4 2 0 参考 デコード 「デコード」 とは、 エンコードされたデータか ら、一定の規則にもとづいて変換し、元 のデータを取り出すこと。デコードを行う ソフトウェアのことを 「デコーダ」 という。 15 12 7 参考 11 8 8 5 8 5 3 1 2 サンプリングレート 「サンプリングレート」 とは、1秒間にアナ ログデータを測定する回数のこと。「サン プリング周波数」 とも呼ばれ、「Hz」 で表 す。サンプリングレートが大きいほど、ディ ジタルデータで再現できる音質がよい。 228 参考 サンプリングと量子化 アナログ信号は連続するデータでディジ タル信号は個々の途切れたデータであ る。A/D変換時に、サンプリングの周期 を短くし量子化の段階を増やすことで、 よ り細かく数値を採ることができアナログ データに近づけることができる。 一定の規則に従ってデータ化する。たとえば、データを 10進数から2進数に基数変換して表現する。 符号化 ・サンプリング周期が長く、量子化の段 階が少ない 7 0 1 1 1 12 1 1 0 0 15 1 1 1 1 8 1 0 0 0 5 0 1 0 1 8 1 0 0 0 11 1 0 1 1 5 0 1 0 1 8 1 0 0 0 3 0 0 1 1 符号化されたデータをディジタルデータに変換する。 ・サンプリング周期が短く、量子化の段 階が多い 1 符号の ディジタル表示 0 7 12 15 8 5 8 11 5 ●ディジタルデータの主な特徴 項 目 229 内 容 データの送信 遠隔地まで送信可能 データの共有 ネットワーク上でのデータ共有が可能 データの画像処理 拡大・縮小、 トリミングなどの加工・編集が可能 データの画質 劣化しない データの圧縮 可能 データの検索 可能 データのコピー 可能 8 3 文字の表現 3 コンピュータ内部では、文字を2進数の数値として扱います。すべての 「文字コード」 といいます。 文字に割り当てられた2進数コードを 種 類 説 明 ASCII 参考 ANSI (米国規格協会) が規格した文字コード。7ビットコード体系で 表す。 JIS JIS (日本工業規格) が規格した文字コード。英数字・記号などを表 章 パリティビット 「パリティビット」 とは、文字コードなどの誤 りを検査するためのビットのこと。 第 英数字・記号などを表し、 パリティビットを1ビット付加して1バイトで 7 す1バイトコード体系と漢字やひらがなを表す2バイトコード体系があ 基礎理論 る。 シフトJIS マイクロソフト社などが規格した文字コード。 「拡張JISコード」 とも呼 ばれ、 JISの2バイトコードとASCIIの1バイトコードを混在させた2バイ トコード体系。Windows、 Mac OSなど多くのコンピュータで利用さ れている。 EUC 参考 AT&T社が規格した文字コード。 「拡張UNIXコード」 とも呼ばれ、 UNIXで漢字などを扱えるようにした2バイトコード体系。 EBCDIC EUC 「Extended Unix Code」の略。 米国IBM社が規格した8ビットの文字コード。主に、汎用大型コン (エビシディック) Unicode ピュータで採用されている。 ISO (国際標準化機構) とIEC (国際電気標準会議) が規格した文 字コード。全世界の文字に対応付けた2バイトコード体系。 ● JIS コード表 上位 4 ビット 下位 4 ビット b8b7 00 00 01 10 11 3 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 01 00 4 @ A B C D E F G H I J K L M N O 01 01 5 P Q R S T U V W X Y Z [ ¥ ] ^ _ 01 10 6 a b c d e f g h i j k l m n o 01 11 7 p q r s t u v w x y z { l }  ̄ DEL 10 00 10 01 8 9 10 10 A 未定義 。 「 」 、 ・ ヲ ァ ィ ゥ ェ ォ ャ ュ ョ ッ 10 11 B − ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソ 11 00 C タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マ 11 01 D ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ン ゙ ゚ 11 10 11 11 E F 未 定 義 2 SP ! " # $ % & ' ( ) * + , . / 00 未 定 義 1 TC7(DLE) DC1 DC2 DC3 DC4 TC8(NAK) TC9(SYN) TC10(ETB) CAN EM SUB ESC IS4(FS) IS3(GS) IS2(RS) IS1(US) 00 未 定 義 0 NUL TC1(SOH) TC2(STX) TC3(ETX) TC4(EOT) TC5(ENQ) TC6(ACK) BEL FE0(BS) FE1(HT) FE2(LF) FE3(VT) FE4(FF) FE5(CR) SO SI 00 未 定 義 b6b5 b4∼b1 0000 0 0001 1 0010 2 0011 3 0100 4 0101 5 0110 6 0111 7 1000 8 1001 9 1010 A 1011 B 1100 C 1101 D 1110 E 1111 F ※ (0010 0000) のSPは、スペース (空白) 記号を表します。 230 例 日本語で10文字分を表すために必要なビット数はいくらか。 日本語は全角文字であるため、1文字につき2バイト必要である。 日本語10文字を表すために必要なバイト数は、次のとおりである。 2バイト×10文字=20バイト 1バイト=8ビットであることから、20バイト=160ビット となる。 例 既存のデータベースに各社員の所属を表すコードのフィールドを 用意することになった。所属コードは数値のみ8桁まで使用する。 データベースに登録されている従業員数は25,000名である。この とき、所属コードを保存する領域として最小で何キロバイト必要と なるか。データの圧縮等は行わない。 所属コードが数値のみの扱いであるため、1桁1バイトと考えることが できる。所属コードが8桁なので、用意するフィールドは、8バイトで ある。登録されている従業員数が25,000名ということから、所属コー ドの保存領域として確保する必要があるのは次のとおりである。 8バイト×25,000名=200,000バイト 1キロバイト=1,000バイトであることから 200,000÷1,000=200キロバイト となる。 231
© Copyright 2024 Paperzz