情報科学

情報科学
情報
科学
学
ー文字・文字列ー
文字 文字列
小棹
理子
2-1 コンピュータで扱う文字
z キャラクタ(character)という。
キャラクタ(character)という
z 文字には、番号(文字コード)が付与さ
れている。
•例
例:文字コード(ASCII)で
文字コ ド(ASCII)で
0101 1111(2) は W を表す。
z 文字コード(character
文字コ ド( h
code)は2進数
d )は2進数
z 文字コードの違いによって、表示する文
字が異なる。
ASCII文字コード
y
プログラムやデ タなどを統 的に扱うために、共
プログラムやデータなどを統一的に扱うために
共
通コードを取り決めた。
y
ASCII【American national Standard Code for
g アスキ 】
Information Interchange:アスキー】
米国ANSI(American National Standards Institute)が
策定した 7 ビットコード
[演習2]]
[演習
1.ASCIIコードでは何種類の文字を表すことができる
か。
2.“Waseda”をASCIIコードで表せ(16進、10進)
文字コード
y
PC上で用いられる文字
◦ 日本語にはカナ文字
日本語にはカナ文字、漢字があるため、7ビッ
漢字があるため 7ビ
トでは足りない
◦ 全角文字 vs 半角文字
早
J1
◦ 2バイト(16ビット)で表す
y
y
JISコード
ド
Shift-JIS(シフトJIS)コード
[演習2] 3. 2バイトでは何通りの文字を表せるか?
文字コード
y JISコード
◦ 1978年、1983年、1990年、1997年、
2000年、2004年と5回改訂されて
いる。
る
◦ 1983年版で採用されている範囲の
文字について1997年に改訂を行っ
文字について1997年に改訂を行
た「JIS X 0208:1997」に基づく文
字コ ドが現在の標準
字コードが現在の標準
◦ 国際標準化機構(ISO)による文字
コ ドの国際標準の つである
コードの国際標準の一つである
「ISO-2022」の日本語部分にも採
用されており、「ISO-2022-JP」と
も呼ばれる。
棹(5c2a)
JISコード
JJIS
コード
「かな漢字変換システム」 MS-IME(Input
M h d Editor:マイクロソフト)、ATOK
Method
Ed
マイクロソフト) ATOK
(ジャストシステム)
キーボードから かな を入力すると、PC
で利用する文字コ ドに変換してくれる。
で利用する文字コードに変換してくれる。
Shift--JIS
Shift
棹(9ea8)
文字コード
文字
コード
y
Unicode(ユニコード)
◦ すべての文字を16ビット(2バイト)で表現し、1つ
の文字コ ド体系で多国語処理を可能にしよう
の文字コード体系で多国語処理を可能にしよう
とするもの。世界の主要な言語のほとんどの文
字を収録している。
字を収録している
◦ 1980年代にユニコードコンソーシアム(ゼロック
ス社が提唱、マイクロソフト、アップル、IBM、サン
ス社が提唱
マイクロソフト アップル IBM サン・マ
マ
イクロシステムズ、ヒューレット・パッカード、ジャス
トシステムが参加)が提唱
◦ 1993年に国際標準化機構(ISO)でISO/IEC 10646の
一部(UCS-2)として標準化された文字コード体
(
)
系。
文字コード
y
EUC-JP(Extended
EUC
JP(Extended UNIX Code Packed
Format for Japanese、日本語EUC)
◦ EUCのエンコード方式上にASCIIとJIS
ド方式
X
0208文字集合を配置したもの。
◦ 半角カナ (JIS X 0201) とJIS補助漢字 (JIS X
0212)) も含むことができる。
◦ 半角カナと補助漢字を使用しない場合は、
JJISS X 0208で規定されている符号化方式
0 08で規定されている符号化方式
「国際基準版・漢字用8ビット符号」と同
一となる。ISO/IEC
となる。
2022に適合。
に適合。
文字コード
y
EBCDIC (Extended Binary Coded Decimal
Interchange Code;エビシディック)
◦ IBMにより定義された文字コード
式
数を
◦ ゾーン形式2進化10進数をベースにした二進
化十進数(BCD、Binary-coded decimal)
メ ンフレ ムコンピュ タに使われてい
◦ メーンフレームコンピュータに使われてい
た。
演習22
演習
5. 「稲」のJISコードとShift-JISコードを
5
「稲」のJISコ ドとShift JISコ ドを
調べよ。
6.「東」「西」「南」「北」をShift-JISで
昇順並 替えを行うと、どのような順
昇順並べ替えを行うと、どのような順
になるか。
7 Webページが文字化けをしている。
7.
W bペ ジが文字化けをしている
どこを変更すればよいか。
実戦問題
各国の文字を一つの体系で表現する文字
各国の文字を
つの体系で表現する文字
コードセットとして、PCでのデータ交換
が円滑にできるように制定されたコード
体系
体系はどれか。
。
(あ)EBCDIC
(い)Unicode
(う)JIS漢字符号 (え)シフトJISコード
(え)シフトJISコ ド
y