1 現代の IT 技術利用にあたっての基礎知識

計算機演習 (物理学科)
1
現代の IT 技術利用にあたっての基礎知識
2009 年 10 月 16 日
担当: 栗本
1.1
コンピュータの仕組み (ハードウェア)
ごく大ざっぱに示すと (専門的には少々違う所もあるが. . . )
記憶装置
CD,DVD
ハードディスク
メモリ
外部と通信
情報処理の中核
ネットワーク
CPU
入力インターフェイス
出力
キーボード
マウス
ディスプレイ
プリンター
最近の状況
CPU
記憶装置
ネットワーク
入力インターフェイス
出力
1.1.1
省電力 (atom 等), 高計算力 (64bit 系)
大容量 (ギガからテラへ),高速,省スペース
高速,無線
コードレス,個人の趣味に合わせたデザイン
大画面,高品位 (色,解像度)
ビットとバイト
1 ビット (bit): Yes(1) or No (0) — 情報の基本単位
1 バイト (byte) = 8 ビット
0-9 の数字,アルファベット (a-z) の大文字,小文字と記号 (+–× ÷ = % など),制御文字 (消去の
DEL,改行 の CR, LF など) は 7 ビットで区別できる ⇒ ASCII 文字
日本では 1 バイトで表現される文字を半角文字,2 バイトで表現される文字を全角文字という.
カタカナは半角,全角の両方があるが,半角カタカナは原則として使ってはいけない.特にインター
ネット上では厳禁.(使っていいのは携帯電話同士など,以前からよく用いられている場合のみ.)
Q1. 0-9 の数字,アルファベットの大文字,小文字を区別するには何ビット必要か
Q2. 2 バイト,3 バイトで区別できる文字の数はそれぞれいくらか
通信の単位にはビットが使われる; bps = bit per second, 100 Mbps = 108 bit/s = 12.5 M Byte/s
記憶の単位はバイトが使われる; 1GB = 109 byte = 8 × 109 bit
Q3. 速さ 10 Mbps のネットワークで 4 GB のデータをダウンロードするには少なくとも何秒かかる
か.(実際は通信速度の 100 % が実現されることはないので,計算値以上かかる.)
1
1.2
OS とアプリケーション (ソフトウェア)
電話:ネットワーク
家 : OS
家具類:アプリケーション
土台:BIOS
ガス,水道:
入力
ソフトウェア: ハードウェアを目的に合わせて動作させる
BIOS : ハードウェアに組み込まれた最小限のソフト (家の土台)
OS : ハードウェアと人間の橋渡し.様々なアプリケーションソフトを動作させる (家屋)
DOS, Windows 系,Mac OS, UNIX 系 (Linux, *BSD, etc)
アプリケーション : 目的の仕事をするための個々のソフト (家具,電気器具類など)
Office (Word, Excel, PowerPoint, etc),Photoshop, TEX, Web ブラウザ,メールソフト,etc
・誰もが自分と同じ OS,アプリケーションを使っているわけではない !!
・データのやりとりの際には相手も使える形式で.最も望ましいのは仕様
が公開されているもの (テキスト,PDF, PS, JPEG, HTML など).
・特定のソフトの特定の形式のデータは,相手がそれに対応できるソフト
を持っていないと使い物にならない.⇒ Word, Excel 等のファイルは相
手が Word, Excel または対応できるソフトを持っていないと使えない
1.2.1
GUI と CUI
GUI グラフィカル ユーザー インターフェイス
画面にボタンやセレクター,スライダーバー等の画像を配置し,それをマウス等で操作して命
令を伝える.最近の OS はこの形式.とっつきやすいが,同じ操作を何度もくり返したり,細
かい指示が多く必要な作業は面倒.一般向き.
CUI コマンドライン ユーザー インターフェイス
コマンド名をキーボードから打ち込んで命令を伝える.初心者にはとっつきにくいし,コマン
ド名を覚えねばならないが,慣れると複雑で細かい作業まで一度に行える.同じ作業を何度も
くり返すバッチ処理に適する.玄人向き.
最近の OS では両方使えるので,必要に応じて GUI と CUI を使い分けるのが賢いやり方
Q4. 理学部端末室の PC (Win) でコマンドプロンプトを開き,
「hostname」と「ipconfig /all」,
「time」
の 3 つの命令を実行し,結果をテキストファイルに残せ.
2
1.3
1.3.1
文字コード,改行コード
文字コード
日本語やアラビア文字,ギリシャ文字を表現するには 1 バイトでは足りないので 2 バイトを使用す
る.しかしながら文字とそれに対応するコード (0 と 1 の列) を割り当てる方法は唯一ではないので,
幾つかの方式が存在する.日本語の場合,現在よく用いられる文字コードは以下の 4 種類ある.
JIS コード : メールで日本語を表すのに用いられる.メールでこれ以外の文字コードを用いると文
字化けして読めないことが多い.
シフト JIS (SJIS) : Win, Mac で用いられる
EUC : UNIX 系でよく用いられる
ユニコード (UTF-8) : 最も新しい国際化コード.最新の OS で用いられつつある
テキストファイルをやりとりする場合,自分と相手の用いる文字コードが異なると,文字化けして
読めない.その場合は,相手に用いている OS,文字コードを問い合わせること.現在は,たいてい
の場合 SJIS (Win or Mac) であるケースが多いが,今後 UTF-8 を使う場合が多くなると予想される.
ファイル名に日本語を用いると,相手の環境によっては文字コードが異なって文字化けする.他人
とやりとりするファイルの名前はなるべく英数字にしておく方がよい.
1.3.2
改行コード
日本語だけでなく,テキストの改行を表すコードも OS によって異なる.
Win: CR と LF の両方 (CR+LF) Mac:
LF
UNIX 系: CR
CR (キャッリジリターン): タイプライターで印字部分を先頭に戻す
LF (ラインフィード): タイプライターで紙を 1 行分進める
文字コードや改行コードが不明で中身が読めないテキストファイルがある場合,それを読む一つ
の方法として Web ブラウザで「ファイルを開く」からそのファイルを開いてみるとよい.文字化け
している場合は「文字エンコーディング」または「エンコード」をいろいろ変えて試してみる.
テキストのデータを相手に送る最も都合のいい方法は,メールの本文にそのテキストデータをコ
ピーすることである.(メールにテキストファイルを添付しても文字コードは変わらない.) 後はメー
ルソフトが自動的にやってくれる.
Q5. いくつかの日本語の Web ページを閲覧し,そのソースを見ることにより用いられている日本
語の文字コードが何かを調べよ.
3
1.4
1.4.1
その他の有用な知識
CSV 形式
最近ではデータをエクセル等の表計算ソフトで扱うことが多いが,エクセル形式のファイルはそ
の形式に対応したソフトが無いと利用できない.よりデータを汎用に使うためには
dat11,dat12,dat13,...
dat21,dat22,dat23,...
のように,データを半角のコンマで区切って並べた形式を用いるとよい.数値でなく文字列の場合で
半角のコンマを含む場合は ”abc,def” のように二重引用符等で囲む.これを CSV 形式という.CSV
形式のファイルはエクセル等の表計算ソフトでも読み込めるし,プログラムで用いるにも都合がよい.
1.4.2
ファイルの拡張子
ファイル名には通常 「abcdef.exe」のように,最後の . (ピリオド) に続く文字列がついている.こ
れを拡張子といい,ファイルの種類を区別するための情報になっている.Windows や Mac の場合,
デフォルトの設定では見えない場合が多いが,拡張子を表示するように設定すれば表示されるように
なる.常に表示させるよう設定することを勧める.
よく使われる拡張子の例
拡張子
exe
html
pdf
gif
mp3
mpg, mpeg
doc
xls
ppt
zip
種類
実行可能ファイル
Web 表示用 HTML ファイル
PDF ファイル
画像ファイル (GIF 形式)
サウンドファイル (MP3 形式)
動画ファイル (MPEG 形式)
Word ファイル
Excel ファイル
Power Point ファイル
圧縮ファイル (ZIP 形式)
拡張子
txt
cgi
ps
jpg, jpeg
wav
mov, qt
docx
xlsx
pptx
tgz
4
種類
テキストファイル
Web プログラム用 CGI ファイル
PostScript ファイル
画像ファイル (JPEG 形式)
サウンドファイル (Windows Wave 形式)
動画ファイル (Quick Time 形式)
Office 2007 以降の Word ファイル
Office 2007 以降の Excel ファイル
Office 2007 以降の Power Point ファイル
圧縮ファイル (tar + gzip 形式)