講義資料

インターネット概論
2006年度春学期授業日程
第6回(2006年5月25日)
論理的なネットワークの構成
データ構造とインターネットの関係
慶應義塾大学 環境情報学部
村井 純・南 政樹
04/13(木)
04/20(木)
04/27(木)
05/11(木)
05/18(木)
05/25(木)
06/01(木)
06/08(木)
06/15(木)
06/22(木)
06/29(木)
07/06(木)
07/13(木)
「インターネットを理解するために」
「デジタルコミュニケーションの仕組みと歴史」
「通信インフラストラクチャ 」
「インターネットアプリケーション」
「モーバイルアプリケーション 」
「論理的なネットワークの構成 」
←今日はココ
「セキュリティとプライバシー」
「メディアと政策」
「教育とその情報化」
「インターネットビジネス環境とその制度基盤」
「グローバルガヴァナンス」
「実空間インターネット」
「最終試験」
• 課題(2回)は〆切済み → まだの人も早く出しましょう!
• 最新情報はSOI*で確認すること!
– *SOI (School of Internet)については http://www.soi.wide.ad.jp/を参照
ニュースヘッドライン
前回の復習
今回はお休みです
FIND/GENIの話 by Peter A. Freeman
“Research for Future Network”
Issues with the Internet
Digital Living 2010
Tomorrow’s users will be surrounded by pervasive devices,
embedded sensors and systems… all connected to the Internet.
User
User
Games
Photography
Inventory/Sales
tracking
Entertainment Systems
Health/Medical
Home Computer
Home Appliances
Banking
and
Commerce
User
Surveillance and Security
(at home, work, or in public)
PDA
Telephone
• Security
• Robustness
Communications
• Scaling
• Mobile wireless and sensor networks
• New technologies
There are fundamental issues with the current
architecture and many of its mechanisms that cannot
be fixed incrementally and with additional
Car
Building Automation
engineering workarounds.
User
Thanks to David Kotz at Dartmouth
1
Future Internet?
GENI (Global Environment for
Networking Investigations) Project
Distributed Systems and Services?
Network and Protocol Architectures?
• Research -- Refocus existing programs
– NeTS => FIND focus area
New Paradigms?
– Cyber Trust (CT)
– Computer Systems Research (CSR)
Applications &
User
Requirements
– Computing Research Infrastructure (CRI)
– …
Enabling
Technologies
• GENI Experimental Facility
– Not funded yet
Internet
Arch. Limitations
& Erosion
Network
Capabilities
– Exploring different possibilities
– Planning activities underway
Need a clean-slate approach
Facility Design Concepts
Sensor Network
GENI is an advanced, flexible,
programmable instrument for
networking and distributed systems
research.
Sensor Network
Edge Site
Mobile Wireless Network
Mobile Wireless
Network
Edge Site
Slicing, Virtualization, Programmability
Case for GENI
Looking Ahead
Applications
Need for large experimental
testbed/infrastructure
Shared
Deployable
Infrastructure
Capabilities
This chasm represents a major
barrier to realization of GENI
Small Scale
Testbeds
Critical
Infrastructures
Networked
Sensors
Data Grid
Networked
Embedded
E-science
Digital
Living
Service
Oriented
Evolvability
Security
Robustness
Mobility
Ubiquity
Wireless
SoC
Research
Prototypes
Optical
Foundations
Research
Funded by CISE Programs
Actuators
Technologies
Autonomicity
Capabilities
Sensors
Time
2
Issues with the Internet
GENI (Global Environment for
Networking Investigations) Project
• Security
• Research -- Refocus existing programs
• Robustness
– NeTS => FIND focus area
• Scaling
– Cyber Trust (CT)
• Mobile wireless and sensor networks
– Computer Systems Research (CSR)
• New technologies
– Computing Research Infrastructure (CRI)
– …
There are fundamental issues with the current
• GENI Experimental Facility
architecture and many of its mechanisms that cannot
– Not funded yet
be fixed incrementally and with additional
– Exploring different possibilities
engineering workarounds.
– Planning activities underway
情報化の変遷:表現方法の確立
• 様々な情報を「数字」で表現
– 文字を数字化 → 文字コード
– 音声を数字化 → 音の強さ
– 画像を数字化 → 色の要素(赤緑青etc)
– 映像を数字化 → 複数の画像
• すべて情報は「bit 数字の羅列」で表現できる
ASCIIコード
0x41(65)
JPEG形式の画像
0xFF8D,0xFF1E ・・・, 0xFF9D
様々な文字コード
• 日本語でよく使われる文字コード
– EUC-JP
• Extended UNIX Code
– ISO-2022-JP
• ISO(International Organization for Standardization)に基づく国際規格
– Shift-JIS
文字コード(復習)
• 文字には数値が割り当てられている
– 文字コード
0x41
0x61
– ASCII (American Standard Code for Information
Interchange)
– 大文字を小文字に変換したければ、文字に
0x20 を足せばよい
文字コード(復習)
• 文字には数値が割り当てられている
– 文字コード
0x41
0x61
• Microsoftが策定したコード
– UTF-8
• UCS-2やUCS-4で定義される文字集合を用いて記述された文字列をバイト列
に変換する方式の一つ
– ASCII (American Standard Code for Information
Interchange)
– 大文字を小文字に変換したければ、文字に
0x20 を足せばよい
3
様々な文字コード
文字コードの変換
• 日本語でよく使われる文字コード
• 各文字コードで“あ”を表現する
– EUC-JP
• Extended UNIX Code
EUC-JP
– ISO-2022-JP
• ISO(International Organization for Standardization)に基づく国際規格
– Shift-JIS
A4A2
• Microsoftが策定したコード
ISO2022-JP
2422
Shift-JIS
UTF-8
82A0
E38182
– UTF-8
• UCS-2やUCS-4で定義される文字集合を用いて記述された文字列をバイト列
に変換する方式の一つ
• ある文字コードから任意の文字コードへ変換するためには・・・
– 変換のための文字コード対応表を持つ必要がある
キャリアによって異なる絵文字(1/2)
携帯電話と文字コード
• 各社の端末で
• 絵文字の正体
– 文字コードで表現される
• Shift-JISコード : F89F(16進数) 63647(10進数)
• Unicode : E63E
• 各社の絵文字対応状況
– DoCoMo
– au :
• 基本絵文字176種類+拡張絵文字76種類
• KDDI絵文字用Shift-JISコード:F660
• Unicode : E488
• Eメール送出用JISコード : 7541
– au
• 828種類
– Vodafone
– Vodafone
• Vアプリ作成用Unicode : E04A
• ボーダフォンライブ!WEBコード : $Gj
• 474種類,V8シリーズは477種類
キャリアによって異なる絵文字(2/2)
interoperability
• 異キャリア間で絵文字を送ると・・・
• 情報のやり取りができる理由
– 〓への変換,絵文字の削除が起きる
DoCoMo → au
を表現すると・・・
– DoCoMo :
– 全てのコンピュータで「同じように表現」できる
– 全てのコンピュータが情報を識別できる
au → DoCoMo
• 「同じように表現」
– 例)文字
• どのコンピュータを使ってもメールのやり取りが可能
– たまに起きる困ったこと
• 絵文字が携帯キャリアごとに異なる (文字化け)
• 海外から送られてきた日本語のメールなのに、中国語で表示される
(言語の認識ミス)
4
情報化の変遷:永続的な保存方法
• デジタル化した情報(データ)は「ファイル」として保存
– ファイル=bit(数字)の羅列を一まとめにしたもの
– 種類
•
•
•
•
テキストファイル(cf. 文字コード、改行コード etc…)
画像ファイル(cf. JPEG, PNG, TIFF etc…)
音声ファイル(cf. MP3, AAC, etc…)
動画ファイル(cf. MPEG2, AVI, QuickTime etc…)
– 名前
• 人間は「名前」でファイル
• コンピュータは数字(識別子)でファイル ・・・ ファイルシステム
– 中身(コンテンツ)
携帯電話と文字コード
• 絵文字の正体
– 文字コードで表現される
• 各社の絵文字対応状況
– DoCoMo
• 基本絵文字176種類+拡張絵文字76種類
– au
• 828種類
– Vodafone
• 474種類,V8シリーズは477種類
• 画像ファイルには画像を表現するbitの列
• 音声ファイルには音を表現するbitの列
キャリア間の絵文字変換
•
キャリアをまたいだ絵文字のやり取りには対応
表を基にした変換が必要
– 宛先に応じて文字を変換する
– 例:docomoからauに
を送る
1.
2.
3.
4.
5.
F89Fが入力される
docomoの
のようだ
宛先はau
auの
はf660だ
f89fをf660に置換して送信
情報化の変遷:永続的な保存方法
• デジタル化した情報(データ)は「ファイル」として保存
– ファイル=bit(数字)の羅列を一まとめにしたもの
– 種類
•
•
•
•
テキストファイル(cf. 文字コード、改行コード etc…)
画像ファイル(cf. JPEG, PNG, TIFF etc…)
音声ファイル(cf. MP3, AAC, etc…)
動画ファイル(cf. MPEG2, AVI, QuickTime etc…)
– 名前
• 人間は「名前」でファイル
• コンピュータは数字(識別子)でファイル ・・・ ファイルシステム
interoperability
• 情報のやり取りができる理由
– 全てのコンピュータで「同じように表現」できる
– 全てのコンピュータが情報を識別できる
• 「同じように表現」
– 例)文字
• どのコンピュータを使ってもメールのやり取りが可能
– たまに起きる困ったこと
• 絵文字が携帯キャリアごとに異なる (文字化け)
• 海外から送られてきた日本語のメールなのに、中国語で表示される
(言語の認識ミス)
情報化の変遷:属性情報
• ファイルシステム
– 「ファイル」を管理するためのシステム
– 「名前」「作成日」などの情報と合わせて情報(データ)を保持
UNIXの例
minami@minami:~$ ls -l
total 1536
drwxr-xr-x 3 minami rg
31 Sep
-rw-r--r-- 1 minami rg
1518 Nov
drwxr-xr-x 9 minami rg
4096 May
-rw-r--r-- 1 minami rg
14344 Dec
drwxr-xr-x 4 minami rg
47 Mar
drwxr-xr-x 9 minami rg
4096 May
-rw-r--r-- 1 minami rg 1540407 Oct
drwxr-xr-x 3 minami rg
74 May
10
18
1
28
8
24
16
15
2005
2005
03:54
01:22
14:52
18:12
2005
13:11
Desktop
beluga.plugin.tar.gz
geeklog
jphoto-0.1.zip
project
public_html
pukiwiki-1.4.5plus-i18n-u2.tar.gz
tmp
– 中身(コンテンツ)
• 画像ファイルには画像を表現するbitの列
• 音声ファイルには音を表現するbitの列
アクセス権限
所有者・グループ サイズ
最終更新日
名前
5
C:¥Documents and Settings¥minami>dir /a /n /q
ドライブ C のボリューム ラベルは IBM_PRELOAD です
ボリューム シリアル番号は 64EF-CB7D です
ファイルの種類
C:¥Documents and Settings¥minami のディレクトリ
2006/05/23
2006/05/23
2006/04/14
2006/05/23
2006/05/23
2006/04/26
属性
09:57
09:57
02:01
09:59
14:21
17:44
最終更新日
<DIR>
<DIR>
<DIR>
<DIR>
<DIR>
<DIR>
BUILTIN¥Administrators .
BUILTIN¥Administrators ..
TP42P¥minami
Application Data
TP42P¥minami
Contacts
TP42P¥minami
Cookies
TP42P¥minami
dsc
種類
2003/02/28 13:24 <DIR>
2006/05/10 14:34 <DIR>
9 個のファイル
20 個のディレクトリ
持ち主
• 情報は全てbit(数字)の列!
– 情報(データ)を再現するときに「どんな記録方法」で保存されているか
を知る必要がある
• 違うフォーマットでは正しくファイルを読めない
サイズ:10KB
作成日時:06/5/25
作者:概論 太郎
データ:
It is fine today.
名前
TP42P¥minami
スタート メニュー
TP42P¥minami
デスクトップ
5,254,760 バイト
705,445,888 バイトの空き領域
…
C:¥Documents and Settings¥minami>
サイズ:10KB
作成日時:06/5/25
作者:概論 太郎
データ:
It is fine today.
…
サイズ:?
作成日時:?
作者:?
データ:
?
…
復習:画像の数値化(の原理)
例)画像ファイルの場合:様々な画像フォーマッ
ト
•
非圧縮
– Bitmap
• 小さな升目
• マイクロソフトとIBMが作った画像ファイルフォーマット
• 正確には「圧縮形式」も指定できるが多くの場合は非圧縮
– 画像を小さな升目に分割
– TIFF
• マイクロソフトとAldus(現在のAdobe)が作った画像ファイルフォーマット
• タグと呼ばれる識別子を使うことによって、様々なデータを柔軟に表現することができる
• 色の3原色
•
– 赤・緑・青
– この3色の強さを変化させ
ることで全ての色を再現
できる
– RGB(Red, Green, Blue)
圧縮
– JPEG
• 静止画のデジタルデータを圧縮する方法
• JFIFが事実上の標準ファイルフォーマット
• デジカメでよく使われている → EXIFフォーマット
– PNG
• インターネットでの画像配信の効率と高い編集・表現力を実現するために作られた
フォーマット
• 48bit階調での表現も可能
– GIF
出典:
President 2000年10月16日号
新世紀の風貌 第14回 村井純
“インターネットを支える「獰猛なる純情」 ”
復習:画像の数値化(の原理)
• 256色以下の色を利用できる可逆圧縮形式のファイルフォーマット
• 圧縮の形式上「同じ色が連続する」画像の場合、圧縮率が高くなるので、イラストやボタ
ン画像などで用いると効率化が狙える
JPEGファイルフォーマット
• JFIFフォーマット
• 小さな升目
– 静止画像データ
– 属性
– 画像を小さな升目に分割
• 色の3原色
• Exifフォーマット( JFIFの拡張)
– 赤・緑・青
– この3色の強さを変化させ
ることで全ての色を再現
できる
– RGB(Red, Green, Blue)
– 静止画像データ
– 属性
– 付加情報
出典:
President 2000年10月16日号
新世紀の風貌 第14回 村井純
“インターネットを支える「獰猛なる純情」 ”
6
Exifフォーマット(1)
JFIFフォーマット
• 属性
– 大きさ:150x173
– 解像度:72DPI
– 色数:24BitsPerPixel
–…
SOI
JPEG
JPEG
FILE
FILE
SOI
JPEG共通ヘッダ
JPEG
JPEG
FILE
FILE
JPEG共通ヘッダ
Exifデータ
・属性、付加情報
画像データ
• 静止画像データ
EOI
SOI
EOI
Start Of Image
End Of Image
画像データ
EOI
Exifフォーマット(2)
JFIFフォーマット
• デジタルカメラで使われるフォーマット
• カメラの情報を付加できるようJFIFを拡張
– カメラメーカ
– 撮影日時
– 撮影時のカメラ設定
• シャッタースピード等
SOI
JPEG共通ヘッダ
Exifデータ
・属性、付加情報
JPEG
JPEG
FILE
FILE
• 属性
– 大きさ:150x173
– 解像度:72DPI
– 色数:24BitsPerPixel
–…
SOI
JPEG共通ヘッダ
• 静止画像データ
JPEG
JPEG
FILE
FILE
画像データ
EOI
画像データ
EOI
Google Desktop Search
Exifフォーマット(2)
• デジタルカメラで使われるフォーマット
• カメラの情報を付加できるようJFIFを拡張
– カメラメーカ
– 撮影日時
– 撮影時のカメラ設定
• シャッタースピード等
SOI
JPEG共通ヘッダ
Exifデータ
・属性、付加情報
• ローカルPCのファイル検索ツール
– メール
– Word文書、PowerPoint
– Web閲覧履歴
– AOLチャットログ
JPEG
JPEG
FILE
FILE
画像データ
EOI
http://desktop.google.com/
7
ftp: File Transfer Protocol
15年前のインターネットアプリケーション
•
サーバ・クライアントモデル
•
情報(データ)のありか
• ファイル転送
– サービスを提供する側と受ける側に役割を分担
– 情報(データ)は「提供する側」に存在
– ファイル=データ
– インターネット上に存在するデータの送受信
– 情報(データ)が格納されているサーバは「何らかの方法」で探し出す
• archie プログラム
– サーバ数が多くない上、有名なサーバには様々な種類の情報(データ)が大量に存在
•
情報(データ)の集まり方
• サーバ・クライアントモデル
– 情報(データ)が一箇所に集まるので、利用者も一箇所に集中してアクセスする
ソフトウェアファイル
サーバAから
ソフトウェアを
ダウンロードしよう
– 受動的にリクエストを待つサーバ
ドキュメントファイル
• 固定的な「置き場所」として利用
サーバAから
ドキュメントを
ダウンロードしよう
巨大なサーバ: A
– 能動的にリクエストを送るクライアント
• 必要なときにサーバにアクセスしファイルを送受信
インターネット
インターネット
利用者
クライアント
クライアント
利用者
サーバ・クライアントモデル
• サーバ
:サービスを提供する側
• クライアント
:サービスを要求する側
10年~5年前のインターネットアプリケーション
情報の保持
•
サーバ・クライアントモデル
•
情報の分散化
–
–
–
「置き場所」としてのサーバは変化せず
能動的なクライアントも変化せず
情報(データ)は、「リンク」が含むようになり、分散したサーバ間で情報が有機的に結びつけられるようになった
•
•
情報提供者はリンクを意識して情報(データ)を作成
情報利用者はリンクを辿り新たな情報(データ)を取得
•
情報(データ)のありか:
•
情報(データ)の集まり方
–
情報(データ)が格納されているサーバは「何らかの方法」で探す
–
サーバの数が多く、大量の情報(データ)が分散して存在
•
–
サーバ
cf. 検索エンジン、ディレクトリサービス
インターネット中に分散して存在するが、利用者の増加に伴い人気のある情報(データ)を持つサーバにアクセスは集中
1.リクエストの送信
アドレスを指定
アドレスを指定
リンク
ク
リン
2.情報の配信
Webサーバ
Webサーバ
インターネット
インターネット
アドレスを指定
Webサーバ
アドレスを指定
クライアント
Webサーバ
World Wide Web(WWW)
インターネットの歴史: trafficの推移
トラフィックの推移
100%
• 情報と情報を結びつける
90%
– 分散したサーバ上に存在するデータ
– 「リンク」による相互参照
70%
• サーバクライアントモデル
• 情報(データ)のありかを示す情報
– URI(Uniformed Resource Identifier)
– 「どのサーバ」の「なんという名前のファイル」
• データ転送とURI
60%
データ量(%)
– 受動的にリクエストを待つサーバ
– 能動的に情報(データ)にアクセスするクライアント
ポート番号からサービス
特定がしにくい時代
80%
Others
Napster
SMTP
HTTP/HTTPS
FTP
P2P登場
50%
40%
WWW全盛
30%
20%
出典: WIDE報告書(1994-1999)
2000-2005はdaily sampling
10%
– HTTP(Hyper Text Transfer Protocol)
0%
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
年
8
Atalanta.olympic.org
1996 Atlanta Olympic
JAPAN
US 1
US 2
UK
Germany
Internet
9