平成17年度大学院 知識システム特論

平成23年度大学院
Webインテリジェンス論
やまぐち たかひら
山口 高平
居室:慶應義塾大学矢上キャンパス 24-619A
内線:42673
電話:045-566-1614
FAX; 045-566-1617
メール:[email protected]
Web: www.yamaguti.comp.ae.keio.ac.jp
授業内容と授業計画,講義資料,成績評価
授業内容
人工知能に関する基本的知識を修得した後、次世代Webとして、
セマンティックWebとオントロジーに関する知識とスキルを身につける。
授業計画
①4/19 ガイダンス,人工知能歴史
②4/26 エキスパートシステム
5/3 休講
③5/10 知識モデリング
④5/17 セマンティックWeb概論
⑤5/24 RDF/RDFS
⑥5/31 RDF Graphical Tool MR3 (休講?)
⑦6/7 オントロジー言語OWL
⑧6/14 オントロジーエディター Protege
⑨6/21 セマンティックWebサービス
⑩6/28 セマンティックWebアプリケーション
⑪7/5 LOD
⑫7/12 まとめ
講義資料:pptやpdf資料をWebに掲載
www.yamaguti.comp.ae.keio.ac.jp
成績:レポート数回で評価
人工知能(AI)の歴史
1956年 ダートマス会議 ↑
•
•
•
•
•
•
•
John McCarthy (LISP)
Marvin Minskey (フレーム理論)
Shannon (情報理論,チェス)
オートマトン≠人工知能(AI)
AI:人間のような知的な動作を機械にさせるには?
GPS (General Problem Solver)
探索の研究 A*アルゴリズム
1965年~ AIの3(4)大事件 →
・導出原理:拡張三段論法J.A.Robinson
1972:Prolog処理系
1982~1994:第5世代コンピュータ
・DENDRAL:スペクトラム分析→分子構造
ファイゲンバウム(スタンフォード大学)
一つのアプリケーションにしかすぎない,汎用性
・ピアス勧告:MTは不可能
・ファジィ理論:ザデー教授
推論の時代→ Toy Problems、AI冬の時代へ
1970年代:冬の時代 ↓
1980年代→知識工学 ↑
• HPP:Heuristics Programming Project
完全ではないがたいていの場合うまくいく知識や方法
• MYCINプロジェクト(1973~1976)
•
•
•
•
MYCIN,TEIRESIAS,GUIDN,EMYCIN
知識表現、知識利用、知識獲得→知識工学
There is power in the knowledge ! (1977)
by Feigenbaum
1980年代→知識の時代へ
エキスパートシステム,自然言語・画像・音声理
解システム,知的教育支援システム,...
国家プロジェクト,AIハード・ソフトベンダー
Machine Intelligence
過去
1956年:ダートマス会議(汎用知能,探索,チェス,定理証明)
1965年:推論(演繹)→Toy Problem
1970年代:AI冬の時代へ
1980年代 : Knowledge is Power! (ファイゲンバウム教授,スタンフォード大)
知識工学,エキスパートシステム知識表現、知識獲得,知識の利用(推論)
説明
機能
知識
ベース
推論
エンジン
知識
獲得
作業
領域
(専門家)
ユーザ
対話
I/F
デモ1:対話デモ(Eliza, 人工無能)
デモ2:献立支援ES
1990年代:大規模データの活用
新パラダイムの誕生 ↓
• 知識獲得ボトルネック→機械学習,ニューラルネット,
GA(進化計算),ベイジアンネット,データマイニング
• エージェントの研究:自律,マルチエージェント
• 自然言語処理:スキーマ(‘70),文法重視(’80)からコーパス(統計)へ
• DeepBlue:チェスの世界チャンピオンに勝利
カスパロフ(ロシア人)1勝2敗 DeepBlue(iBM) 1997年
512台並列処理,1秒間2億手,α-β法(量は質の変化を生む)
「毎回、対戦相手が違っていた気がする」
学習パラメータを人手により変更(MLは使っていない)→DeepBlueの振る
まいが変わる
でもゲームだよね.閉じた問題,整構造問題だからできるんだ
• ロボットとAI:ロボカップ(1995) ,ホンダヒューマノイドASIMO
(二足歩行1996), AIBO(1999)
• 生物とAI(ゲノム情報...)
GACTTTCAGTAA…… 機能分析,バイオ特許
過去
1990年代:知識獲得ボトルネック
知識(ルール)
→ESが専門家代行という過大な期待.
知識ベース開発のための知識獲得は大変だ!
通産省:第5世代コンピュータ(1982-1994)の失敗?
→推論マシンに特化しすぎ.知識は
1990年代: 大規模知識ベース,大規模辞書プロジェクト
CYC, EDR, WordNet(フリーなので現在も広く使われる)
でも,あまり変化しない静的知識だけ.現実には動的知識が
多い.使えないなぁ.AIブームは完全にさめて下火へ
1997年:Deep Blueがチェス世界チャンピオンに勝利.
でもゲームだよね.閉じた問題,整構造問題だからできるんだ.
2000- H/Wの進展と共にAIの成熟
データマイニング
多くの応用が生まれる
①米国ウォールマートが購入された商品分析
日曜日,既婚若者男性,購入商品組合せ
缶ビール-(?)
②10年前,日本のスーパーマーケットで,
右図の商品配置は非常識?
※10年間のGB単価の大凡減尐傾向(不正確?)
2000年(1000円),2001年(400円),2002年(200円)
2003年(150円), 2004年(120円),2005年(100円)
2006年(60円) , 2007年(50円) , 2008年(20円)
2009年(10円) ,2010年(5円)
コンピュータ将棋「あから2010」vs女流名人
知能ロボットの展開
ロボット産業
知能ロボット
(サービスロボット)
産業用ロボット
工場(自動車や電
子部品など)
・溶接ロボット
・塗装ロボット
・運搬ロボット
・電子部品実装ロ
ボット
期待
成熟
家庭・介護・医療など
・セラピーロボット
・コミュニケーションロ
ボット
・多目的(受付・案
内・誘導など)ロ
ボット
・レスキューロボット
・清掃ロボット
知能ロボットの分類
アシモ
Bigdog
(移動型ロボット:運動能力)
http://bigdogrobotvideos.com/
アイボ
パロ
(ペット型ロボット:癒し)
http://paro.jp/?page_id=247
コミュニケーション
ロボット
石黒教授
ジェミニ
(アンドロイドロボット:見た目)
http://www.youtube.com/watch?v=QMEXBWJDUMk
2000- NWの進展と共にAIの成熟
• インターネットに保存されている文書量は?
1ZB?(KB, MB, GB, TB, PB, EB, ZB)
http://www.emc.com/leadership/
digital-universe/expanding-digital-universe.html
自然言語処理+高度ML
検索エンジンの高度化
TREC-QAシステム
セマンティックWeb(ページの意味が分かるWebへ)
2003年 QA Challenge !(1) IBM PIQUANT
• 2003~ IBM,PIQUANT(Practical Intelligent
Question Answering Technology)プロジェクト
★チェスのような閉じた問題ではなく、事前に分からないクイズ
に解答するという開いた悪構造問題に挑戦することがポイント
深い論理形式分析と浅い機械翻訳ベースのアプローチを統合
でも、この難しい問題にチェレンジするには、AI技術が未熟で、
マシンパワーも不足して、大きな成果はあげられずに終わる。
2007年 QA Challenge !(2) Powerset
(2008年にMSが$1億で買収)
問合せ:アルカトラズ島から逃げた囚人の数は?
Google:関連するページを表示。
答えはページを読まないと分からない
Googleはページ検索エンジン
Powersetは関連するページ内の文章を
ハイライト→文章検索エンジン。
QAシステムといえる。
ただし、Web全体を検索するのではなく、
Wikipediaのみを検索対象。軽いオントロジー
を使って、同義語、類義語を判断している様子。
正当:0回。
計14回あった脱獄計画に36人の囚人
が関わり、全員脱獄に失敗した。
新しい事柄に関するQAは、
Googleの方が上になるケースがあり、
開放性が低い、データ規模が小さい、意味処
理技術が不十分?により、この3年間、成果発
表はない。でも、急に発表があるかも?
2011年 QA Challenge ! (3) IBM Watson
・IBM Deep Question Answering Project
(ジョパディで,ワトソンがチャンピオンに挑戦して勝利)
Open-Domain Question Answering
PIQUANTから時代が進み,技術が成熟、マシンパワーが拡大
IBM Watsonの概要
★大規模知識の獲得(100万冊,2億ページ)
百科事典、辞書、シソーラス、ニュース記事、著作物などを情報源。
自動的にコーパスを拡大。
★徹底した質問文解析:LAT(Lexical Answer Type)と重要語抽出
★突出した一つのAI技術ではなく,言語理解,情報検索,不確実性推論,仮説生成,
仮説統合とランキング、機械学習,知識表現(オントロジー),構造化データなど,
100以上の従来AI技術(20年前の技術もある)の集大成
★精度、確信度、速度を考慮したAIインテグレーション
★計算力:並列計算による計算パワー
★汎用性:Jeopardy Challengeに特化していない。TREC QAにも適用して成功。
★展開性: 医療、金融、行政、マーケティングにも適用可能