新聞 シンブン 記事 キジ 情報 ジョウホウ の 検索

新聞記事情報検索
遡及情報検索による情報のマクロ的把握
• A 課題の作成
1. 作成見本の事前確認
2. 提出画面の確認
• B DBの使用方法
– 別ファイルと、教科書を読んで実行すること
• C 新聞記事情報
情報検索2013
1
論理式(先週)
•
•
•
•
全問正解
114人
1問不正解
13人
同一問題複数不正解 7人
複数問題複数不正解 15
15人
再提出
(裏面記入)
計149人
情報検索2013
2
A 課題②の作成(確認)
•4/5回目(5月15日/22日)
•2週間で完成させる課題
• 新聞記事情報
•
•
•
•
主に前日に発生したニュースをもとに成立
記事1件をDBのデータ1件として整理
Web情報より信頼性が高い(書誌事項)
個々の記事から全体を読み取るのは困難
3
情報検索2013
新聞記事とスクラップブック
• スクラップブック:新聞の切り抜き帳 scrapbook
– 特定の個人や企業、あるいは特定の話題に関する新聞
記事を切り抜き、発行日順にノートに張り付けた保存帳
– 切抜き帳に集められた情報から、トピックについて、時系
列変化を、マクロに把握する
• 記事相互の関連性理解
– スクラップブック/検索結果から記事の相互関係を理
解し、話題の推移や全容を理解することができる
• DBのキーワード検索
– スクラップブックと同等の情報収集が可能
情報検索2013
4
新聞記事の遡及情報検索
• 対象とする情報は大半が過去の新聞記事
– 1985年前後からの検索が可能(30年間弱)
– データベースでは過去の古い情報も価値を有す
• 遡及検索
– 記事を時間軸で並べる(スクラップブックに類似)
– 新聞記事には発信日が明記されている
– 特定の話題が過去から現在に至るまでどのような変
遷を経てきたかを理解することができる
– 過去を知ることにより現在の状況をより深く理解、分析で
きる
– 社会的な背景などの情報と関連付けた考察も可能となる
• 新聞記事検索課題
• 提出期限 5月25日
情報検索2013
5
新聞記事遡及情報検索レポートの作成
課題2(R②)の作成見本とUP画面の確認
1. 作成見本の事前確認
– 見本で概要を把握する
– 作成見本1(2011)
– 作成見本2(2012)
2.提出画面の確認
– UP項目の確認
– UP項目の内容の確認
情報検索2013
6
4種類の新聞記事検索
• 4DBへの接続
– 新聞記事DBへの接続画面の確認
• 4DBを使った検索
I. 朝日新聞(1984-現在)
遡及情報検索
II. 朝日新聞縮刷版(1879-1985) 遡及情報検索
III. 新潟日報(2004-現在)
遡及情報検索
IV. 日本経済新聞(1981-現在) 記事検索
•
DBの使用可能期間は2週間
–
•
4/15-4/27日まで使用可能
ログアウトで終了すること
情報検索2013
7
課題R②の準備(先週)
• 新聞記事検索課題の作成
– 過去から現在に至る歴史的、国際的、社会的な
出来事に関する時系列変化を把握するため10~
20年以上の遡及情報検索を行う
– 朝日新聞(1984-現在) 全国的/世界的な出来事
– 朝日新聞(1945-1985) 全国的/世界的な出来事
– 新潟日報(2004-現在) 同上/地域的な出来事
– 日経新聞(1981-現在) 企業情報
情報検索2013
8
課題の学習到達目標
(体験を通した理解)
• ①新聞記事には情報の発信日が明示され
ていること
• ②記事情報の集合から個々の記事からは
理解できないマクロな状況把握が可能に
なること
• ③遡及検索により時系列的な推移を分析
できること
• ④古い情報にも価値があること
• ⑤収集した記事から必要な情報を選択す
るには目的と目標が選択基準になること
情報検索2013
9
課題の作成
UP画面の項目
作成見本とUP画面を確認してから実行する
質問にはメール/研究室で対応します
1.氏名(漢字)
2.学籍番号
3.選択分野
– 以下の新聞紙面から1分野を選択する
– 全紙面、総合面、国際面、経済面、家庭
面、科学面、特集面、社会面、スポーツ
面から選択する
情報検索2013
10
4.検索課題
– 具体的な内容を示すキーワードを含んだ20-30字
の簡潔な文章で記述する。
– 新聞記事やニュースや授業や体験を通して、言葉
や概容は知っているが理解できていない内容で、
10-20年以上継続性のある話題
– 疑問や興味を持っているが理解できていない話題
で、 10-20年以上継続性のある話題
– 課題設定(設定用紙図8を使用する)
• 情報の主体はニュース
• プロスポーツやエンターテイメントなどで記事の
理解に知識を必要としない単純な話題は除外
する
情報検索2013
11
5.検索内容
– 遡及検索を行うので10~20 年以上継続性のある
と思われる内容を、200-400字程度の文章で、で
きる限り具体的に自分の文章で記述する
– 10 ~20年以上継続性のある内容を明記する
6.情報収集の目的と目標
– 200~400 程度の文章で記入する
– 情報収集の目的には収集した情報を使って最終
的に何を実現したいのかを記述する。
– 情報収集の目標には実現可能な到達レベルや
情報の利用方法を記述する
情報検索2013
12
7,8,9,10,11重要と思われるキーワード
– 情報検索内容の中から候補となる5ワードを重要
な順に切り出す
– (実際に使用するのは3キーワード程度)
12.検索方法
– 使用した朝日新聞記事データベースの検索方法
を記述する
– 簡易検索と詳細検索から選択するが、詳細検索
で実施する
13,14,15,16,17絞り込検索の件数
– 選択したキーワードを重要と思われる順に入力し、
1語,2語, 3語, 4語, 5語の場合の絞り込み件数を
記述する
– 4語、5語で0件になることがある
情報検索2013
13
18.実際に検索に使用した検索式と、検索結果件数
– 検索に実際に使用した検索式と検索結果の件数
を記入する
– 試行錯誤を繰り返し最適の結果を得られたキー
ワードと検索式を記述する
• キーワードの数は最初に想定したキーワードを全
て使用する必要はなく、最初に想定したキーワー
ドより適切なキーワードが見つかれば変更しても
構わない
– 目的目標が20件に絞り込む指標となる
• 件数を20件にするためにキーワードの数を増やす
のは無意味なので、数百件程度に絞り込めれば
キーワードを増やすより自分の目で選択するよう
心がける
情報検索2013
14
課題のまとめ
19.得られた20件以上の記事の一覧
19-1)個別記事の要約。新聞記事情報検索で得られた
20件以上の記事を一覧にする。個別に記事の内容
を書誌事項を含めて記入する。個別の記事は50100字程度
– どの記事を選択するかは目標と目的が判断基
準となる
– 無理に絞り込まない。上位200件程度の中から
20件以上を自分の目で選択する
19-2) 記事全体のまとめ。20件の記事から理解できた
時系列的な変化を記述する。時系列変化を記述す
る字数の目安は400~800字程度以上
情報検索2013
15
19 記事の選択
• 20件の選択
– 目的と目標があいまいだと選択に時間が必用
• 期間
• 検索期間や選択時期が偏らないように選択する
• 図書雑誌記事で期間を1年にしたレポートが多い
情報検索2013
16
19 記事の要約
1. 個別記事の要約
– 20件以上の記事を一覧を作成
– 記事を個別に要約する
2. 記事全体のまとめ
– 検索毎に20件以上の新聞記事全体から理解でき
た時系列的な変化、あるいは全体的な変化を、4
00~800字以上で記述する
情報検索2013
17
20. 縮刷版検索
– 同様の検索を、縮刷版1945-1984年について実行し、
得られた結果を19と同様に記述する。検索式も記述す
– 使用できるキーワードが少ないので、キーワードを減
らしたほうが良い結果が得られる可能性が高い
21.時系列的変化から推定できる将来予測
– 得られた19と20の時系列的な内容の変化から推定で
きる将来予測と、推定理由を記述する
– 時系列的な変化から推定できる将来予測とその推定
理由を記述する
22.新潟日報検索
– 朝日新聞と同様の課題、あるいは地域密着型情報の
検索を、新潟日報2004~について実行し、得られた結
果を記述する
情報検索2013
18
23.日本経済新聞の記事検索(企業情報)
– 興味のある会社あるいは就職活動をしたい会社を、
会社名で検索し、情報収集の結果理解できた企業の
情報を記述する
– 使用した書誌事項一覧を示し、企業情報を200~4
00字程度以上で記述する
– さらに情報検索前後の企業イメージの違いを記述す
る。
24.全体のまとめ
24-1 目的と目標を満足する情報収集ができたか記述する.
期待した結果が得られなかった場合はその要因を分析
する。さらに良い結果を得るための視点も記入する
24-2 新聞記事情報の特徴について理解できたことを記述
する
24-3 朝日新聞と新潟日報の記事の違いについて理解で
きたことを記述する
24-4 その他理解できたことや疑問点があれば記述する 19
情報検索2013
B 新聞記事DBの概要
• 有料のデータベース
– IDとパスワードが必要(授業はIP制御型)
– 基本料金と記事の出力料金(50~150円/件)
– 1記事がDBの1データ
• 著作権
– 入手した記事データは個人的な使用目的以外に使
用できない
– 複製、蓄積、翻訳、翻案、放送、出版、販売、送信、
配布及び改変などはできない
– さらに、第三者のプライバシー、名誉その他の一切
の権利を侵害する使用はできない
情報検索2013
20
具体的な使用方法
• 要約版
– 「新聞記事DBの使用方法2013」
• 詳細な使用方法
– 「教科書」 37-44ページ
• 授業でDBの詳細な説明をする時間がとれないので、
使用法が分からない場合はまず上記の資料を参照
してください。どうしてもわからない事項があれば質
問してください。
情報検索2013
21
検索料金
• 日経テレコン21の料金表
(http://t21.nikkei.co.jp)。
• 通常料金
– 契約料金 96,000円/年
– 出力料金 50~150円/件
– 複写料金
• アカデミック固定料金(5ID)
– 年間契約 189万円
情報検索2013
22
インターネットの無料新聞記事データベース
• 1年以内の期間に限定され遡及検索は不可
– 検索可能期間は短縮・出力は有料の方向へ
• 有料化
– 朝日新聞
• 1年間検索可能(2011/6/11, 期間7年より短縮)、 記事
出力有料、イメージ有, TOPページ右上検索
– 日経
• 6ヶ月検索可能(登録会員2011/6/11)、記事出力有料
• 短縮化
– 毎日
– 読売新聞
12ヶ月の検索可能
6ヶ月の検索可能
情報検索2013
23
I. 朝日新聞記事データベース
(http://database.asahi.com/ のデータを基に作成)
• Digital News Archives for Libraries
– 大学・学校・公共図書館向けの有料サービス
• 記事
– 1984~
– 2003 /4月時点390 万件、2010/4月現在580万件
– 東京本社発行の最終版(14版)が基本
– 2010/2/1日~全ての地域面記事も検索可能
– 朝刊に掲載された記事まで検索可能
– 検索はできても本文を表示できない記事有
情報検索2013
24
検索
• 本文と見出しを区別した検索が可能
– 記事を絞り込む場合に効果的
• フレーズ検索に相当する「全文検索方式」
– 記事から切り出した「キーワード登録方式」では
文字列の検索不可
– キーワードとしては検索概念を表現する名詞が
基本であることに変わりはない
情報検索2013
25
IV 日本経済新聞データベース
• 「新聞記事検索」
– 日経四紙
– 全国紙5
– ブロック紙6
契約していない
– 地方紙32
– 日経 BP ← 対象としない
• 原文の出力
– 日経四紙の新聞記事
– 日経BP社の雑誌記事← 対象としない
情報検索2013
26
C 新聞記事情報
• 毎日発行される朝刊と夕刊の新聞記事
– 新しいニュースが主体
– 主に前日に発生した出来事を伝える
• 読者は新しい情報を入手することに価値を見出している
– 発行日から1日以上経過した新聞記事や古い新聞を読む
ことはほとんどない
• 社説、特集・解説記事なども含まれる
• 書誌事項を有す
– 発行月日
– 文字数は400字から800字程度の文章
– 一般にWeb情報より信頼性が高い
情報検索2013
27
情報源の特徴
• Web情報
– 匿名・2次情報を含む断片的な最新情報を手軽に得
ることができる
• 新聞記事情報
– ニュース記事情報を過去に遡って得ることができる
• 図書・雑誌記事情報
– 基礎知識や専門知識を得ることができる
• 学術文献情報
– 信頼性の高い専門的な情報を得ることができる
情報検索2013
28
図7 情報源としての図書と雑誌記事
情報
(狭義)
(速)
(個別化)
データ
(狭義)
専門図書
一般図書
(大系化)
知識
(狭義)
雑誌記事
遡及情報
新聞記事
遡及情報
特許
専門雑
誌
新聞記事
一般雑誌記事
Web情報
統計デー
タ
分/秒
週・日
月
情報検索2013
年
(遅)
29
日本の新聞
• 日本新聞協会
• 日刊紙の合計は121紙
• 発行部数は1999年以降減少を続けており2009年
10月現在5035万部
• 日本の新聞
– 全国紙
• 全国を対象として編集・発行・販売される新聞
– ブロック紙
• 複数の都府県を対象として編集・発行・販売される新聞
– 地方紙
• 特定の地域を対象として編集・発行・販売される新聞
情報検索2013
30
新聞記事DB
DB
種類
数
新聞名
全国紙
5
朝日新聞、毎日新聞、読売新聞、日本経済新聞、産
経新聞
ブロック
紙
6
北海道新聞、東京新聞、中日新聞、河北新報、中国
新聞、西日本新聞
35
東奥日報、岩手日報、秋田魁新報、山形新聞、福島
民報、茨城新聞、下野新聞、上毛新聞、新潟日報、北
日本新聞、北國新聞・富山新聞、福井新聞、信濃毎日
新聞、岐阜新聞、静岡新聞、伊豆新聞、伊勢新聞、京
都新聞、大阪日日新聞、神戸新聞、紀伊民報、日本
海新聞、山陽新聞、徳島新聞、四国新聞、愛媛新聞、
高知新聞、佐賀新聞、長崎新聞、熊本日日新聞、大
分合同新聞、宮崎日日新聞、南日本新聞、琉球新報、
沖縄タイムス
地方紙
表14 日経テレコン21から利用可能な新聞DB
情報検索2013
31
新聞記事
• 版
– 地域毎に配達時間が異なることから版数の記述
– 10,11,12,13,14版
– 本社に近いほど番号が大きく記事が新しい
– 新潟日報は10,11,12版
• 新聞記事データベースの記事
– 新聞記事データベースは最終版の記事を対象
– 全国の記事,海外の記事(特派員や配信記事)
– 通常の購読では読めない全国の地方版の記事も
対象
情報検索2013
32
参考
朝刊
夕刊
12版: 22:00 頃
2版: 11:00 頃
13版: 24:00 頃
3版: 12:00 頃
14版: 1:00 頃
4版: 13:00 頃
http://www.koho21.co.jp/knowledge/knowledge01.html
情報検索2013
33
新聞を取り巻く環境
•
新聞の読み方
– 30分程度 85% (http://pittarimail.net/question/research/pi30/01.html)
– 平均時間は21分 平成十七年国民生活時間調査
– 定期行動 72.8% 購読していない24.4%
http://www.dims.ne.jp/timelyresearch/2008/081203/
情報検索2013
34
利用方法
• 新聞記事の利用
–
–
–
–
–
–
–
商品の売り上げ状況
新商品の発売や開発情報
競合企業や関連業界の動向チェック
関連企業の人事
おくやみ情報
就職活動
過去の出来事の確認
• 毎日購読していても全て読んでいない
– 自分の興味のある記事
– 全ての記事を読むことはほとんど無い
– 当日の新しい新聞記事(昨日の出来事)に価値がある
• Web情報の内容と重複する
情報検索2013
35
新潟県
•
•
•
•
•
•
•
http://facta.co.jp/article/200707008.html
新潟日報 60.1%
朝日
8.6%
毎日
3.4%
読売
14.0%
日経
4.4%
産経
1.5%
情報検索2013
36
2年生
Q10 新聞を読んでいますか2011(複数可)
• 半数が読んでいない ・全国紙が少ない
– インターネットのニュースが9人
ない
52%
新潟日
報
43%
読 毎
売 日 朝日
3% 0% 1%
他
1%
情報検索2013
37
2013年度
日報
他の新聞
読まない
Webニュース
3%
40%
50%
7%
情報検索2013
38
新聞を取り巻く環境
• アメリカ
– 地方紙が主体
• 地域情報や、地場の産業ニュースがベース
• 地方紙の殆どがデータベースで検索可能
– 全国紙
• USA TODAY, ウォールストリートジャーナル
– 全国で入手できる地方紙
• ニューヨークタイムス、ワシントンポスト
• 新聞発行部数の減少
– インターネット上の無料のニュース配信の増加
– 小規模地方紙の存続は厳しくなり淘汰される方向
– 地域情報や、地場の産業ニュースがWeb情報で流通
情報検索2013
39