研究データの共有と活用の基盤整備をめざして

第57巻第12号平成27年3月1日発行(毎月1回1日発行)
March
2015
インタビュー
研究データの共有と活用の基盤整備をめざして
DataCite Executive Officerに聞く
音声の障がい者のための最先端音声合成技術
生きている国語辞典『デジタル大辞泉』の挑戦
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
情報収集に気づきを提供する新スタイル
NBDCヒトデータベース
運用開始から1年で見えてきた新しい課題
連載:
インフォプロによるビジネス調査−成功のカギと役立つコンテンツ
第12回 情報の伝え方
vol.57 no.12
p.871-958
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
インタビュー
研究データの共有と活用の基盤整備をめざして
871
Brase, Jan
インタビュー:
DataCite Executive Officerに聞く
恒松直幸
■論文になる前の研究データを成果として認めようという動きが始まっています。
同時に,データを公開して広く活用しようとする機運も盛り上がっています。
DataCiteは,研究データのDOI登録機関として,世界の機関との協力を進め,グロー
バルな活動を行っています。前Executive OfficerのJan Brase氏に,DataCiteの歴
史と取り組み,データ公開の重要性,データ引用をめぐるステークホルダー,そ
してライブラリアンの役割について聞きます。
音声の障がい者のための最先端音声合成技術
882
山岸順一
890
板倉 俊
900
出口信吾
910
箕輪真理
川嶋実苗
三橋信孝
堀尾 徹
■声を失った方々が,以前の自分の声で話すことができたら。統計的音声合成技術
がそんな夢をかなえてくれます。しかも,必要なのは数分程度の音声データだけ
です。不特定多数の話者の音声データから「平均声」と呼ばれるものを作成し,
そこに話者の個性を加えることでその人らしい声と話し方を実現します。この最
新の技術について解説し,今後の可能性について述べます。
s0003
生きている国語辞典『デジタル大辞泉』の挑戦
■『デジタル大辞泉』は年3回更新を続ける小学館の国語辞典です。頻繁なデータ
更新と検索データの充実が「大辞泉 編集支援システム」によって実現していま
す。
『デジタル大辞泉』編集長が,本システムの開発経緯,システムが可能にし
たことを紹介します。システム外の,XMLデータのリッチ化,拡張データの充実
による差別化についても解説します。また,
『大辞泉』ブランディングの各種試
みを紹介し,デジタルは楽しい,と語ります。
s0004
自動記事分類技術を用いた「日経テレコンナビ型記事
検索」
情報収集に気づきを提供する新スタイル
s0005
■会員制の有料ビジネス情報を提供する「日経テレコン」は2014年4月,30周年の節目に
新サービス「ナビ型記事検索」を開始しました。知識ベースを用いた自動記事分類処
理を用いて,
特別な検索スキルをもたない利用者を欲しい情報へ誘導します。このサー
s0003
ビスの特徴と仕組み,今後の展開について解説します。
NBDCヒトデータベース
s0004
運用開始から1年で見えてきた新しい課題
■バイオサイエンスデータベースセンター(NBDC)は2013年10月,
「NBDCヒトデー
タベース」の正式運用を開始しました。このDBはヒト由来の情報を扱うことから,
倫理面の配慮やデータ取り扱いの安全性が必須です。運用に先立ってNBDCは,
「ヒ
トデータ共有ガイドライン」と「NBDCヒトデータ取扱いセキュリティガイドラ
イン」を策定しています。データ提供やデータ利用に伴う審査について述べ,運
用の中で出てきた課題と対応を報告します。
目次
月号
March
連載:
インフォプロによるビジネス調査-成功のカギと役立つ
コンテンツ
918
上野佳恵
924
今浦陽恵
928
日下九八
933
大谷卓史
936
余頃祐介
中山久美子
水野 充
942
遠藤裕子
946
加藤斉史
949
神代 浩
第12回 情報の伝え方
視点:
インドにおける知財訴訟の現状
リレーエッセー:
つながれインフォプロ 第18回
過去からのメディア論:
プライバシーの多義性を考える
集会報告:
2014年DOIアウトリーチ会議
集会報告:
ICSTI 2015 年次メンバー会合 & APE 2015
~欧州の学術コミュニケーションの動向~
JSTサービス紹介:
ジャパンリンクセンターの新機能
この本!~おすすめします~:
人生のお供に図書館を
2014年3大図書館本+α
953
付録:
年間記事索引
情報界のトピックス
958
編集後記
index1
vol.57 no.12
JOHO KANRI 2015
Contents
March
Journal of Information Processing and Management
Interview
Aiming at building infrastructure of research data sharing
and reuse
An interview with Executive Officer of DataCite
871
Brase, Jan
Interview:
TSUNEMATSU Naoyuki
Advanced speech synthesis technologies for vocal
disabilities
882
YAMAGISHI Junichi
Challenge of living Japanese dictionary "Digital Dai-ji-sen"
890
ITAKURA Takashi
New Nikkei Telecom navi type style for article search with
automatic classification techniques
900
DEGUCHI Shingo
NBDC human database
Emerging challenges after one year operation
910
MINOWA Mari T.
KAWASHIMA Minae
MITSUHASHI Nobutaka
HORIO Toru
Series:
918
UENO Yoshie
Opinion:
924
IMAURA Akiyoshi
Relay essay:
928
KUSAKA Kyuuhachi
Seeing current media retrospectively:
933
OTANI Takushi
Meeting:
936
YOGORO Yusuke
NAKAYAMA Kumiko
MIZUNO Mitsuru
Meeting:
942
ENDO Yuko
Service Overview from JST:
946
KATO Takafumi
My bookshelf:
949
KAMIYO Hiroshi
Keys to success of business research - tips and useful
contents
Part12: How to deliver data and information
Current status of IP lawsuits in India
Building networks among info pros (18)
Considering the ambiguity of the concept of privacy
DOI Outreach Conference 2014
ICSTI 2015 Annual Members Meeting & APE 2015
~ The Trend Report on Academic Communication in Europe ~
New functions of Japan Link Center
Library as your life partner
The three Library-related books in 2014 and one more
Appendix:
953
vol.57 Index
Topics of the information community
958
Editor's note
index1
インタビュー:研究データの共有と活用の基盤整備をめざして
インタビュー
研究データの共有と活用の基盤整備を
めざして
DataCite Executive Officerに聞く
Aiming at building infrastructure of research data sharing and reuse
An interview with Executive Officer of DataCite
Brase, Jan1
インタビュー:恒松直幸2
1 DataCite
2 独立行政法人科学技術振興機構 情報企画部(〒102-8666 東京都千代田区四番町5-3)
1 DataCite
2 Department of Information Planning, Japan Science and Technology Agency (5-3 Yonbancho Chiyoda-ku, Tokyo 102-8666)
情報管理 57(12), 871-881, doi: 10.1241/johokanri.57.871 (http://dx.doi.org/10.1241/johokanri.57.871)
1. DataCiteの会員,歴史,組織,活動状況
れましたが,同大学では図書館職員がすべての蔵書
を馬や荷車に載せて坑道に隠したため,無傷で残っ
――DataCiteが 属するドイツ国立 科 学 技 術図書 館
(Technische Informationsbibliothek: TIB)注1)の役割や重
ていたのです。
ドイツの他の国立図書館は,ドイツ語またはドイ
要性についてご説明いただけますか。
ツ人による出版物のすべてが収集対象です。一方,
Brase氏:1957年のソ連での人類初の人工衛星スプー
T I Bは言語や国に関係なく世界中の科学技術関係の出
トニク打ち上げ成功を知り,西洋諸国は「ソ連の科
版物を収集し,ドイツ国内だけでなく国外の人々に
学技術に追いつき追い越すにはどうしたらよいのだ
も提供するという国の設置法に基づいています。T I B
ろう」と考えたのです。ドイツでは科学技術に特化
は,科学技術図書館としては世界最大です。
した図書館を作ろうという動きが起こり,専門の国
立図書館を設立することになりました。その分野で
――博士はどのような経緯でこの分野にお入りに
ドイツ最大の蔵書数を誇っていたハノーバー大学の
なったのですか。
技術図書館が1959年に国立図書館となりました。第
B r a s e氏:ハノーバー大学で純粋数学を専攻し,副専
二次大戦時にドイツの大半の図書館が空爆で破壊さ
攻はコンピューターサイエンスでした。卒業時に同
本稿は,2014年10月17日に行ったインタビューを弊誌編集事務局にて編集・再構成したものである。
Dr.Braseの肩書はインタビュー当時のもの。
同氏は2015年1月からドイツ国立科学技術図書館
(TIB)EU リサーチリエゾンオフィサー。
情報管理 vol. 57 no. 12 2015
871
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
大学からコンピューターサイエンスの博士号を取ら
ないかという誘いがあり,そこでメタデータや情報
検索に取り組み図書館分野に足を踏み入れました。
図書館と協働でプロジェクトを行うことになり,私
たちが研究してきたことが突然実際のユースケース
となったのです。2年間検討してきたメタデータにつ
いて図書館の人たちに話したところ,彼らは目録デー
タ(catalog data)と呼んでいましたが,私たちと同
じ問題を150年間も抱えていたのです。これは面白い
と思い図書館分野にかかわるようになったのです。
Jan Brase氏 略歴
ドイツ国立科学技術図書館(TIB)EU リサーチリエゾン
オフィサー(Research Liaison Officer)
1999年ハノーバー大学数学専攻学士,2005年同大学コ
ンピューターサイエンス専攻博士取得。専門分野はメタ
――世界的なネットワークのためにどのような組織
データ,オントロジー,デジタルライブラリー。1999 ~
2003年ハノーバー大学情報システム部門,2004年同大学
がDOIとDataCiteをサポートしているのでしょうか。
L3Sセンターを経て2005年1月~ 2006年8月TIBでデジタル
またDataCite設立と発展の経緯もお話しください。
ライブラリーの研究に携わる。2006年9月~ 2009年12月
B r a s e氏:D a t a C i t eはデジタルオブジェクト識別子
(Digital Object Identifier: DOI)の登録機関の1つとし
て出版業界も含め各界から多くのサポートを受けてい
TIBのDOI登録機関としての活動を統括する。
2010年1月 ~ 2014年12月DataCiteのExecutive Officerお
よびInternational DOI Foundation(IDF)の委員長(chair)
。
2015年1月 か ら 現 職。 ま た 現 在,International Council for
Scientific and Technical Information(ICSTI)の会長(president)
ます。
現在会員は31機関です。
ジャパンリンクセンター
なら び にCODATA Task group on Data Citationの 副 委 員 長
(J a L C)注2),大英図書館,T I Bなど22機関が正会員で,
(Co-Chair)
。2011年にドイツの “図書館ハイテク賞” を受賞。
DataCiteのローカルノードとして機能し,DataCiteの
サービスを自国で提供しています。この正会員が世界
発足し,データに識別子を登録する図書館が必要だ
中で350のデータセンターと協働しています。
という結論に至りました。T I Bがこのプロジェクトに
残りの9機関は準会員です。マイクロソフトリサー
加わることになり,私もちょうど博士課程を終えた
チ,Digital Curation Centre,ハーバード大学など
の組織,さらにD a t a C i t eと共通する利害はあっても
D O I登録は積極的に行っていないものもあり,I E E E
(Institute of Electrical and Electronics Engineers)な
どが含まれます。さらにre3data,Databibのように
D a t a C i t eを支援してくれる組織とは,関連分野での
協働のための覚書を交わしています。つまり会員は,
科学者のデータ公開を手助けし,データセットを引
用可能にするという明確なミッションを共有する組
織の集まりで,世界に広がっています。
歴史をちょっとお話しする1) と,2003年にドイツ
研究振興協会(Deutsche Forschungsgemeinschaft:
D F G)注3)の資金援助によりデータ公開や引用の可能
性を探るプロジェクト(Citability of primary data)が
872
図1図1 DataCiteをとり巻く構造
☆☆☆
B
インタビュー:研究データの共有と活用の基盤整備をめざして
ところで,参加することになりました。
タにDOI登録を行っています。米国も全米をカバーす
2004年にT I BでデータへのD O I登録を開始し,その
る1つの中央図書館や機関がないため,3機関が会員
後ドイツ国内のデータセンターのデータへのDOI登録
となっています。もちろん,まだ会員のない国もあ
が順調に進んでいくと,海外のデータセンターが接
ります。
触してきました。スイス,イギリス,そして米国のデー
タセンターまでもが,データへのD O I登録に関心を
――グローバルな組織が話題になる場合,グローバ
もっていたのです。ところが,海外のデータセンター
ルな大義に自国の資金を提供する必要があるのかが
の研究助成機関は,自国だけでも提供できるかもし
問題となります。なぜ税金を使うのか,その支出か
れないサービスのためにドイツの機関に資金を出す
らどのような利益が得られるのかというものです。
ことに難色を示しました。科学をグローバルにより
Brase氏:DataCiteのよいところは,DataCite自体が
よくできるアイデアが見つかったというのに,国境
非常に小さな組織だということです。現在スタッフ
という問題があったのです。データ引用を実現した
はたった2名で,
比較的少ない費用で運営しています。
ければ,国ごとのレベルではなくグローバルに活動
費用の内訳は,国際D O I財団(t h e I n t e r n a t i o n a l
しなければならないことがわかりました。
そこでスイスやイギリスの図書館と会合を開き,
DOI Foundation: IDF)へ支払うライセンス費用,私
自身と他の職員の給与,それに旅費です。各国の会
協働でプロジェクトを行えないか話し合いました。
員が作業の大部分を行うので,DataCiteの予算はわず
科学はグローバルなもので科学者はグローバルに研
かで済みます。また会員が支払う費用の大部分は自
究を行っていますが,自国のネットワークの一部で
国の人件費とインフラに使われるので,その国の利
もあります。科学者は,自国の大学や研究所の一員
益となります。会費と引き換えにライセンスを得て,
として国の助成を受けているため,自国を代表する
自国のシステムとグローバルなシステムの一部とな
窓口が必要だと考えていました。そこで2008 ~ 2009
れるのです。
年にコンソーシアム設立の動きが広がりました。
2008年にはヨーロッパの図書館6館が私たちとの協業
――現在D a t a C i t eにはどれくらいのデータセットが
に関心を寄せ,2009年には世界中の機関と会合をも
登録されていますか。
ちました。同12月,ロンドンにグローバルなコンソー
Brase氏:370万件のDOIがあると思います。データセッ
シアムであるDataCiteを設立したのです。
トの定義にもよりますが。DataCiteではデータセット
D a t a C i t eのネットワーク体制は階層構造をもつと
を非常に広く定義しています。大部分は,誰もがデー
いう点ではインターネットとよく似ていますが,詳
タと理解できる数字が並んだ表のデータです。さら
細はもっと複雑です。たとえば,ドイツや米国のよ
に従来の学術出版以外の科学情報,すなわち研究や
うにDataCiteの会員が複数の国もあります。歴史的ま
研究者に影響や刺激を与えるものすべてを科学情報
たは構造的な理由からです。ドイツは連邦国家なの
と考えています。
で,1会員に絞るのは難しいのです。T I Bのミッショ
この中には,測定データ,写真,ビデオ,プレゼ
ンの1つはデータにD O Iを登録することですが,対象
ン資料などが含まれます。1つの定義として,研究の
は科学技術関係のデータに限られています。そのた
動機づけとなるものはすべて研究データとなるとい
め,ドイツ国内の他の会員であるドイツ国立医学中
うことです。DataCiteには,DOIを登録し目録に収録
央図書館(ZB Med),ドイツ経済学中央図書館(ZBW)
,
しているオブジェクトが370万件あるといえます。
ドイツ社会科学センター(GESIS)が各専門分野のデー
2014年末までにオブジェクトを400万件まで増やした
情報管理 vol. 57 no. 12 2015
873
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
いと考えています注4)。
インフラの構築を始めました。新しいDOIがCrossRef
2004年に最初のDOIを登録し,その5年後,まだTIB
に登録されると,C r o s s R e fは参照文献リストを確認
しか始動していなかったのですが,70 ~ 80万件に増
し,DataCiteのDOIがないかどうか調べます。同様に,
えました。DataCite設立の2009年には,100万件から
DataCiteはDOIの登録や更新があると,CrossRef用の
200万件に増えました。そして2年前,250万件まで増
メタデータを確認するといった具合に情報交換を行
加しました。2013年9月には300万件だったのが,こ
います。
の1年で100万件以上増加し,急激に伸びています。
そのためのインフラを2015年の上半期に確立した
いと考えています。DataCiteのメタデータが閲覧され
――では,DOIの解決数はどれくらいなのでしょう。
ると,他のオブジェクトに関係するDataCiteのDOI数
つまり,どれくらいの人がデータへのアクセスのた
を調べます。現在,DataCiteの約50万件のDOIが他の
めにDOIを利用しているのでしょうか。
オブジェクトに関係しています。関係とは引用を意
B r a s e氏:おおまかな統計データによれば,解決数は
味しています。補足的な関係は引用の一部となりま
通常月100万件です。2013年には,1年で1,000万件で
す。このことからDataCiteの数十万件のデータセット
した。解決数は増え続け,2014年夏にはたしか月100
が出版に結びついていることがわかりますが,これ
A
万件をちょっと超えるくらいでした。
はDataCiteが把握している情報の一部にすぎず,実際
はこれよりはるかに大きな数値かもしれません。
――ところで,DataCiteの名前が記載された論文がど
のくらい発行されているか数えたことはありますか。
2. データ公開の重要性と技術
B r a s e氏:常に参考文献リストにアクセスできるとは
限らないので簡単ではありません。そこで他の機関
――データ引用の必要性をどのようにお考えですか。
との提携を始めたのです。データ引用索引にDataCite
B r a s e氏:データを引用可能にするという考えはかな
のデータセットを多数使用しているトムソン・ロイ
り古くからありました。科学技術分野の論文引用に
ター社のData Citation Index注5)と契約したばかりで
B
関しては300年もの歴史をもつ確立したシステムがあ
す。同社が参照数をカウントし,D a t a C i t eのデータ
ります。科学者は論文執筆以外の仕事も行うにもか
セットが実際に引用されると,同社がチェックして
かわらず,それを取り扱えないこのシステムには欠
くれます。またCrossRefとも協働のための契約に至り,
陥もあります。データ収集は科学者にとって重要な
図2 DataCiteと連携する研究データ公開機関のグローバルな構造
図2 ☆☆☆
874
インタビュー:研究データの共有と活用の基盤整備をめざして
科学研究の一環ですが,論文のようには認められず,
注目されないのは残念なことです。
ツの移行が保証されます。
D O Iは目で見える部分は小さな文字列ですが,そ
国際極年から国際地球観測年への拡張(1957 ~
の背後には多くの組織が参加している大きなネット
1958年)を機にWorld Data Centerが設立されました
ワークがあります。DOIの魅力は,技術だけでなくこ
が,当時はデータ公開をサポートする技術がありま
の組織のネットワークが信頼や契約も提供するとい
せんでした。データ公開の考えは50年前からありま
うことです。DataCiteはこの協働イニシアチブの枠組
したが,この15 ~ 20年間でインターネットや新しい
みを提供しています。
テクノロジーが開発され,データ公開をサポートす
る技術が突然手に入ったのです。
原則的にはD O IはH T T Pと,インターネットに依存
したものに深く埋め込まれています。DOIはインター
ネットベースの技術なので,現時点ではインターネッ
――データ公開の技術についてお聞かせください。
トなしではまったく意味がありませんが,インター
B r a s e氏:2つの技術があります。1つ目はH T M Lの技
ネットベースである必要はないのです。仮に数十年
術です。データセットを引用可能にするには,デー
後にインターネットがなくなり,想像もつかないよ
タセットを保管できるシステムを用意し,利用者に
うな技術が開発されたとしても,DOIがそれに適応で
公開し提供しなければなりません。これは通常イン
きる可能性は十分にあります。文字列をH T T Pと切り
ターネットのH T M Lページで行われます。H T M Lを利
離し,別の何かに取り付けて,新たな技術を利用す
用してW o r l d W i d e W e b(W W W)からデータへア
ることも可能です。
クセスできる機能は重要な技術です。2つ目はD O Iで
す。DOIは,データへのリンクが安定していて,
「404
3. データ引用をめぐるステークホルダー
not found」のエラーが起こらないよう保証する永続
的な識別子です。D O Iシステムは1998年に創設され,
――研究分野によってはデータ引用の受け入れに時
2004年にTIBはデータへのDOI登録を始めました。
間がかかるなどということはありますか。
B r a s e氏:それは大きな問題の1つです。すべての研
――デジタル技術は急速に発展し,デジタル方式で
究分野に共通の類似点はなく,研究分野ごとにデー
記録したものは長期保存できないという理由から,
タの定義やその取り扱い方について独自の方法があ
識別子について多くの人が懐疑的になっています。
ります。たとえば,地球科学では幸運なことに,デー
DOIをより長く利用するために,どのような仕組みに
タに関して非常に優れた定義があり,データの取り
なっているのでしょうか。
扱い方も素晴らしいのです。地球科学者は,今日の
B r a s e氏:D O Iシステムは識別子という技術だけでな
天気は明日計測できないので,今日,データを作成
く,技術にもとづく信頼性のある関係機関が集まり
しておかなければなりません。将来的に不要かもし
運用する基盤です。たとえば,DataCiteでDOIを登録
れませんが,データを収集・保存しておきます。10
するとD a t a C i t eの会員組織がD O Iに付随しているの
年後にこのデータをもとにしてその日の天気を予測
で,リンクの安定が保証されます。会員同士,会員
するかもしれません。つまりこの分野にはデータを
とデータセンターとの契約により,協働してコンテ
収集し,保管し,利用するという伝統があり,この
ンツを永続性のあるものにします。たとえば,現在
基本こそ,データ公開や引用の優れた事例なのです。
D V Dに保存されているコンテンツは,将来技術が変
化学の場合,古典的な実験論文のデータを公開し
わった場合でも他のプラットフォームへのコンテン
ないかと科学者にもちかけても,誰も興味を示しませ
情報管理 vol. 57 no. 12 2015
875
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
――データセンター,図書館,DOIは出版社に広く利
用されているというお話でしたし,もちろん研究コ
ミュニティーもそうです。今後のデータ引用のステー
クホルダー(利害関係者)としては,どのような人
たちが考えられますか。
B r a s e氏:忘れがちなのですが,学術雑誌の編集委員
会が興味深いステークホルダーの1つになるでしょ
う。編集委員会は科学者にデータの公開やデータを
引用した論文の執筆を促すべきです。編集委員会は,
データ引用を利用した論文の提出を科学者に要求す
んでした。なぜなら実験の手法は論文に書いてある
るという重要な役割を担っています。また,科学関
ので,データは実験から得られると考えるからです。
連団体も同様の活動を行い,会員に優れた手本を示
別の科学者は特許の問題や巨額の価値がある新しい
すことができるでしょう。
実験だから,という理由でデータを共有しようとしな
研究助成機関も重要な利害関係者です。2003年か
いのです。また医学研究者は,患者に対する守秘義
らのプロジェクトも,研究助成機関であるドイツ研
務が守れないという倫理的問題を抱えています。
究振興協会の利益となりました。同協会は,極地調
分野ごとにそれぞれ問題があり,すべての問題を
査のために北極探査船ポーラースターのような船舶
解決できる共通の方法はなく,各分野に独自のワー
に何百万ユーロという資金を投入していました。北
クフローが必要です。エンバーゴ(公開禁止)期間
極海に出航し多くの観測を行い,船の建造費を含め
の設定も必要です。たとえば,天文学者にとって一
航行中は1日約100万ユーロかかる計算になるでしょ
番の恐怖は,自分たちの天体の観測値を公開すると,
う。何らかの理由でデータが利用できなくなったり
一般市民が新しい惑星を発見して名前を付けてしま
紛失したりしたら,資金がすべて無駄になってし
うかもしれないことです。天文学者は,「データを収
まいます。プロジェクト報告書という形でプロジェ
集したのは私なのに,データを分析する時間がなかっ
クトの結果だけは見られたとしても,実際の結果で
たために,別の人が惑星に名前を付けてしまった」
あるデータを失ってしまったら多額の投資が無駄に
と考えます。このような理由から天文学分野では半
なってしまいます。
年間のデータのエンバーゴ期間が設けられています。
研究助成機関からデータとプロジェクトの結果す
データ引用の利点は,誰もが理解できるモデルだ
べてを公開するようにと言われたときに,DataCiteは
ということです。科学者は論文には必ず引用を記載
そのためのインフラを提供します。結果を公開する
するので,論文が他の科学者に引用され評価が得ら
場はありますし,どこに公開すればよいのか提案し,
れることを知っています。科学者に「データはどうし
D O Iを登録します。これでデータは引用可能となり
ますか。あなたのもう1つの成果ですよ」と伝えるこ
一挙両得です。研究助成機関は「プロジェクトに100
とが大事です。科学者なら誰でも,データも公開す
万ユーロ出資したのだけれど,これがその結果だ。
れば,データ引用により評価が得られるということを
これらのデータセットがプロジェクトの成果なのだ」
理解できます。このわかりやすさによりデータ引用が
と言えるのです。一方,研究者は「プロジェクト終
あらゆる分野で世界的に機能しているのです。
了時に時間がなくて論文は書けなかったが,こんな
実験をした。実験データを公開して引用可能にすれ
876
インタビュー:研究データの共有と活用の基盤整備をめざして
ば,データ引用によって認められるようになるのだ」
[DKRZ],Deutsches GeoForschungsZentrum [GFZ])
と言えるのです。
は,同じ分野であるにもかかわらずメタデータにつ
話は変わりますが,研究者の間に労働分業が生ま
いて合意に達することができませんでした。DataCite
れています。たとえば,先ほどのポーラースターの
のメタデータには引用に必要なデータが含まれてい
例では,1日中データを収集している科学者は詳細を
るので,最終的には,階層化したアプローチを取り,
分析する時間も論文を書く時間もないわけです。こ
情報を追加することができましたが。
れまで論文を書いて名声を得るのは必ずしもデータ
従来の項目は,標題,著者名,出版者,日付,識
を収集した科学者ではなかったのですが,研究デー
別子(DOI)で,さらに推奨される項目は,抄録やコ
タの引用によって,このような科学者が突如名声を
ンテンツタイプ(テキスト,写真,番号付データセッ
得ることができるようになるのです。
トなど)です。重要なメタデータ項目の1つに関係要
4. メタデータに対するDataCiteの取り組み
素があります。関係要素はオブジェクト間の関係を
記述するもので引用も含まれます。ほかの項目も含
めると,全部で25項目になります。
――メタデータに対するD a t a C i t eの取り組みについ
メタデータ・スキーマの最新版3.1注6) が2014年10
てもお話しください。私は社会学者ですが,1980年代,
月17日(インタビュー当日)にリリースされたばか
社会学者間のデータ共有など,当時はまだ方法が確
りです。この中には基本的な核となるメタデータが
立していなかったので,メタデータに何を記述すれ
うまくまとめられています。DataCiteに登録する各オ
ばよいのか,何を記述してはいけないのか,わから
ブジェクトにはこれらの要素が必要で,すべてに関
ないことだらけでした。現在は状況が違っていると
して概要を知ることができます。詳細を知りたい場
思いますが,いかがでしょうか。
合は,特に社会科学に関しては,研究分野のレベル
B r a s e氏:さまざまな分野が存在し,データ公開の
まで掘り下げなければなりません。この分野にはDOI
ワークフローすべてに適用できる共通の解決方法は
を利用した非常に優れたメタデータ構造があり,分
あ り ま せ ん。 メ タ デ ー タ も し か り で す。2003年 の
野内でうまく機能している独自のメタデータ・スキー
プロジェクト開始当初,地球科学分野の3つのデー
マがあります。もし社会科学分野に関するすべての
タセンター(Alfred-Wegener-Institut für Polar-und
データセットのメタデータを目録に収録すれば,一
Meeresforschung,Deutsches Klimarechenzentrum
部のユーザーにのみ公開している追加のD O I項目が
あったとしても,D O Iを利用してデータセンターの
ページにたどり着けば,完全なDOIの情報を入手でき
るというわけです。
問題は「メタデータを何に利用するのか」ですが,
メタデータはユースケース次第で非常に役立つもの
になります。プロジェクト開始当初は,すべてのデー
タセットのメタデータを収録するデータベースを構築
すれば,データを検索し比較することができると考え
ていました。しかし,実際はさまざまな異種のデータ
が含まれているため無理でした。その代わりDataCite
のメタデータ・スコアを利用して,基本的な書誌メタ
情報管理 vol. 57 no. 12 2015
877
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
データ(著者名,標題,抄録など)の検索ができ,1
明したデータセットなどを提供できます。その中に
つの事柄に関して概要を得ることができます。
興味のあるデータがあれば,目録から該当するデー
Journal of Information Processing and Management
データセットを科学的に比較したい場合は,デー
タをクリックし,データセンターへと導かれ,その
タセンターレベルで検索しなければなりません。こ
データセンターで調査を続けることができます。し
のためデータセットのD O Iを解決する際に必ずデータ
かしそれでも,図書館が情報への入り口だと考えま
センターへと導かれるようになっています。データセ
す。なぜならば,図書館は先頭アドレスであり,幅
ンターは,科学技術分野の検索に対応できる完全か
広い種類の情報を提供するからです。もっと詳しく
つ幅広いメタデータを提供します。たとえば,
「30歳
知りたいと興味が湧くものが見つかったら,さらに
の日本人男性と30歳のドイツ人男性を比較したすべ
詳しい情報を所有するデータセンター,ピクチャー
ての研究を知りたい」などの検索は,データセンター
ギャラリー,大学のリポジトリなどを図書館が教え
レベルで解決できます。DataCiteではデータの範囲が
てくれます。
広すぎて,集中して行うことはできないのです。
5. 図書館の変化,そしてライブラリアン
の役割と情報教育
――図書館は,データセンターが所有するデータの
メタデータをサービスの一部として組み込まなけれ
ばならないのですね。
Brase氏:そうです。DataCiteは図書館とデータセン
――現在は科学知識の中心的存在が図書館からデー
ターが協働すべきと考え,積極的な活動を行ってい
タセンターへと移行している転換期なのでしょうか。
ます。DataCiteは図書館の目録情報にマッピング可能
B r a s e氏:おそらく完全には移行しないでしょう。先
な,メタデータに関する書誌情報を提供しています。
ほど述べたように,複雑な検索にはデータセンター
コンテンツ自体は別の場所にあったとしても,永続
を利用しなければなりませんが,ほとんどのデータ
性のある識別子によって図書館目録で一括して検索
セットは図書館の目録を通じて入手可能です。図書
できるのです。
館には幅広くさまざまなコンテンツタイプがあるの
従来の図書館では目録は所蔵資料への窓口でした
で,今なお重要な場所です。たとえば,「光合成につ
が,技術の進歩によって,所蔵していないたくさん
いて知りたい」といった基本的な情報要求に対して,
のコンテンツも案内できるようになりました。もは
出版物,論文,ビデオ,細胞中の光合成の測定を説
やデータを保存する必要はなく,データを記述する
メタデータとデータセンターへの永続的なリンクが
必要なだけです。データセンターと信頼できる契約
関係を構築しなければなりません。D a t a C i t eも協働
し,図書館にコンテンツのD O Iを提供するので,図
書館はD O Iを解決しコンテンツを提供可能な状態に
する必要があります。コンテンツを変更した場合は
DataCiteに連絡し,DataCiteの目録にメタデータが収
録されるようにします。あるユーザーからの検索に
関連するコンテンツがデータセンターにあるとしま
す。図書館がDOIを使ってそのデータセンターにリン
クすると,ユーザーはデータセンターとして機能す
878
インタビュー:研究データの共有と活用の基盤整備をめざして
る図書館に誘導され,そこで検索ができます。しか
ラムです。その1つはデータサイエンティスト向けの
しユーザーにとっては図書館が検索を開始した場所
基本コースで,データサイエンティストのトレーニン
なのです。
グ教材に図書館学の基本が必ず含まれるよう望んで
います。データ引用の新しい時代に対応するために,
――大学のデータセンターに保管しているかなりの
ライブラリアンや科学者への教育をどのように行え
量のデータを公開し,他の科学者に引用や利用をし
ばよいのか,考えを聞かせてください。
てもらうには,信頼できる図書館にデータセンター
B r a s e氏:図書館は転換期にありライブラリアンの役
をリンクしなければならないということでしょうか。
割は進化を続けているので,ドイツでも図書館教育
B r a s e氏:それはインフラの1つです。データを保管
がそのペースに追いついていくのは大変です。現在
する物理的な場所は変わりません。理想は大学にデー
図書館で働く人の多くが私のような部外者です。私
タを保管する永続的なリポジトリがあり,質のよい
はコンピューターサイエンス出身ですし,異なる分
メタデータを所有していることが望まれます。リポ
野出身の人が図書館で働くことは珍しくありません。
ジトリ自体が信頼できるデータセンターに相当する
図書館情報学はライブラリアン向けに,より高度
のです。必要なのは若干の仕組みの追加と契約関係
なコースを用意できると思います。また,いまはど
だけです。さらに理想を言えば,大学と図書館が協
の学科でも多かれ少なかれデータを扱いますが,デー
働し合意に達することです。大学側がリポジトリで
タを扱う学科のある大学の科学者や科学技術を専攻
データを保管し,引用を可能にし,一般に公開する
している学生は全員,何らかのデータ管理コースを
ことです。
取るべきです。大学はすべての科学者,あるいは少
なくとも博士号をもつすべての科学者にデータ管理
――多くの人が論文を検索するとき,最初にG o o g l e
コースを提供して,データ保管の技術,データのさ
Scholarを使用しています。探しているデータをキー
まざまな形式,データ保管の多様な方法,データ公開,
ワード入力するだけで結果を表示するような大きな
メタデータなどについて教えるべきです。このよう
検索エンジンが出現すると思いますか。
な基本は,ライブラリアンだけでなく全科学者向け
B r a s e氏:可能性はあります。個人的な見解ですが,
のカリキュラムに組み込まれるべきだと思います。
Google Scholarのようなものは素早くおおざっぱな検
索には適していて,ある程度の概略は得られるでしょ
――ライブラリアンと研究者の関係が変わっていく
う。しかし特定の情報を深く掘り下げて探す場合は,
のですね。ライブラリアンの役割についてどのよう
図書館に軍配があがります。Google Scholarはあらゆ
にお考えですか。
るものに関して幅広い情報を提供していますが,図
B r a s e氏:ライブラリアンは情報の入手方法や検索方
書館が提供する結果は精選した一握りの情報だから
法にたけているので,情報のゲートキーパーとして,
です。熟練したライブラリアンがメタデータを記述
学生にとって重要な存在です。ポケットに収まる小
し,コンテンツを選択し,アドバイスを行っている
さな機器で世界中のあらゆる情報にアクセスできる
お陰です。
時代となり,学生はあふれる情報の流れの中で途方
に暮れています。情報とは何か,どのように情報を
注7)
――研究データ同盟(Research Data Alliance: RDA)
保管するのか,情報にどう対処するのか,情報にど
の総会によく出席しますが,研究データの共有に積極
のように注釈を付けるのかといった技術は,ライブ
的なライブラリアンたちの話題はトレーニングプログ
ラリアンが従来もっている資質なのです。図書館は
情報管理 vol. 57 no. 12 2015
879
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
基本的な情報トレーニングを学生に提供し,もっと
術分野の伝統的な学術出版システムにはバックサイ
積極的に大学における役割を果たすべきです。ライ
ドがあることに誰も異論はないと思います。科学者
ブラリアンは国内外のネットワークの要であり情報
の立場から納得できない点があるからです。自分の
の大海での水先案内人なのです。
論文を提供して,その論文に対して購読料を支払わ
Journal of Information Processing and Management
ドイツの国立図書館は膨大な所蔵資料をもち,コ
ンテンツの大部分はインターネットからアクセス可
能になっています。そこで地域の小さな大学図書館
なければならず,同僚や著者や出版社と共有するこ
ともできないのです。
データ公開を始めた当初から,科学者の要望は,
がいまだに必要かという疑問が湧きますが,私は必
論文出版で起こったことをデータで繰り返さないよ
要だと考えます。科学者はローカルなインフラの一
うに,データの公開を前提とし,出版社ではなく大
部です。たとえば,日本の科学者がグローバルに活
学や学術コミュニティーが主体となって進めようと
動しても,彼らは国の助成を受けた日本の一員であ
いうものでした。これはとてもうまくいきました。
り,研究を行っている地域の大学の一員でもあるか
最初からデータを完全公開とし,データセンターと
らです。
協働してコンテンツを自由に入手できるようにし,
仲間の科学者と会うことができ,疑問について手
助けしてくれるライブラリアンがいる地域の場所,
データの引用やデータへのアクセスを可能にしたの
です。
図書館があれば,そこへ行って「昨年北米で会議が
もちろん,倫理的な理由からデータを完全には公
あって,こんな話が出たと聞いたのですが,抄録を
開していないデータセンターもありますが,ほとん
探すのを手伝ってくれませんか」と尋ねることがで
どすべてのデータは公開されています。DataCiteは出
きるのです。Google Scholarで探すよりよほど手っ取
版社とも協力しているので,たとえばエルゼビアの
り早い方法です。
提供する論文の根拠データにもアクセスすることが
6. データ公開と出版社の動向
できます。ScienceDirectを契約していなければ,論
文の抄録のみ閲覧可能で,論文自体にアクセスする
には20ドル支払わなければなりませんが,データへ
――出版社の動向はどうでしょうか。たとえば,出版
のリンクが表示されており,データには無料でアク
社が論文の著作権を所有しているかぎり,論文の購
セスできます。つまり論文に対する権利はなくても,
読料を払わなければなりません。また出版社が収集
データを閲覧する権利はあるのです。このようにデー
を始めたデータについても懸念があります。大手出
タへのアクセスが非常にうまく機能していることを
版社の論文にデータを掲載すれば,出版社のサーバー
誇りに思っています。出版社さえもこのシステムに
やリポジトリにデータを保管するよう勧められるで
敬意を払っています。
しょう。この場合,たとえば数値データには著作権は
880
2007年のブリュッセル宣言注8)で,S T M出版社は,
発生しませんが,ビデオや写真には原則として著作
根拠データへのアクセスは自由にできるようにする
権が発生します。所属大学のデータセンター,
図書館,
べきであると宣言しました。出版社の定義による「自
機関リポジトリなどにデータを渡せば,著作権問題
由にできる」や「根拠データ」の意味においてですが。
の観点からもデータによりアクセスしやすくなりま
現在では出版社とDataCiteとの契約を通して,データ
す。このことに関して見解をお聞かせください。
に登録されたDOIを表示し,論文からデータをクリッ
B r a s e氏:そのとおりです。それはある意味,当初か
クでき,それが生データの場合,著作権や購読料も
らDataCite設立の目的の一部でもありました。科学技
発生せず,無料となりました。DataCiteが存在したか
インタビュー:研究データの共有と活用の基盤整備をめざして
らこそ実現したのです。
ただし商業出版社が有料の追加サービスを提供す
も し10年 前 に 出 版 社 が10億 ド ル で1つ の デ ー タ
ることは容認しています。たとえば,トムソン・ロ
アーカイブを作成し,すべてのデータをそこに保管
イター社のData Citation Indexのほとんどのデータは
し,データのアクセス料に20ドルを課金すること
無料で入手可能ですが,追加サービスは有料です。
にしよう」と決めていたら,私たちがここに座って
データを見やすく視覚化したり,あちこち閲覧でき
いることもないし,状況も違ったでしょう。実際に
るモデルを作成したりといったサービスは有料とな
はD a t a C i t eが創設されインフラが構築されました。
るわけです。データに加えて追加のサービスを提供
DataCiteが多くの先例を作り,多数のデータセンター
するのであれば課金してもよいと思います。しかし,
が稼働し,データが無料であることに科学者が慣れ
根拠データは無料であるべきで,科学者が望んでい
てしまったため,もはや出版社はこの状況を変える
ることであり,DataCiteが確立したことなのです。
ことはできません。
本文の注
注1)
TIB http://www.tib.uni-hannover.de/en/
注2)
JaLC https://japanlinkcenter.org/top/doc/141031_1_kobayashi.pdf
注3)
Deutsche Forschungsgemeinschaft(DFG)日本代表部 http://www.dfg.de/jp/index.jsp
注4)
2015年1月末現在,430万件に達した。
注5)サイテーション・インデックス(引用索引)について http://ip-science.thomsonreuters.jp/ssr/citation_
indexing/
注6)
D a t a C i t e, メ タ デ ー タ ス キ ー マ バ ー ジ ョ ン3.1を 公 開 h t t p : / / j o h o k a n r i . j p / s t i u p d a t e s /
education/2014/10/010428.html
注7)
Research Data Alliance https://rd-alliance.org/
注8)
Brussels Declaration on STM Publishing http://www.stm-assoc.org/2007_11_01_Brussels_Declaration.
pdf
参考文献
1) Brase, Jan; Sens, Irina; Lautenschlager, Michael. "The Tenth Anniversary of Assigning DOI Names to
Scientific Data and a Five Year History of DataCite". D-Lib Magazine, 2015, vol. 21, no.1/2. doi: 10.1045/
january2015-brase, (accessed 2015-1-20).
情報管理 vol. 57 no. 12 2015
881
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
音声の障がい者のための最先端音声合成
技術
Advanced speech synthesis technologies for vocal disabilities
山岸 順一1
YAMAGISHI Junichi1
1 国立情報学研究所 コンテンツ科学研究系(〒101-8430 東京都千代田区一ツ橋2-1-2)Email: [email protected]
1 Digital Content and Media Sciences Research Division, National Institute of Informatics (2-1-2 Hitotsubashi Chiyoda-ku, Tokyo
101-8430)
原稿受理(2014-12-25)
情報管理 57(12), 882-889, doi: 10.1241/johokanri.57.882 (http://dx.doi.org/10.1241/johokanri.57.882)
著者抄録
本稿では,統計的音声合成技術および声質変換技術の医療・福祉応用に関し,最先端研究成果をわかりやすく紹介する。
筋萎縮性側索硬化症(A L S)等により発声機能を失いつつある障がい者の声をコンピューターに模倣させ,障がい者本
人の声で音声出力を行う音声合成技術や,電気式人工喉頭を利用した喉頭摘出者や構音障がい者の声を自然で聞き取
りやすい音声へリアルタイムで変換する技術等,新たな研究が音声情報処理分野において近年積極的に行われ,音声
の障がい者の QOL 向上に貢献すると考えられる顕著な研究成果も存在する。喉頭摘出者および ALS 患者によるケース
スタディーを紹介した後,現在の研究課題についても概説する。
キーワード
音声情報処理,テキスト音声合成,声質変換,声の障がい,生活の質,QOL
1. 音声合成とは
出力機能等があげられる。
音声合成の歴史は古く,1939年に米国ベル研究所
音声合成は,漢字仮名交じり文(以下,テキスト)
882
で開発された,白色雑音とブザー音のみから人工音
さかのぼ
を自然で聞き取りやすい人間の声に変換する技術で
を作るボコーダー(Vocoder)まで遡る1)。初期の音
あり,テキスト音声合成(text-to-speech),TTSとも
声合成が映画等でよく利用されているためか,人々
呼ばれる。音声を自動で認識しテキストに変換する
の音声合成に対する印象には,いまだこれら半世紀
音声認識と同様,社会においてさまざまな形で利用
以上前の合成音声の影響が残っているようである。
されている。その応用例として,カーナビゲーション,
その後,1970 ~ 1990年代にフォルマント音声合成,
視覚障がい者のスクリーンリーダー機能,モバイル
ダイフォン音声合成,波形接続音声合成というよう
端末で利用されている音声対話エージェントの音声
な合成方式が発明され,合成音声の品質は劇的に改
音声の障がい者のための最先端音声合成技術
善されていった。技術的に興味のある方は,参考文
ている部分,定常な部分,次の音素への遷移を開始
献2),3)を参照されたい。
している部分等に自動的に区分化し,それぞれの区
その後,次章で概説する機械学習を利用した統計
間の音響的特徴量をガウス分布などのパラメトリッ
的音声合成が提案され4),さらなる合成音声の品質
ク確率分布で表現する。この隠れマルコフモデルは
向上はもちろんのこと,単にテキストを読み上げる
音声認識でも大変よく利用されている10)。
以外の新たな機能を音声合成にもたせることについ
どのような音響的特徴量を隠れマルコフモデルの
てのさまざまな研究がなされるようになっている。
学習に利用するかは,どのように音声波形信号を再
その1例が統計的音声合成技術の医療・福祉応用5)で
構築するかにより決定されるが,よく利用される音
ある。たとえば,障がい者の声をコンピューターに
響 的 特 徴 量 と し て は, 基 本 周 波 数(F0) な ど の 音
模倣させる技術6),7),喉頭摘出者や構音障がい者の
源パラメーターと線形予測符号(L i n e a r P re d i c t i v e
声を自然な音声へ変換する技術8),9)といった,従来
Coding: LPC)やケプストラムと呼ばれるスペクトル
の音声合成の枠にとらわれない新たな研究が近年積
パラメーターがある。これらの音響的特徴量にかか
極的に行われ,音声の障がい者の生活の質(Q u a l i t y
る音声信号処理に関しては参考文献11)が詳しい。
of Life: QOL)の向上に貢献するであろう顕著な研究
成果も出はじめている。本稿では,まず,利用分野
この方式には,
(1)統計量および関数にもとづいて音声を生成す
が拡大している統計的音声合成について概説した後,
るため,音声波形を保持しておく必要がなく,
その音声合成技術の医療・福祉応用を,喉頭摘出者
たった数M Bで音声を合成できる。計算資源が限
および筋萎縮性側索硬化症(A m y o t r o p h i c L a t e r a l
られた環境下でも利用可能である。
Sclerosis: ALS)による構音障がい者を例にあげなが
(2)統計モデルはすべてパラメトリックである,
ら説明する。最後にユーザーからのフィードバック
つまり明示的に関数表現されることから,学習
についても紹介する。
により得られた関数集合を適切に変換すること
2. 隠れマルコフモデルにもとづく統計的
音声合成
により,声を操作することが可能である。感情
表現を変化させたり,後述する平均声のような
実際には存在しない声を作ったりすることも可
能である。
近年,研究界および産業界の両方において注目さ
上記のようなメリットがいくつもあり4),大変人気の
れている新たなテキスト音声合成方式として,隠れ
ある研究トピックになった。音声情報処理に関する
マルコフモデル(Hidden Markov Model: HMM)にも
有名な国際学会Interspeech2012において,76%の音
とづく音声合成方式がある4)。従来の波形接続音声合
声合成に関する論文が統計的アプローチを利用して
成音が,音素等の音声単位の波形データを接続する
いたこともこのトレンドを裏付けている。また,カー
ことにより,任意の文に対応する音声を生成する2),3)
ナビゲーション,携帯電話,スマートフォンでも広
のに対して,名古屋工業大学の徳田らにより開発さ
く用いられるようになっている。
れたこの音声合成では,音声単位の音響的特徴量を
時系列統計モデルの1つである隠れマルコフモデルに
3. 話者適応と平均声
より表現させ,その統計量から音声を再合成するも
のである。隠れマルコフモデルは,時間とともに変
統計的音声合成システムには,システム構築のた
化する音素の音響的特徴量を,前の音素から遷移し
めに収集しなければならない音声データ量という観
情報管理 vol. 57 no. 12 2015
883
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
点でも大きなメリットがある。それ以前の音声合成
必要であり,これらをある1話者でカバーするのは非
システムでは,数十時間~数百時間という大規模な
効率であるため,不特定多数の話者の音声データを
音声データを収録し,それらを注意深くラベル付け
幅広く集め学習に利用している。この不特定多数の話
した後,音声波形を探索・接続し,音声を合成する
者の音声から構築された合成音声は,
「平均声」と呼
方式を採用していた2),3)。そのため,合成音声の自
ばれ,その名前のとおり学習に利用した話者のまさに
然性は高いものの,話者や発話様式を変更する際に
平均的な声になっているが,アイウエオといった言語
は,その都度大規模音声データを再度収録する必要
情報は残されている16)。話者適応は,その平均声に
があり,そのたびに高額な収録コストおよびラベル
話者性を付与することを行う。大変興味深いことに,
付けという大変手間がかかる作業を行う必要があっ
音声の言語情報のモデル化に比べ,話者性の付与は
た。それゆえ,目的や状況に応じて,適切に話者や
少量で実現できる,と理解することもできる。
Journal of Information Processing and Management
発話様式を替え,音声を合成するといったことは現
実的には容易でなかった。
これに対し,統計的音声合成技術では,数分程度
この成功に伴い,音声合成の話者適応は,複数の
欧州連合(EU)第7次研究枠組み計画でも取り上げら
れ,音声翻訳システムをパーソナライズする技術17),
の少量の音声データをもとに,目標の話者や発話様
騒音化で音声を聞きやすく変換する技術18),19) とし
式を模倣・再現するいわば「声のクローン」が,話
てさらに高度化した。音声合成の適応技術は,話し
者適応と呼ばれる技術により実現可能となった。話
手や発話様式をただ替えるだけの付加技術ではなく,
者適応は,もともとは不特定多数の話者の利用が想
次世代音声合成の基盤技術になりつつある。
定される音声認識システムを特定のユーザーに適合
させる技術として提案された12),13)。不特定多数の話
4. 統計的音声合成技術の医療・福祉応用
者の音声データにより学習した隠れマルコフモデル
さいゆう せんけい
を,最尤線形回帰と呼ばれるモデル適応技術14)によ
音声合成の話者適応技術により,音声合成の医療・
り,目標話者にマッチするよう変換する技術である。
福祉応用も一段と進み,とりわけ,音声の障がい者
音声合成と音声認識は隠れマルコフモデルという
の個人用音声合成システム構築が,容易にそして現
共通の統計モデルを利用しているため,音声認識の
実的なものになると期待されている。以下では,音
技術は音声合成でも利用可能である。この話者適応
声の障がい,現在の意思伝達装置について言及した
技術を音声合成において利用することは,合成音声
のち,音声の障がい者の個人用音声合成システムと
の話者性や発話様式を変化させることに相当する。
して統計的音声合成を利用した最新のケーススタ
話者適応を音声合成において利用することで,たっ
ディーを紹介し,音声合成の最先端ではどのような
た数分という,従来必要であった音声データ量と比
応用研究がなされているかを紹介する。
べると極めて少量の録音データから「あの人の声」
「あ
のしゃべり方」による音声合成システムを作成でき
るようになった15)。つまり音声合成のパーソナライ
ゼーションの実現である。
884
4.1 音声の障がいの種類
音声・コミュニケーションに障がいを及ぼす病気・
症状は数多くある。音声の障がいを引き起こす主な
では,なぜ話者適応はたった数分で話者性や発話
進行性疾患には,A L Sやパーキンソン病,多発性硬化
様式を変換できるのか? それはアイウエオといっ
症などが知られている。脳梗塞などの脳神経障がい
た言語情報と話者性・発話様式を切り離しているから
によっても音声の障がいは引き起こされることがあ
である。言語情報の学習には大規模な音声データが
る。がん摘出手術などにより喉頭部,舌部などの音声
音声の障がい者のための最先端音声合成技術
生成機能を失った場合も,タイプは異なるが,発声の
障がいが残る。2005(平成17)年に行われた厚生労
4.3 話者適応を利用した障がい者本人の声による
音声合成システム
働省の調査によると,日本国内のパーキンソン病患者
障がい者本人の音声データを長時間収録すること
は14万5,000人にも及び,この患者数は超高齢社会に
は,本人の健康上の問題や時間的な制約から通常困
より増加すると危惧されている。音声の障がいは高齢
難を伴うため,少量の音声データから本人の声を再
者でなくても発症し,たとえば,A L Sは30 ~ 60代で
現することが望ましい。統計的音声合成の話者適応
発症し,約75%の患者が短期間に重度の音声障がい
技術を利用することで,音声の障がい者自身の音声
が引き起こされるという調査結果がある。
合成システムの構築に必要な音声収録が非常に短時
間になり,同時に,費用も安価なものになると考え
4.2 現状
られる。たとえば,喉頭摘出手術の直前に,数分の
重度の障がいが引き起こされた際,手の指先,目
音声データを録音し,それをもとに,手術後に利用
の動き,まばたき,頭の動きなどを利用して文章を
する個人用音声合成システムを作成することが可能
作成し,会話を補助する装置を障がい者用意思伝達
になる。また進行性疾患で声の障がいが進行する前
装置といい,フォルマント音声合成や波形接続音声
に,少量の音声データを録音しておき,個人用音声
合成などの標準的なテキスト音声合成システムがよ
合成器を作成することも可能になる。
く利用さている。しかしながら,現在市場にある障
そこで,2009年,英国シェフィールド大学の研究
がい者用意思伝達装置は限定された声質のみが “選択”
者と著者により喉頭摘出者とパーキンソン病患者の
可能であり,ユーザーの方言に対応したものでもな
音声合成システムの試作を行った6),22)。また2011年
く,また性別さえ限定されている場合もある。障が
には,著者と英国エジンバラ大学の研究者により,
い者用意思伝達装置ユーザーにとって音声合成はテ
A L S患者のための音声合成システムも試作した5)。
キストを読み上げるだけでなく,アイデンティティー
どちらのケースとも5 ~ 10分ほどのごく少量の音声
表現にも相当する機能であるため,障がい者本人の
データをもとに話者適応を行い,個人用音声合成シ
声の特質を表現することが可能な音声合成器を作成
ステムを構築した。患者および患者の家族から得ら
する試みがこれまでもいくつかなされている。
れたフィードバックは両ケースとも非常にポジティ
米 国 で は, ア ル フ レ ッ ド・ デ ュ ポ ン 小 児 病 院 の
ブな内容であった。
Nemours Speech Research Laboratoryが,個人用音
この結果を踏まえ,現在,著者およびエジンバラ
声合成システムの作成を行っている20),21)。ユーザー
大学では大規模な実証実験をスコットランドで行っ
は約2,000の文章を読み上げ,録音データをサーバー
ている。スコットランドの全ALS患者の10%に相当す
にアップロードする。数週間後に,1980年代に開発
る数十名のALS患者の音声を収録し,障がい者自身の
されたダイフォン接続方式による音声合成システム
声による統計的音声合成システムを利用した会話補
が利用可能になる。英国のC e r e P r o c,ベルギーのア
助アプリをi P a dなどのタブレットにインストールし
カペラ,日本のウォンツやA Iは,個人用音声合成シ
届けることで,音声の障がい者のQ O Lがどう変化す
ステム構築サービスを有償で提供している。これら
るか分析しようというものである。現時点では,病
の企業では波形接続音声合成を採用しており,自然
気が進行したことに伴い構音障がいを発症した30名
な合成音声を実現している。しかしながら,長時間
の患者に個人用音声合成システムを届け,音声合成
の音声を録音しなければならないという難点がある。
の評価を行っている最中である。現時点でフィード
バックを得ることができた15名の患者の平均評価ス
情報管理 vol. 57 no. 12 2015
885
情報管理
JOHO KANRI
2015
vol.57 no.12
http://johokanri.jp/
March
Journal of Information Processing and Management
コアは,明瞭性は5段階中4.2点,本人への類似性は5
段階中3.3点と,高スコアであった。またフィードバッ
ることが実験結果よりわかっている。
さらに,標準語を利用する障がい者だけでなく,
クがあったほぼすべての障がい者から,市販の音声
各地の方言を使用する障がい者にも個人用音声合成
合成システムよりも,この自分自身の音声合成シス
技術を利用してもらうための研究・取り組みも鋭意
テムを利用したいという回答も得られ,第25回国際
行っている。方言の影響により音素等の言語情報が
運動ニューロン病シンポジウム23)にて医療関係者向
各地で異なるため,話者適応の際にテンプレートと
けに研究発表も行った。障がいにより失われた,も
して利用される平均声を,各地の方言に合わせて構
しくは,失われつつある声を,個人の声の特質を表
築する必要があり,そして,平均声を各地で構築す
した音声合成技術により取り戻し,障がいにより悪
るためには,現地で不特定多数の健常話者を収録す
化してしまった社会的距離を多少なりとも縮めるこ
る必要がある。他の統計的方法論やデータサイエン
とが可能であることを示したとても有意義なケース
スと同様,統計的音声合成の性能を大きく左右する
スタディーであるといえる。
のは,利用する音声データベースのサイズであるこ
とから,英国では700名,日本では800名もの健常者
4.4 さらに利用者を増やすための研究
を各地で収録し,各地の方言を適切に表した平均声
音声をほぼ健常時の段階で短時間収録することが
を構築することで,個人用音声合成システムを構築
できれば,障がい者自身の声による音声合成システ
している。音声合成用コーパスとしては最大級であ
ムを構築可能であることを前述の結果は示している
るこのコーパスを活用することで,話者適応の変換
が,皮肉なことに,約25%のALS患者は,初期診断時
性能が向上することが報告されている26),27)。
ま
ひ
に,舌,のどの筋肉の力が弱まる球麻 痺症状をすで
に発症し,音声が不明瞭であるなどの構音障害を伴
5. 声質変換技術の医療・福祉応用
うことが多い。
886
個人用音声合成システムをさらに多くの障がい者
がん摘出手術などにより声帯・喉頭を摘出した場
に幅広く利用してもらうためには,このような構音
合は,調音機能は正常であるにもかかわらず,発声
障がいを伴った患者も対象とする必要があり,録音
が不可能になる。この場合,障がい者用意思伝達装
時に音声の障がいがすでに起こっているような場合
置でなく,外部から喉に振動を与える電気式人工喉
においても,高品質な個人用音声合成器が作成でき
頭を利用し,代替発声を行うケースも多い。習得が
るよう,音声合成技術を改善する必要がある。
容易であり,小さな補助器具等のみで再び声を出せ
録音時に進行性疾患がすでに声の障がいを引き起
るというメリットがある。また,習得は容易ではな
こしている場合,前述の話者適応アルゴリズムは機
いが,仮声門を利用した食道発声を行うケースもあ
械学習ゆえに,話者の声質だけでなく,声の障がい
る。しかしながら,どちらの代替発声も,健常者の
までも模倣してしまい,音声合成システムは音声障
通常音声と比較し,自然性および明瞭性が大きく劣
がいに似た特性をもってしまうことがわかってい
化し,また話者性も大幅に欠落してしまうことが知
る。それゆえに,現在,音声合成モデルから音声障
られている。
がいのみを取り除き,もとの自然で明瞭な音声を合
そこで,喉頭摘出者の代替発声を,音声技術により
成できるよう,話者性と構音障がいを要因化し,障
自然な音声へリアルタイムで変換し,
コミュニケーショ
がいを分離する研究も行われている24),25)。発展途上
ンを円滑にするという研究も奈良先端科学技術大学院
の技術であるが,合成音声の明瞭性が大きく改善す
大学の戸田らにより積極的に進められている8),9)。こ
音声の障がい者のための最先端音声合成技術
の代替音声から自然な音声への変換処理も統計的な枠
術の医療・福祉応用について紹介した。障がい者の
組みにもとづいて行われ,前述の統計的音声合成シス
声をコンピューターに模倣させる技術,喉頭摘出者
テムと原理は共通している部分が多い。音声合成では,
や構音障がい者の声を自然な音声へ変換する技術等,
各音素の音声単位と音響特徴量の対応付けを隠れマル
新たな研究が音声情報処理分野において近年積極的
コフモデルで表現していたのに対し,声質変換では,
に行われ,音声の障がい者のQ O L向上に貢献するで
入力音声の特徴量と出力音声の特徴量の対応付けを混
あろう顕著な研究成果も出はじめていることを,喉
合ガウス分布(Gaussian Mixture Model: GMM)とい
頭摘出者およびALS患者を例にあげながら説明した。
う統計モデルで表現する28)。戸田らは,この手法を用
今後は,喉頭摘出者およびALS患者のみならず,よ
いることで,食道発声および電気式人工喉頭を用いた
り多くの声の障がいに柔軟に対応できる統計的音声
発声による音声を,明瞭性が高く自然な抑揚も伴った
合成技術および声質変換技術を研究・開発し,音声
音声へリアルタイムで変換することに成功した29)。現
の障がい者のQ O Lを着実に向上していくことが課題
段階ではまだ基礎研究段階であるが,音声の障がい者
である。またこれらの次世代音声技術を必要なとき
の生活の質向上へ貢献するであろう顕著な研究成果で
に必要な場所で費用を気にせず利用するための社会
ある。
基盤を構築する必要もある。
このほか,脳性麻痺による構音障がい者の音声を,
個人性は保ったまま,明瞭性の高い音声へリアルタイ
謝辞
ムで変換する試みも行われており,米国オレゴン大
本研究の一部は,科学技術振興機構(J S T)の戦
学のKainら,カナダトロント大学のRudzicz,神戸大
略的創造研究推進事業(C R E S T)における研究領域
30)~ 32)
学の滝口らによる研究成果も報告されている
。
6. おわりに
「共生社会に向けた人間調和型情報技術の構築」お
よび英国Engineering and Physical Sciences Research
Council,Grants EP/J002526/1(CAF)およびmotor
neurone disease associationの支援により行われた。
本稿では,統計的音声合成技術および声質変換技
参考文献
1) Dudley, Homer. The vocoder. Bell Labs Record. 1939, vol. 17, p. 122-126.
2) Taylor, Paul. Text-to-Speech Synthesis. Cambridge University Press, 2009.
3) Dutoit, Thierry. An Introduction to Text-To-Speech Synthesis. Kluwer Academic Publishers, 1997.
4) Tokuda, Keiichi; Nankaku, Yoshihiko; Toda, Tomoki; Zen, Heiga; Yamagishi, Junichi; Oura, Keiichiro. Speech
Synthesis Based on Hidden Markov Models. Proceedings of IEEE. 2013, vol. 101, no. 5, p. 1234-1252.
5) Yamagishi, Junichi; Veaux, Christophe; King, Simon; Renals, Steve. Speech synthesis technologies for
individuals with vocal disabilities: voice banking and reconstruction. Acoustical Science & Technology.
2012, vol. 33, no. 1, p. 1-5.
6) Creer, Sarah; Cunningham, Stuart; Green, Phil; Yamagishi, Junichi. "Building personalised synthetic
voices for individuals with dysarthria using the HTS toolkit". Mullennix, J. W.; Stern, S. E. (Eds.). Computer
Synthesised Speech Technologies: Tools for Aiding Impairment. IGI Global, 2010, p. 92-115.
情報管理 vol. 57 no. 12 2015
887
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
March
http://johokanri.jp/
7) Creer, Sarah; Cunningham, Stuart; Green, Phil; Yamagishi, Junichi. "Building personalised synthetic voices
for individuals with severe speech impairment. Computer & Speech Language. 2013, vol. 27, no. 6, p.
1178-1193.
8) Nakamura, Keigo; Toda, Tomoki; Saruwatari, Hiroshi; Shikano, Kiyohiro. Speaking-aid systems using GMMbased voice conversion for electrolaryngeal speech. Speech Communication. 2012, vol. 54, no. 1, p. 134146.
9) Doi, H.; Toda, T.; Nakamura, K.; Saruwatari, H.; Shikano, K. Alaryngeal Speech Enhancement Based on Oneto-Many Eigenvoice Conversion. IEEE/ACM Transactions on Audio, Speech, and Language Processing.
2014, vol. 22, no. 1, p. 172-183.
10) Huang, Xuedong; Baker, James; Reddy, Raj. A historical perspective of speech recognition.
Communications of the ACM. 2014, vol. 57, no. 1, p. 94-103.
11) Rabiner, Lawrence R.; Schafer, Ronald W. Introduction to Digital Speech Processing. Foundations and
Trends in Signal Processing. 2007, vol. 1, no. 1, 1-194.
12) Woodland, Phil C. "Speaker adaptation for continuous density HMMs: A review". ISCA Tutorial and
Research Workshop (ITRW) on Adaptation Methods for Speech Recognition. Sophia Antipolis, France,
2001-08-29/30, ISCA. 2001, p.11-19.
13) Shinoda, Koichi. "Speaker adaptation techniques for automatic speech recognition", Proc. APSIPA ASC
2011 Xi'an, China, 2011-10-18/21, APSIPA.
14) Leggetter, Christopher J.; Woodland, Philip C. Maximum likelihood linear regression for speaker
adaptation of continuous density hidden Markov models. Computer Speech & Language. 1995, vol. 9, no.
2, p. 171-185.
15) Yamagishi, J.; Kobayashi, T.; Nakano, Y.; Ogata, K.; Isogai, J. Analysis of speaker adaptation algorithms for
HMM-based speech synthesis and a constrained SMAPLR adaptation algorithm. IEEE transactions on
Audio, Speech and Language Processing. 2009, vol. 17, no. 1, p. 66-83.
16) Yamagishi, Junichi. Average-voice-based speech synthesis. PhD thesis, Tokyo Institute of Technology,
2006.
17) Dines, John; Liang, Hui; Saheer, Lakshmi; Gibson, Matthew; Byrne, William; Oura, Keiichiro; Tokuda,
Keiichi; Yamagishi, Junichi; King, Simon; Wester, Mirjam; Hirsimäki, Teemu; Karhila, Reima; Kurimo, Mikko.
Personalising speech-to-speech translation: Unsupervised cross-lingual speaker adaptation for HMMbased speech synthesis. Computer Speech & Language. 2013, vol. 27, Iss. 2, p. 420-437.
18) Valentini-Botinhao, C.; Yamagishi, J.; King S.; Stylianou, Y. Combining perceptually-motivated spectral
shaping with loudness and duration modification for intelligibility enhancement of HMM-based synthetic
speech in noise. Proc. Interspeech. 2013, p. 3567-3571.
19) Cooke, M.; Mayo, C.; Valentini-Botinhao, C. "Intelligibility-enhancing speech modifications: the Hurricane
Challenge". Proc. Interspeech. 2013, p. 3552-3556.
20) Bunnell, H. T.; Pennington, C.; Yarrington, D.; Gray, J. "Automatic personal synthetic voice construction".
Proc. Eurospeech. 2005, p. 89-92.
21) Bunnell, H.T.; Lilley, J.; Pennington, C.; Moyers, B.; Polikoff, J. "The ModelTalker system". Proceedings of the
Blizzard Challenge Workshop, Kansai Science City, Japan, 2010.
22) Ahmad Khan, Z.; Green, P.; Creer, S.; Cunningham, S. Reconstructing the Voice of an Individual Following
Laryngectomy. Augmentative and Alternative Communication. 2011, vol. 27, no. 1, p. 61-66.
888
音声の障がい者のための最先端音声合成技術
23) The 25th International Symposium on ALS/MND, Belgium, December 2014. http://www.mndassociation.
org/research/International+Symposium/Symposium/, (accessed 2015-01-18).
24) Veaux, Christophe; Yamagishi, Junichi; King, Simon. "Using HMM-based Speech Synthesis to Reconstruct
the Voice of Individuals with Degenerative Speech Disorders". Proc. Interspeech. 2012.
25) Mills, Timothy; Bunnell, H. Timothy; Patel, Rupal. Towards personalized speech synthesis for augmentative
and alternative communication. Augmentative and Alternative Communication. 2014, vol. 30, no. 3, p.
226-236.
26) Dall, R.; Veaux, C.; Yamagishi, J.; King, S. "Analysis of speaker clustering strategies for HMM-based speech
synthesis", Proc. Interspeech. 2012.
27) Lanchantin, P.; Gales, M. J. F.; King, S.; Yamagishi, J. "Multiple-average-voice-based speech synthesis", 2014
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2014, p. 285-289.
28) Stylianou, Y.; Cappe, O.; Moulines, E. "Continuous probabilistic transform for voice conversion", IEEE
Transactions on Speech and Audio Processing. 1998, vol. 6, no. 2, p. 131-142.
29) Moriguchi, T.; Toda, T.; Sano, M.; Sato, H.; Neubig, G.; Sakti, S.; Nakamura, S. "A digital signal processor
implementation of silent/electrolaryngeal speech enhancement based on real-time statistical voice
conversion". Proc. Interspeech. 2013, p. 3072-3076.
30) Kain, A. B.; Hosom, J. P.; Niu, X.; van Santen, J. P. H.; Fried-Oken, M.; Staehely, J. Improving the intelligibility
of dysarthric speech. Speech Communication. 2007, vol. 49, no. 9, p. 743-759.
31) Rudzicz, F. Production knowledge in the recognition of dysarthric speech. PhD thesis, University of
Toronto, 2011.
32) Aihara, R.; Takashima, R.; Takiguchi, T.; Ariki, Y. "Individuality-preserving voice conversion for articulation
disorders based on non-negative matrix factorization". IEEE International Conference on Acoustics,
Speech and Signal Processing (ICASSP), 2013-05-26/31,2013, IEEE, p. 8037-8040.
Author Abstract
In this article, we introduce the state-of-the-art research outcomes of clinical applications of statistical speech
synthesis and voice conversion techniques. In the speech information-processing field, there are emerging
research topics and impressive research outcomes that may contribute to the quality of life of patients with
vocal disabilities such as a technology to digitally mimick a voice of patients who are losing their voices due to
diseases such as ALS (so the patients can use a personalized speech synthesizer that outputs their own voices)
and a technology to digitally transform electrolaryngeal speech or disordered speech to natural-sounding
intelligible speech in a real-time fashion. We also overview the current research topics after case studies with
ALS patients and laryngectomees are described.
Key words
speech information technology, text-to-speech synthesis, voice conversion, disordered speech, quality of life,
QOL
情報管理 vol. 57 no. 12 2015
889
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
生きている国語辞典『デジタル大辞泉』
の挑戦
Challenge of living Japanese dictionary "Digital Dai-ji-sen"
板倉 俊1
ITAKURA Takashi1
1 株式会社 小学館(〒101-8001 東京都千代田区一ツ橋2-3-1)
1 Shogakukan Inc. (2-3-1 Hitotsubashi Chiyoda-ku, Tokyo 101-8001)
原稿受理(2015-01-21)
情報管理 57(12), 890-899, doi: 10.1241/johokanri.57.890 (http://dx.doi.org/10.1241/johokanri.57.890)
著者抄録
「紙の辞書」と「デジタル辞書」とは似て非なるものである。その視点に立つとまったく違う世界が見えてくる。2006
年以来,国語辞典『大辞泉』はデータベースを使った常時改訂を実現し,年 3 回データを更新している。このデータ
ベースシステムがなぜ生まれたのか。どのような考えで開発されたものなのか。そして,どのようなデータを作るこ
とができるのか。さらに,このデータをどうやって商業ベースに乗せるのか。そしてその先に目指すものは何か。近年,
辞書の編集が注目された。言葉を編集するという本質部分に変わりはないが,「デジタル辞書」の編集は書籍とはまっ
たく違う発想が必要である。本稿では「デジタル辞書」と「紙の辞書」との違い,「デジタル辞書」の現状と,その可
能性について紹介する。
キーワード
大辞泉,国語辞典,電子辞書,Web辞書,検索,XML,外字,ブランディング
1.「紙」と「デジタル」
のデータは「衆議院を構成する議員。定数は475名。
」
となっている。修正前は「定数は480名」
。2012年に
この原稿が掲載されるのは2015年を予定してい
公職選挙法が改正され,小選挙区で5議席減らすこと
る。現在は2014年の12月。このとき世間では,どの
が決まった。この新しい規程で今回初めて選挙が行
ような出来事が話題になっていたであろうか。11月
われるため,解散と同時に定数を書き直すことになっ
末に安倍首相が衆議院を解散し,世の中が第47回衆
たというわけである(図1)。こういう加筆修正は市
議院選挙に向けて動き始めたころである。
場に出回った「紙の辞書」ではできない。「デジタル
小学館の国語辞典『大辞泉』は日々データを編集
890
辞書」だからできることである。
し,年3回データを更新している。この解散に伴って
ところで「デジタル辞書」は『大辞泉』だけでは
【衆議院議員】という項目に修正が加えられた。最新
ない。各出版社が刊行する大型・中型・小型国語辞
生きている国語辞典『デジタル大辞泉』の挑戦
(画面左 : 2013年6月26日, 右 : 2014年11月21日。 下段 : 両者の差分で, 赤字が削除, 青字が加筆した文字。
カラー画像はWeb版参照)
図1 【衆議院議員】データの違い
典の多くはデジタル化されている。しかし,データ
をデジタルにしただけのものがほとんどである。「デ
ジタル辞書」は「紙の辞書」とまったく別のもの。
この視点に立つと初めて見えてくるものがある。
1.1 編集用のシステム開発
小学館から『大辞泉』が刊行されたのは1995年の
秋である。国語+百科の本格的な辞典で,総項目数
は約22万語,カラー図版6,000点を掲載し,ビジュア
ルでも優れた仕上がりとなった。初刷りが50万部。
図2 『大辞泉 第二版 DVD付き』
小学館が発行する一般書籍の初版部数で,近年まで
トップを譲らなかった。
き出したデータを使って編集作業を行った。そして
それから17年後の2012年秋に『大辞泉 第二版 DVD
DVDは,刊行間際の2012年8月に完成した最新データ
付き』を刊行した(図2)
。総項目数は約25万語,IT用語・
を使ってアプリケーションに仕上げた。1年4か月の
外来語などを大幅に増補したこともあり,中型辞典では
間に,
7,000語が『大辞泉』に追加されたことになる。
初めて横組みを採用した。第二版の収録語のうち16%が
このデータベースのことを編集部では「大辞泉 編
アルファベット表記の項目で,縦組みの読みにくさを解
集支援システム」と呼んでいる(図3)
。このシステム
消するためであった。また,DVDの総項目数は25万7,000
が完成したのは,2006年の12月。年が明けた2007年1
語で書籍よりも多く,初版とは違い,画像データはDVD
月から,
これを使って本格的な編集作業を始めている。
にのみ載録されている。
ところで,なぜこのようなシステムを開発する必
D V Dの項目数と書籍の項目数が違うのは,データ
要があったのだろうか。答えは,辞書のデータが徐々
ベースから抽出したデータのバージョンが違うから
に古くなるからである。そして一度印刷された「紙
である。書籍は,2011年の4月にデータベースから抜
の辞書」のデータは,修正が必要だとわかっていて
情報管理 vol. 57 no. 12 2015
891
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
も直すことができない。辞書編集者にとってこれは
【ヒッグス粒子】DVD(2014年12月現在)
つらい現実である。『大辞泉 第二版』では,この現
2012年7月にC E R NのL H C加速器で未知の新粒子が見
実を覆す方法を提示した。その方法とは,DVDのデー
つかり、翌年ヒッグス粒子であると発表された。
タを刊行から3年間,2015年秋まで無償で更新し,
『大
辞泉』の利用者に最新のデータを提供するというも
のだ。
第二版の印刷ぎりぎりまで「発見」の発表を待っ
たが間に合わず,D V Dのデータは翌年の秋に前述の
たとえば,
ように更新された(図4)
。これまでは,書籍の付録
として「CD-ROM」
「DVD」が存在した。しかし,書
【ヒッグス粒子】書籍(抜粋)
籍のデータは,時の流れの,ある「一瞬」を切り取っ
特にワインバーグサラム理論の中でその存在が予言
たものでしかない。
『大辞泉 第二版』は,
書籍が[従]
されているが、唯一、未発見。
で,D V Dに入れたアプリケーションが[主]である
タブを選び,項目の[検索][立項][TSV(出力)][XML(出力)]
[棒ゲラ(ゲラの出力)]など,さまざまな作業を行うことができる。
図3 「大辞泉 編集支援システム」の初期画面
(左上が, 書籍の解説と同じもの。 右が翌年書き換えたもの)
図4 【ヒッグス粒子】の修正画面
892
生きている国語辞典『デジタル大辞泉』の挑戦
れるであろうか。現段階では4つあると考えている。
(1)頻繁なデータ更新
(2)検索データの充実
(3)辞書データを補完する拡張データの開発
(4)デバイスの性能を利用した機能の開発
この4つに共通する目的は「データの差別化」であ
る。類書と同じものを作っていては抜きん出ること
はできない。(3)と(4)については,後で詳しく述
べる。われわれのシステムは,(1)と(2)の作業が
行えるよう開発してある。
図5 『大辞泉 第二版 DVD』の画面
という考え方で作られている(図5)。
(1)頻繁なデータ更新
政治・経済・法律・医学・自然科学・IT・地名・文
先に述べたように,印刷された書籍のデータは簡
学……,さまざまなジャンルの担当編集者と編集部
単には修正できない。『大辞泉』のような多数の百科
とが項目の選定方法を話し合うところから始まる。
項目を載録する国語辞典では,この不都合を何らか
その手順に沿って担当者は執筆者に原稿を依頼し,
の方法で解決する必要があった。その必要から「大
仕上がった原稿をデータベースにアップ,『大辞泉』
辞泉 編集支援システム」が生まれたのである。ま
の編集方針に従ってパソコン上で校正作業を行う。
さに「必要は発明の母」。
げんてつ
辞書データは「仮名見出し」
「漢字表記」
「原綴(=
アルファベット表記)
」
「歴史的仮名遣い」
「品詞」
「解
1.2 システムが可能にしたこと
説」などの要素を正しく入力する必要がある。シス
辞書のデータ更新については,出版社により考え
テムの入力画面は,それぞれの入力領域が区切られ
方が違う。ある中型国語辞典にはいまだに【社会保
ているため,間違えにくく作られている。仮に間違っ
険庁】が世の中に存在していることになっている。
たとしても,複数の検品方法によって,そのミスに
書籍の改訂がないかぎり,修正される気配はない。
気づくようになっている。
しかし,この「改訂」が可能な状況ではなくなっ
入力はW o r dを使う感覚で行える。初めてこのシス
てきている。出版不況が深刻で,辞書を取り巻く環
テムを使う編集者でも数日あればコツをつかむこと
境も例外ではない。唯一元気なのは子供向けの辞典
ができる。ジャンルごとに複数の編集者が校正した
市場だ。少子化の波を確実に受けているが,毎年10
データは,紙で出力され別の校正者に渡される。最
万部以上を販売する小学生辞典が複数ある。
低でもトリプルチェックを経たあとのデータが校了
では,大人向け国語辞典はどうであろう。『大辞
となる。
泉』初版の初刷りが50万部であったことはすでに述
また,社会の変化に遅れないよう,新聞・雑誌・
べた。『第二版』の第1刷は,この10分の1にも届いて
テレビ番組・ネットなどから言葉を拾う作業が行わ
いない。これが現実なのである。17年の間で大人向
れている。ここで見つかった言葉も,各ジャンルの
け「紙の辞書」の需要は激減した。
担当者を経由して執筆,データベース登録,校正,
となると辞典編集者ができることは限られてく
出力,校正という流れで作業が進む。先の【衆議院
る。その1つが,生き残りをかけて「デジタル辞書」
議員】の例のように,既存の項目を加筆修正するた
を育てていくことである。どんな育成方法が考えら
めのデータも拾い出されている(図6)。
情報管理 vol. 57 no. 12 2015
893
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
これまでデジタルデータの修正は,技術者を介さ
書籍で言葉を探す場合と,デジタルデータで言葉
Journal of Information Processing and Management
ないとできなかった。出力したゲラに赤字を入れ,
を検索する場合,もっとも違う点は,デジタルでは
それをデータに反映するためには専門の知識をもっ
ピンポイントでしか言葉を探せないということであ
た技術者に託す必要があった。われわれのシステム
る。書籍では五十音順に言葉が並んでいるので,検
は普通の辞書編集者がデータを本人の手で修正でき
索はまず仮名で行われる。たとえば,
「しょうがい」
るように作られている。この「誰にでも使えるシス
を探すと【少艾】
【生害】
【生涯】
【渉外】
【勝概】
【傷害】
テム」は,多数の編集者が作業に参加することにつ
【障害】などが見つかる。書籍では探したい言葉の周
ながる。「大辞泉 編集支援システム」は,汎用性・
囲にいろいろな言葉がある。一方デジタルの場合は,
拡張性・運用のしやすさの3点にこだわって開発され
漢字で検索することが多いので,【生涯】で検索した
た。タグをほとんど意識せずに,S E(システムエン
場合,
【少艾】
【生害】
【渉外】
【勝概】
【傷害】
【障害】
ジニア)の知識がなくても加筆・修正が可能である。
はヒットしない。
このシステムによって編集者による分業が可能とな
この特徴をベースに一歩進めて考えてみよう。た
り,
『大辞泉』は年3回,データを更新することがで
とえば,
【障害】は【障がい】とも書くが,データの
きるのである。
中に【障がい】がなければ検索してもヒットしない。
2007年からの平均値を取ると,1回の更新で約2,300
の新語が追加され,既存項目は,毎回8,000 ~ 1万語
が加筆・修正されている(表1)。
ワード]に設定することができる。
ほかの例をあげる。
【コンピューターウイルス】
が
『大
(2)検索データの充実
辞泉』の見出しである。そして[隠し検索キーワード]
このテーマは,デジタルデータを作り込む醍醐味
の1つである。
『大辞泉』のシステムでは【障がい】を[隠し検索キー
に「コンピュータウイルス」
「コンピューターウィルス」
「コンピュータウィルス」が設定されている(図7)
。
『大
(左上が,本稿執筆時点の未公開原稿。右が次回公開予定の原稿。左下がその差分で,全面的に書き換えられている)
図6 【STAP細胞】の加筆修正画面
表1 項目数の変化(2008年12月~ 2014年12月)
894
生きている国語辞典『デジタル大辞泉』の挑戦
た場合,システムだけではできないこともある。そ
a
れが(3)と(4)の開発につながる。
(3)辞書データを補完する拡張データの開発
(4)デバイスの性能を利用した機能の開発
この2つは密接に関係している。
『大辞泉』をデジタル化した当初,データの容量
は100M Bあった。当時,これだけの容量を搭載でき
るデバイスは,辞書検索専用端末,つまり「電子辞
b
書」だけであった。それ以外の提供方法は,サーバー
上にデータを格納する「W e b辞書」
,もしくは,C D ROMやDVD-ROMで頒布してパソコン上で動かす「ソ
フトウエア」が考えられた。Web辞書は,ネットワー
クを経由して,パソコンや携帯電話で辞書データを
a : [基本情報] タブの 「キー外字表記」 欄に 「/」 で区切って [隠し
検索キーワード] を書き加える。
b : ソースコードの<key type="カナ表記">欄に検索用のデータが実装
されている。
図7 [隠し検索キーワード]の例
検索するというものである。ただ,どの方法もさま
ざまな問題を抱えていた。デバイスや通信環境など
のスペックが低く,多くの制限があったからである。
この約20年の間にどれだけ進化したであろう。i O S
辞泉』のデータは,検索者の文字入力に影響される,
アプリ『大辞泉』を例に比較する(図8)。現在『大
仮名見出しの揺れ,表記の揺れなどをデータ側で吸収
辞泉』X M Lデータは「リッチ化」が進み,187M Bも
してヒットするように作られている。このように,
デー
ある。アプリ全体の容量は681M B。この大容量をス
タを作り込んでいくことを
「データのリッチ化」
という。
マートフォンに入れて持ち運ぶことができるように
リッチ化は辞書コンテンツごとに,さまざまな方
なっている。『大辞泉』がデジタル化された当時,漢
法がある。小学生向けの辞典をデジタル化した際に,
字使用は,J I S第一・第二水準の範囲であった。大辞
表記欄の漢字すべてに「学年別配当注1)」データを付
加した。このデータを用いると,「小学3年生」と設
定するだけで,4年生以上で習う漢字すべてを平仮名
に変換して表示するということが可能になる。
このような「カスタマイズ(パーソナライズ)」は「デ
ジタル辞書」にしかできない芸当である。「紙の辞書」
は誰もが同じ状態で使うものであるが,「デジタル辞
書」は,データを作り込む(リッチ化する)ことで
使用者の好みに合わせて設定できるようになる。冒
頭で述べたように,「デジタル辞書」は「紙の辞書」
とはまったく別のものなのである。
1.3 システムの外で
デジタルデータの特性を最大限に活用しようとし
解 説 の ほ か に ,写 真 画 像 3 点 ,地 図 ,世 界 遺 産 動 画 を 表 示 で き る 。
図8 iOS用『大辞泉』アプリ画面
情報管理 vol. 57 no. 12 2015
895
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
泉のような中型国語辞典では,その範囲以外の漢字
を表示するために,画像(gif)を準備する必要があっ
た。その数,約2,000。現在はU n i c o d eに対応するこ
とで120文字程度にまで減っている。また,最近のス
マートフォンは高精細なカラーディスプレーが当た
り前になった。当初は難しかった,カラー画像表示や,
動画の再生も可能になっている。iOS『大辞泉』の画像・
動画はサーバー上にある。現在では,それを呼び出し,
読み込んで表示・再生するための通信速度が確保さ
れている。
『大辞泉』がX M Lデータとは別に準備した主なデー
タは,(a)画像データ(b)動画データ(c)地図デー
図9 アンドロイド用『大辞泉』アプリ画面
タ(大辞泉の地名項目で地図表示)
(d)サイトURLデー
タ(関連するW e bサイトへのリンク)(e)フォント,
もしくは外字画像データ(f)
『 大辞泉プラス』
(固有
名詞辞典。Ver.11で,74,000語収録)である。
これ以外に,
『大辞泉』データベースからは,カタ
カナ語データ・ABC略号データ・季語データ・成句デー
タ・難読漢字データ・作家作品データ・百科分類デー
タなどを抜き出すことができる。また,『数え方の辞
典』など,別の辞典に掲載されている項目と,
『大辞泉』
図10 Windows 8用『大辞泉』アプリ画面
の項目との相互リンクデータなどもある。
最初からこれだけのデータがあったわけではな
どの機能を残し,どの機能を捨てるか。システムを
い。デバイスや通信環境の進化に合わせて徐々に準
作り込めば費用がかさむ。そして複雑なシステムは
備してきたものである。クライアントの要望に合わ
使いにくく,壊れやすい。大切なのはコスト面も含
せ,これらのデータを組み合わせて提供することが
めたベストパフォーマンスを模索することである。
できるのである。
このような外部データを準備するためには,2つの
2.『大辞泉』の現状認識
要素が不可欠だと考えている。もっとも大切なのは
「いまの状況に満足しないこと」
。ここはもう少し便利
『大辞泉』は,
「頻繁なデータの更新」
「X M Lデータ
にならないか,常にそう考えていることが重要であ
のリッチ化」「拡張データの充実」を図ることで,類
る。そして「デバイスを研究すること」
。20年前には
書との差別化を進めてきた。これだけ充実した内容
想像もできないくらいデバイスは進化している。そ
をもつ辞書データはほかにはないと自負している。
の機能を最大限に利用しない手はない(図9,図10)
。
『大辞泉』を多くの方に使ってもらいたい。心からそ
余談になるが,外部データ(a)~(f)をシステム
う考えている。しかし実際にはなかなかそうはなら
の中に取り込むことは可能である。しかしこれらの多
くはシステムの開発段階で切り捨てたものである。
896
ない。
生きている国語辞典『デジタル大辞泉』の挑戦
2.1『大辞泉』に欠けている要素
テレビのクイズ番組や,ネットのコラム,新聞・
雑誌記事などで辞書が利用される。そういう場面で
『大辞泉』が引用される例はまだまだ少ない。
内容で劣っているとは思わない。逆に優れている
ところが多い。
『大辞泉』は日々編集作業を続け,4
か月に1度,データを更新している。鮮度という点で,
群を抜いている。
そのことがあまりに知られていない。
いいものを作れば,利用されるはず,という考え
に陥っているのではないか。データを作り込むだけ
で,
あとは待っているだけ。
これではダメなのである。
『大辞泉』は無名である。
まず,こう認識するところから始めることにした。
図11 『大辞泉』公式Webサイト
2.2 ブランディング展開
有用なデータを作っても,それに価値があること
を知ってもらわなければ使われることはない。そも
そも『大辞泉』という国語辞典の存在が世間に浸透
していない。われわれ編集者が,まずその状況をき
ちんと認識するところから始まった。
『大辞泉 第二版 D V D付き』は,社の創立90周年
記念企画であった。そのため,編集・販売・宣伝部
門が集まって頻繁に販売会議を開いていた。第二版
発売後,その会議は『大辞泉』を世の中に知っても
らう,つまり「
『大辞泉』のブランディング」の方策
を検討する会議に進化した。
「
『大辞泉』のブランディング」とは「『大辞泉』ファ
図12 『大辞泉』公式twitterページ
・『大辞泉』データベース27万語目登録日当てキャ
ンペーン
・『大辞泉』辞書の日(10/16)記念キャンペーン
ンを生み出すこと」である。そのために次の対策を
(オ)マスコミへの露出
試みた。2013年に実行した主なものだけを記載する。
(ア)は,ここに来れば『大辞泉』のすべてがわか
(ア)『大辞泉』公式サイト(http://www.daijisen.
るというWebサイトの作成。
(イ)
は積極的に
『大辞泉』
jp/)の立ち上げ(図11)
(イ)
『大辞泉』t w i t t e r公式アカウント(@ i n f o _
dai_jisen)の立ち上げ(図12)
(ウ)『大辞泉』Facebookページ(https://www.
facebook.com/Daijisen)の立ち上げ
(エ)
『大辞泉』を知ってもらうための各種イベント
・『大辞泉』コトバの日(5/18)記念キャンペーン
情報を発信,収集する簡易ブログ。(ウ)は編集部と
『大辞泉』ファンとの交流の場。そして定期的にキャ
ンペーンを行い,1年を通じて『大辞泉』が露出し続
けるようにした。(エ)のキャンペーンでもっとも力
を入れたのが2013年10月に行った「あなたの言葉を
辞書に載せよう。
」である。
たとえば,
【馬鹿】という言葉の解説は「人をのの
情報管理 vol. 57 no. 12 2015
897
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
しっていうときにも用いる」語となっている。しか
し,ドラマで恋人に向かって「馬鹿!」と言った場合,
ののしりの意味ではなく,激励や愛情表現となるこ
とがある。辞書にはそのような解説はないが,
「激励」
「愛情表現」のニュアンスで使われることを多くの人
が知っている。辞書に言葉の説明すべてが掲載され
ているわけではない。この言葉の多面性に着目して,
【愛】
【自由】
【失敗】など8つの語のイメージを一般
から募集,優秀作品を『大辞泉』に掲載するというキャ
ンペーンを展開した。6,720の応募があり,121の作
品が『大辞泉』に載録された(図13)。
このキャンペーンは4マス媒体(テレビ・新聞・雑誌・
※ 一 般 の 方 か ら ,8 つ の 言 葉 に 対 す る イ メ ー ジ を 募 集 。
図13 「あなたの言葉を辞書に載せよう。2013」
を学んだ。そして次に目指すのは「辞典の小学館」
ラジオ)にさまざまな形で取り上げられた。特に突
というブランドイメージを作ることである。小学館
出していたのがフジテレビの当時の人気番組『笑っ
には一級の辞典がそろっている。日本で最大(50万
ていいとも!』にレギュラーのコーナーができたこ
語,
100万用例を掲載)の国語辞典『日本国語大辞典』
,
とである。
『国語辞典をアップデート 目指せ!言葉
小学生向け国漢辞典で累積販売部数がもっとも多い
の達人』。【結婚】
【涙】【東京】などの言葉のイメー
『例解学習国語辞典』
『例解学習漢字辞典』
『ランダム
ジを出演者が考え,それを「達人」
「入選」
「ボツ」
「未
ハウス』
『日中中日辞典』
『伊和和伊中辞典』
『独和和
熟」に分けて,
『大辞泉』の編集長が選評するという
独大辞典』などの各種外国語辞典,一般向け百科事
ものだった。2014年1月の下旬から,最終回となる同
典『日本大百科全書(ニッポニカ)
』に小学生向け百
年3月末まで10回放送された。正直,このような展開
科事典『きっずジャポニカ』等々。これだけの種類を
になるとは考えもしなかった。
そろえた出版社は国内で小学館だけである(図14)
。
これらの辞事典のデータをリッチ化し,関連付け,
2.3 目指すところ
差別化すればどうなるであろうか。「言葉の海」と呼
2013年に,このブランディング対策を開始した。
べる,巨大なデータベースの輪郭が見えてくる。さ
2014年も引き続き「あなたの言葉を辞書に載せよう。
らに付け加えるなら,小学館にはたくさんの図鑑が
2014」を展開した。『大辞泉』の認知度は少しずつ上
ある。美術書がある。そして,「ドラえもん」
「ポケ
がっていると実感している。Facebookでは日々記事
モン」「妖怪ウォッチ」などのキャラクターがある。
をアップし,徐々にではあるがファンも増えている。
これらが連携すればどれだけのパワーが生まれるで
引き続きこれらの活動は続けていく。
あろうか。
『大辞泉』ブランディング活動からさまざまなこと
図14 小学館の代表的な辞典
898
生きている国語辞典『デジタル大辞泉』の挑戦
「大辞泉 編集支援システム」は,その端緒を開い
たにすぎない。
可能になる。そして周囲の進化に合わせて,辞書デー
タもさらに進化することが可能である。これを突き
詰めていくと,最終的には『大辞泉』は形がなくな
3. 最後に
ると考えている。まずは辞事典のデータベースを一
本にまとめ,小学館のすべてのレファレンスデータ
近年,三浦しをん氏の小説と映画の『舟を編む』
へんさん
を一本化し……。コンテンツの枠を取り払ったワン
で辞書の編集が注目された。言葉を編 纂するという
ソースマルチユース。道のりは長い。が,これほど
辞書編集の本質部分で「紙」と「デジタル」に違い
夢膨らむ作業はない。
はない。しかし,同じデータから生まれたものであ
りながら,
「紙」と「デジタル」はまったく別のもの
「デジタル」は楽しい! 本稿で申し上げたいこと
が,この一言に集約される。
である。
「紙」ではできないことが「デジタル」では
本文の注
注1) 小学校学習指導要領で,児童の学習する漢字を学年別に示したもの。平成元(1989)年告示の学習指
導要領改訂で,第1学年80字,第2学年160字,第3学年200字,第4学年200字,第5学年185字,第6学
年181字の計1,006字となっている。
Author Abstract
A "paper dictionary" and a "digital dictionary" appear similar at first glance, but are actually quite different.
Once this perspective is adopted, a completely different world comes into view. Since 2006, the Japanese
dictionary "Dai-ji-sen" has been regularly revised by means of a database system. Its data is updated three
times a year. Why was this database system created? What considerations guided its development? What
kinds of data can the system create? Furthermore, how can this data be imposed over a commercial base?
And, what goals should be pursued next? In recent years, the editing of dictionaries has gained attention.
Although the essential qualities of editing words have not changed, editing digital dictionaries requires a
way of thinking completely different from editing books. This paper introduces differences between digital
dictionaries and paper dictionaries, the current state of digital dictionaries, and their potential.
Key words
Dai-ji-sen, Japanese dictionary, digital dictionary, Web dictionary, search, XML, extended characters, branding
情報管理 vol. 57 no. 12 2015
899
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
自動記事分類技術を用いた「日経テレコン
ナビ型記事検索」
情報収集に気づきを提供する新スタイル
New Nikkei Telecom navi type style for article search with automatic classification
techniques
出口 信吾1
DEGUCHI Shingo1
1 株式会社日本経済新聞デジタルメディア テレコン事業本部営業部(〒100-8066 東京都千代田区大手町1-3-7)
Tel: 03-6256-2570 Fax: 03-6256-2548 E-mail: [email protected]
1 NIKKEI DIGITAL MEDIA INC. Sales & Marketing Department NIKKEI TELECOM DIVISION (1-3-7 Otemachi Chiyoda-ku, Tokyo 1008066)
原稿受理(2014-12-26)
情報管理 57(12), 900-909, doi: 10.1241/johokanri.57.900 (http://dx.doi.org/10.1241/johokanri.57.900)
著者抄録
インターネット経由でビジネス情報提供を手がける日経テレコンはサービス開始から 30 周年を迎えた節目の 2014 年
4 月に,自動記事分類技術という新しい技術を導入したナビゲーション型の記事検索インターフェース「ナビ型記事検
索」をリリースした。従来のキーワードによる全文検索に比べて,検索結果の適合率を大幅に改善すると同時に,利
用者が自分の意図を反映しながら検索結果を絞り込んでいくことができる,新しい検索スタイルを提案するものであ
る。本稿では,
「ナビ型記事検索」を使った検索手法を紹介しながら,それを支えている自動記事分類技術の概要と検
索用インデックスの生成処理についても解説する。
キーワード
日経テレコン,記事,検索,自動分類,ナビゲーション型,言語解析,言語理解,キーワード,シソーラス,インデッ
クス
1. はじめに
情報を提供し,経済活動に貢献する」という使命の
もと,有用なコンテンツの収録を拡大しながら,必
2014年4月,日経テレコン(http://t21.nikkei.co.jp,
要な情報を利用者が探しやすい検索技術を追求して
日本経済新聞デジタルメディア)はサービス開始か
きた。そして30周年の節目に「ナビ型記事検索」と
ら30周年を迎えた。この間,「信頼のおけるビジネス
いう新しいメニューをリリースした。新メニューで
本稿の著作権は,株式会社日本経済新聞デジタルメディアに帰属する。
900
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
は,検索にヒットした記事を自動的に分類して利用
掛かるためには,業務目的に合ったコンテンツが収
者の意図に沿った情報を提供するインターフェース
録されているデータベースを使うことが有効である。
を実現している。この自動記事分類の技術を,従来
日経テレコンの記事検索の特徴は,新聞や雑誌な
の「インデックス作成」や「全文検索技術」と組み
ど信頼性の高いメディアに掲載された情報だけを収
合わせた仕組みについて本稿で紹介する。
録してデータベースを構築していることである。注
目のトピックス,企業,人物や地域の名称など,ビ
1.1 日経テレコンとは
日経テレコンはインターネットで利用できる有料の
会員制ビジネス情報サービスである。主力メニュー
の1つ「記事検索」では,505種類(2014年12月現在)
に及ぶメディアに掲載された記事をまとめて検索す
ジネスシーンに合った自由なキーワードで的確な情
報収集を可能にしている2),3)。
2. “新しい検索スタイル”
を提案する「ナ
ビ型記事検索」のリリース
ることができる。全国紙・業界専門紙(誌)に加えて,
2014年末には全都道府県の50紙をカバーした。日本
語で読める海外情報にも注力しており,アジアビジ
2014年4月に,新しい記事検索メニュー「ナビ型記
事検索」の提供を開始した(図1)。
ネスに関しては30種類のメディア情報を収録してい
利用者が思いついたキーワードを起点として,検
る。また「企業検索」では,国内外の主要な調査会社
索された結果を複数の観点で自動的に分類し,利用
による企業・財務情報などをワンストップで収集でき
者が求めている情報(検索結果)にたどり着くこと
る。
「人事検索」で提供する「日経W H O ' S W H O」は
ができるようになっている。
「ナビ型記事検索」の「ナ
国内ビジネスパーソン約30万人の情報が検索できる。
ビ」は,利用者を適切な検索結果にナビゲーション
することを意味したもので,初めてでも無理なく検
1.2 生まれたときは「日経テレコム」
日経テレコンの誕生は1984年4月2日で,当初は「日
索できるよう,新たな検索スタイルを提供すること
をコンセプトにしている。
経テレコム」という呼称であった1)。まだオフィスで
もパソコンが物珍しかった当時,専用端末でサービ
ス提供を開始した。その後にはパソコンからモデム
2.1 従来型の記事検索の課題
日経テレコンの記事検索は,新聞・雑誌などメディ
通信で利用できる情報サービスとして注目された。
そして,インターネットがビジネスに普及しはじ
めた1997年,W e b時代に即応した日経テレコン21の
提供を開始した。インターネットの活用によりビジ
ネス現場からアクセスできる情報量が爆発的に増え
続けている。特に広告掲載をビジネスモデルとして
いるW e bサイトを通じて提供されるニュースをはじ
め,企業のW e bサイトや個人ブログまで,発信され
る情報には誰でもアクセスできるようになっている。
一方で,ビジネス現場における情報収集では,内
容の正確性と情報の鮮度が求められる。効率よく必
要な情報を探し出し,次のビジネスアクションに取り
図 1 ナビ型記事検索の検索画面
図1 「ナビ型記事検索」の検索画面
情報管理 vol. 57 no. 12 2015
901
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
アに掲載された記事を中心に収録し,2014年12月時
る側としては安心だが,利用者にとっては必要なも
点で505種類の媒体をカバーしている。データベース
のと不要なものの区別がつかず,かえって混乱する
には最新の記事情報が日々追加されるうえ,収録す
こともあったはずと考えた。
Journal of Information Processing and Management
る媒体数も増え続けており,2014年11月7日には,収
録記事の本数がついに1億本を超えた。
反対に,検索結果については情報量を増やしてい
る。「何件の記事が見つかった」という情報だけでな
新聞・雑誌や海外ニュース,業界専門情報などの
く,検索結果をさまざまな軸で分類したり,時間軸
アーカイブを対象に,キーワード1つで横断検索でき
で検索結果の分布をグラフ表示したりしている。利
るメリットは非常に大きいが,一方で,検索結果と
用者が考えたキーワードだけで検索すると「どうし
して表示される記事数が多くなり,本当に欲しい情
てこの記事がヒットしたのだろうか」と疑問に思う
報にたどり着くまでに時間がかかる傾向が出てきて
こともあったはず。検索結果を分類や時間軸で仕分
いる。
けしておくことで,意図する内容にさらに絞り込む
また,日経テレコンの草創期は情報収集のスペシャ
ようナビゲートしている。
リスト(サーチャー)が記事検索を行っていたが,
以下に「ナビ型記事検索」の特徴をまとめた。
インターネット時代になり,日経テレコンもビジネ
(1)キーワードの属性/種別を判定するサジェスト
スの現場で営業担当者や与信管理担当者が直接利用
機能
するケースが増えてきた。それに伴い,検索スキル
従来のように単に文字列が一致する言葉を提示す
を備えていない利用者が思いついた言葉だけで検索
るのではなく(図2),その言葉の属性(会社,団体,
を進めても目的が達成できない,という場面が多々
人物,一般など)も併せて表示(図3の囲み枠)して,
みられるようになっている。
より的確なキーワードを選定できるようにした。
(2)検索された記事群に含まれる主題語と分類語(主
2.2「ナビ型記事検索」の狙いと特徴
「ナビ型記事検索」と従来型の記事検索との違いは,
題と分類語については「3.1 言語理解によるタグ付
け」を参照)を一覧表示する「絞り込みキーワー
一言でいうと検索結果の見える化である。「キーワー
ド候補」機能(図4)。
ドを入れても欲しい情報が見つからない」「たくさん
検索結果の件数が多いと感じるときは,どのよう
の検索結果から欲しい情報だけ取り出したい」とい
な言葉で検索を重ねると,どの程度まで件数が絞り
う課題を解決するために,「ナビ型記事検索」では,
込めるのかが一覧表示されている。入力したキーワー
思いついたキーワードから探したい概念に絞り込め
ドがどのようなテーマで報じられていることが多い
図 1 ナビ型記事検索の検索画面
たり,検索結果を分類したりする言語理解的なアプ
のか,一目でわかるよう分類別に件数の多い順に並
ローチを取り入れている。
さらに,利用者の視点に立って,使いやすさとわ
かりやすさを重視して,思い切ってシンプルな検索
画面にしている。「ナビ型記事検索」のメニューを選
ぶと,キーワードの入力ボックスのほかは,期間選
択バーなど必要最小限の設定パーツのみを表示して
いる。これまでの記事検索画面を見慣れた利用者に
は物足りなさを感じるかもしれない。提供する機能
を画面上で漏れなく提示する方がサービスを提供す
902
図2 従来の記事検索のサジェスト機能の例
図 2 従来の記事検索のサジェスト機能の例
入力された言葉が一致する候補を提示するが,
その属性までは判別でき
なかった。
入力された言葉が一致する候補を提示するが,
きなかった。
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
2.3 絞り込みキーワード候補から得られる新たな
べている。
(3)検索結果の時系列表示による可視化(図5)
気づき
キーワードの注目度の変遷を追ったり,新語の登
特に前節の(2)で触れた絞り込みキーワード候補
場時期を探ったりする,といった用途も考えられる。
を表示する機能は,多すぎる検索結果を最適に絞り
込むのに有用であるだけでなく,一覧された候補語
を眺めることで,これまで自分が気づいていなかっ
たり,知らなかった用語,概念やトレンドを発見し
たりすることがある。
たとえば,「L E D」で検索したときの絞り込みキー
ワード候補から,思わぬ用語との組み合わせが浮か
び上がってくるかもしれない(図6)。
3. 言語解析から言語理解へ
図 3 サジェスト機能の例
入力された「ライオン」で会社のライオンを検索したいのか,一般用語の「ラ
図 3 図3 サジェスト機能の例
サジェスト機能の例
イオン」検索したいのか,意図を反映できる。
「ナビ型記事検索」のインターフェースで重要な役
入力された「ライオン」で会社のライオンを検索したいのか,一般用語の「ラ
入力された「ライオン」で会社のライオンを検索したいのか,一般用語の「ラ
イオン」 を検索したいのか, 意図を反映できる。
イオン」検索したいのか,意図を反映できる。 割を担っているのが,「分類タグ」(以下,タグ)で,
自動記事分類技術を使って各記事に付与される。
3.1 言語理解によるタグ付け
タグには,
主題語(表1)と呼ぶ「会社名」
「団体名」
「人
物名」
「一般用語」と分類語(表2)と呼ぶ「テーマ」
「業
界」
「地域」
「記事種別」のカテゴリーを用意している。
各カテゴリーにおいて最適なタグが付与されるよ
う,過去の大量の記事を解析した結果を反映した知
図4 絞り込みキーワード候補の例
キーワード 「LED」 で検索し3,494件の記事が見つかったケース (検索対
象の媒体, 期間の選択により件数は異なる)。 3,494件の記事がどのよう
な 「主題語」 「分類語」 で何件に絞り込めるかを提示している。
識ベースを構築し,言語理解的アプローチによる検
索用インデックスの生成処理を実現している(図7)
。
図 4 絞り込みキーワード候補の例
キーワード「LED」で検索し3,494件の記事が見つかったケース(検索対象の媒
図 4 絞り込みキーワード候補の例
体,期間の選択で件数は異なる)。3,494件の記事がどのような「主題語」「分
キーワード「LED」で検索し3,494件の記事が見つかったケース(検索対象の媒
類語」で何件に絞り込めるかを提示している。
体,期間の選択で件数は異なる)。3,494件の記事がどのような「主題語」「分
類語」で何件に絞り込めるかを提示している。
図5 検索結果の時系列表示の例
検索された3,494件の記事を時系列に仕分けたグラフを表示。 グラフをクリックすると, 検索結果を
当該期間のものだけに絞り込むことができる。 また対象期間を, グラフ下のスライダー (囲み) を
図 5 検索結果の時系列表示の例
マウスで操作して設定することも可能である。
検索された3494件の記事を時系列に仕分けたグラフを表示。グラフをクリッ
クすると,検索結果を当該期間のものだけに絞り込むことができる。また対
情報管理 vol. 57 no. 12 2015
象期間をグラフ下のスライダー(赤い囲み)をマウスで操作して設定すること
も可能である。
903
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
LEDに関わる
プレイヤーを知る
(製造、販売、研究・・・)
建設業界での
LED活⽤事例を
調べる
LEDの事業化の⼀例
「照明」に話題を
絞り込む
研究開発の記事
に絞る
最新の市場調査を確認する
LEDに関するキーマンの声を聞く
図6 キーワード「一般:LED」での検索例
タグの横の数字は, そのタグで絞り込んだときの検索結果の件数を表す。
表1 主題語
会社名
団体名
人物名
上場会社, 非上場 (日経会社コードつき) 会社,
その他主要会社
省庁, 大学, 政党などの団体名
日経WHO'S WHOや記事頻出の有名人
一般用語
その他名詞
表2 分類語
テーマ
業界
地域
記事種別
記事の主題を表す内容別の分類。 分類体系は 「企
業活動」 (大分類 : 企業) と 「企業を取り巻く環境」
(大分類 : 政治 ・ 経済 ・ 技術 ・ 社会) から構成。
記事の主題と関連する業界別の分類。 日経新業種
分類をもとに定義。
記事の主題と関連する地域別に 「海外地域」 「国名」
「国内地域」 単位で分類。
記事のタイプ別に7種類に分類。
インタビュー, 調査 ・ 統計, 社説…など
記事ごとに付与されたタグは,記事本文を表示し
た画面で確認できる。「その他の書誌事項を表示」を
クリックする(図8のa)と,カテゴリー別に生成さ
れたタグが表示される。
たとえば,2014年7月9日付日本経済新聞朝刊の記
事「東大・日経の物価指数,脱デフレ,検証の一助に,
904
図7 検索用インデックスの作成
インデックス抽出処理と自動記事分類を組み合わせて, 多様なタグを検
索用インデックスとして付与する。
が付与されている(図8のb)。
これまでの成果として,各カテゴリーのタグは
動向きめ細かく把握。」では,キーワード抽出処理か
90%以上の精度で適切に付与されていることがわ
ら「会社名」
「団体名」
「一般用語」のタグが付与され,
かった。中でももっとも精度が求められるのが,日
自動記事分類技術から「テーマ」「記事種別」のタグ
経会社コードをもつ会社(約2万社)が記事中に主題
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
a
にある。辞書はそれが可能となるように,単語を限
「その他の書誌情報を
表示」をクリックする
定し構造化して作られており,むやみに単語を登録
するような作業は行っていない(図9)。
このルールによる検索用インデックスの識別の
もっともわかりやすい例が「人名(フルネーム)
」の
b
[主題語]と[分類語]のカテゴリー
抽出処理である。
辞書にフルネームで登録されている人名は12万語
である。しかし,インデックス生成処理では,姓と
付与されたタグ
名の情報からフルネームが動的に検索用インデック
スとして生成可能になっている。
たとえば,山田という「姓」と亜衣,亜唯,阿衣
という「名」により,以下のようなテキストから,
人名を正しく抽出して返すことができる。
図8 タグの付与例
記事本文を表示する画面にて記事ごとに付与されているタグを確認できる。
語として登場したときに,正しくそのコードをタグ
として付与することである。同じ会社名が複数存在
する場合は,記事本文中に登場する住所や社長の氏
名などを手掛かりに判定することもあり,会社名の
同定には,同様の精度を実現している。
「山田亜衣さんが…」
→人名「山田亜衣」
「山田亜唯さんが…」
→人名「山田亜唯」
「山田阿衣さんが…」
→人名「山田阿衣」
このとき辞書に「山田亜衣」
「山田亜唯」
「山田阿衣」
が登録されていなくても抽出できるのである。
つまり,フルネームで辞書に登録されている12万
語に加え,「姓」として登録されている語と「名」と
して登録されている語の組み合わせで生成されるす
3.2 検索用インデックス採否プロセスの変化
べての人名が検索用インデックスとして抽出可能と
言語解析処理では,形態素解析注1)をいかに正しく
行うか,そしていかに多くの言葉をカバーした辞書
とシソーラスを整備しておくか,という点が重要で
ある。
ただし,この手法では辞書に未登録の言葉はイン
デックスとして採用されない可能性が高い。また同
表記異義語がある場合はどのシソーラス語を適用す
べきか,という判断を機械的に行うことは困難で,
人手による正誤チェックが欠かせない。そして,人
手作業によるメンテナンスを待っていると,正しい
用語を検索サービスに反映させるまでに時間を要し
てしまう課題も抱えていた。
一方,今回新たに構築した言語解析処理の最大の
特徴は,知識ベースによるルールにもとづいて,辞
書に登録されていない用語を認識して抽出できる点
図9 言語解析と言語理解
言語理解的な処理工程を追加して, 検索用インデックスの抽出 ・ 生成と
属性判定を行う。
情報管理 vol. 57 no. 12 2015
905
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
なっている。
て採用することができる。なおインデックスには分
類名と一緒に分類語コードも付与されている注2)。
3.3 自動記事分類技術がもたらしたメンテナンス
作業への効果
「テーマ」には企業,経済,政治,社会などにわたっ
て約140のタグがある。過去の記事データを自動記事
これまでのインデックス生成処理は,形態素解析
分類で分析した結果をもとに採用するテーマを定め
→品詞判定(構文解析)→辞書マッチングという流
ている(表3)
。
「業界」では日経NEEDS業種・中分類
れを機械的に行い,その後に人手作業で辞書に未登
に基づく63業界をタグとして付与している(表4)
。
録語を追加したり,適切なキーワードを付与したり
するメンテナンスを行っていた。
2014年12月には,この新しい検索用インデックス
生成処理法を,記事検索メニューに収録する全媒体
これは,同じ概念の事柄であれば決まったキーワー
に適用するとともに,過去蓄積分についても2008年
ドを付与する「統制語」の考え方にもとづいたもの
分まで遡 って再インデックス化を行った。人手のメ
であり,統制語は「シソーラス」で単語の包含関係
ンテナンス作業が従来に比べて省力化される効果も
を管理している4),5)。シソーラスはキーワード検索で
あった。
さかのぼ
は有用であったが,記事テキストの全文を対象とし
た検索が一般的となった今日では,利用者への浸透
ご
い
度や語彙の新鮮さに課題があった。
また,検索用インデックスとして採用された統制
語が誤っていた場合や,辞書に未登録のため統制語
として採用されなかった新登場の単語があった場合
は,人手で検索用インデックスを編集したり,辞書
へ単語登録したりする作業を行っている。
ただし,人手作業が及ぶのは,日経各紙(日経朝
夕刊,日経産業,日経M J,日経ヴェリタスなど)ま
でとなり,外部から提供いただいた記事データにつ
いては,提供会社から指定された単語・分類語と,
機械処理で追加された統制語を採用するにとどまっ
ていた。
表3 「テーマ」の例
分類名
事業組み替え
共同出資会社設立
新規事業進出
事業 ・ 企業の買収
経営統合
分社化 ・ グループ再編
既存事業の強化
既存事業の縮小 ・ 撤退
事業 ・ 企業売却
経営破たん
資本参加
業務提携
提携解消
会社設立
海外進出
分類語コード
#W10101
#W10102
#W10103
#W10106
#W10107
#W10108
#W10109
#W10110
#W10111
#W10112
#W10113
#W10114
#W10115
#W10116
#W10117
※ 「企業>事業組み替え」 分野のタグの一部。
新しいインデックス生成処理は,抽出された言葉
が辞書に未登録であっても,自動記事分類技術を使っ
た知識ベースでインデックス判定ができるので,日
経各紙に限らず,日経テレコンに収録するすべての
新聞・雑誌・ニュース媒体を対象に適用することが
できる。
自動記事分類技術は記事文脈にもとづいて約500
(分類語[テーマ,業界,地域,記事種別]の合計数)
種類程度のタグを付与しているので,記事中に表れ
ていない用語でも文意での検索用インデックスとし
906
表4 「業界」の例
提供分類
石油 ・ 鉱業 ・ エネルギー
電力 ・ ガス
繊維 ・ 紙 ・ パルプ
化学
鉄鋼
非鉄金属 ・ 金属製品
重機 ・ 建機 ・ プラント
産業用ロボット ・ 工作機械
医療用機器
コンピューター ・ 通信機器
複写機 ・ プリンター
電機 ・ 家電
分類語コード
#B0010
#B0020
#B0030
#B0040
#B0050
#B0060
#B0070
#B0080
#B0090
#B0110
#B0120
#B0130
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
4.「ナビ型記事検索」の評価と課題
・ 期間選択のスライダーを両端から動かせるよう
にして操作性を改善
「ナビ型記事検索」は,日経テレコンを使い始めた
ばかりの方には大変好評である。
2014年10月に日経テレコン利用者を対象にアン
ケートを行った際に,「ナビ型記事検索」利用者の6
割近くから「使い始めから戸惑うことはほとんどな
かった」という回答を得た。また,
「ナビ型記事検索」
・ 画面での分類語・主題語の説明を強化
・ 絞り込みキーワード候補を4列表示にして横スク
ロールを廃止
5.「ナビ型記事検索」から他メニューへの
展開
の魅力点として,
・ キーワードを入力すると候補語が表示される。
・ 検索した後に「絞り込みキーワード候補語」が表示
「ナビ型記事検索」で実現した自動記事分類を使っ
た新しい検索用インデックス生成処理は,他のメ
ニュー・機能でも活用が始まっている。
される。
・ 検索結果の件数が対象期間でグラフ表示される。
の順で多くあげられていた。
5.1直近の新展開:クリッピングへの応用
その一方で,従来型の記事検索を使い慣れている
新しい検索用インデックス生成処理は,日経各紙
利用者は,なかなか「ナビ型記事検索」の方に定着
だけでなくすべての媒体に適用されている。この結
しづらいようで,次のような意見を得た。
果,各媒体をまたがって,品質が一定した共通のタ
・ 慣用的に使用されている言葉をキーワードにす
ると,検索が難しい場合がある。
・ 使いたいと思う候補語が表示されていない。
・ 検索結果から不必要なものを “除く” ことができ
グを検索用インデックスとして付与できているので,
同じ検索でも媒体間のブレを吸収することができ,
一括検索の精度が格段に向上している。
この特性を生かして,クリッピングできる媒体の
数を一気に増やしている(2014年12月時点で90媒体
ない。
・ 操作方法によっては従来型の記事検索よりタイ
ムロスが多いようだ。
に対応済み)
。
クリッピングとは,各媒体の最新の記事データが
そこで,演算子(AND,OR,NOT)を使用した検
日経テレコンに収録されるタイミングで,利用者が
索を行いたい場合や,検索範囲(見出しのみ,など)
あらかじめ登録したキーワードにヒットする記事が
あればメールでお知らせを受け取ることができる機
「ナビ型記事検索」では「検索
図を指定できるように,
9 言語解析と言語理解
言語理解的な処理工程を追加して,索引語の抽出・生成と属性判定を行う。
能である(クリップメール機能)
。
オプション」を設けている(図10の囲み枠参照)。ま
た2014年12月には利用者の声を参考にして,以下の
対応を行った。
5.2 今後の計画:業界サマリ
日経テレコンの業界情報メニューの中に,「業界サ
マリ」というサブメニューがある(図11)
。このメ
ニューでは,
利用者が調べたい “業界” と “テーマ”(記
事が扱う話題)を選択するだけで,その業界に関す
る情報を記事検索データベースから自動的にピック
アップして提供している。「自社や取引先の業界の現
図10 検索オプションの設定
図 10 検索オプションの設定
状と今後の展望などの全体像を把握する」といった
情報管理 vol. 57 no. 12 2015
907
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
[業界を選択]をクリック
6. おわりに
「ナビ型記事検索」をスタートしたときに「迷わな
い」というキャッチコピーで新聞広告を出した。
「知
4種類のタブをクリックすると
画面が切り替わる
見出し一覧から記事を
選択
りたい情報へ,もう迷わない,迷わせない」という
コンセプトであったが,
「特別な検索スキルがなく
ても自然な流れで欲しい情報にたどり着ける検索メ
ニュー」の探求はまだまだ始まったばかりだと認識
している。
今後は,ナビゲーションの精度を高めていくこと
図 11 日経テレコン
業界サマリメニュー
図11 日経テレコン 業界サマリメニュー
はもちろんであるが,利用者が欲しい情報にたどり
着いた後の意図も理解して,関連情報を提示したり,
ニーズに素早く応えるメニューである。
2015年にはこの業界サマリに「ニュースページ」
新たな気づきを与える情報に導いたりするレコメン
ド機能も有用だと考えている。
を追加する予定である。最新の新聞記事やニュース
また,タップ操作が中心となる携帯端末向けサー
から,業界や主要企業の日々の動きをウォッチでき
ビスでは,タグを生かしたインターフェースでモバ
る機能で,次々と発生する最新情報を,業界別,トピッ
イルワークスタイルならではの情報収集を実現する
クス別,企業別に自動的に仕分けるところに,自動
サービスを提供していきたい。
記事分類技術を応用する予定である。
本文の注
注1) 文章を意味のある単語に区切り,辞書を利用して品詞や内容を判別すること。
注2) 日経テレコンヘルプサイト ナビ型記事検索・分類語一覧. http://t21help.nikkei.co.jp/reference/
cat845/post-563.html
参考文献
1) 「日経テレコム」きょうスタート,生の経済情報を瞬時に. 日本経済新聞. 1984-04-02, 朝刊, p. 7.
2) 末吉行雄. NEEDS,日経テレコンの思い出(
〈連載〉オンライン情報検索:先人の足跡をたどる(5)
)
. 情報
の科学と技術. 2008, vol. 58, no. 8, p. 408-414.
3) 出口信吾. 利用者の変化に合わせた新聞記事サービスへの取り組み. 専門図書館. 2011, no. 250, p. 16-22.
4) 神尾達夫. CTSを利用した新聞記事の画像データベース作成. 情報管理. 1989, vol. 31, no. 11, p. 933-941.
5) 神尾達夫. 新聞記事データベースにおけるキーワード自動抽出. 情報管理. 1989, vol. 32, no. 4, p. 283-293.
908
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
Author Abstract
Nikkei Telecom, providing business information via the Internet, released new search interface "navigation
type article search" that introduced a new technology called automatic article classification process. Compared
to full-text search, the new search significantly improves the relevance ratio of the search results, and makes
the user to narrow down the search results while reflecting their intentions. In this paper, while introducing
"navigation type article search", I describe the overview of automatic article classification techniques.
Key words
Nikkei Telecom, article, search, automatic classification, navigation type, language analysis, language
understanding, keyword, thesaurus, index
情報管理 vol. 57 no. 12 2015
909
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
NBDCヒトデータベース
運用開始から1年で見えてきた新しい課題
NBDC human database
Emerging challenges after one year operation
箕輪 真理1 川嶋 実苗1 三橋 信孝1 堀尾 徹1
MINOWA Mari T.1; KAWASHIMA Minae1; MITSUHASHI Nobutaka1; HORIO Toru1
1 独立行政法人科学技術振興機構バイオサイエンスデータベースセンター(〒102-0081 東京都千代田区四番町5-3)
1 National Bioscience Database Center, Japan Science and Technology Agency (5-3 Yonbancho Chiyoda-ku, Tokyo 102-0081)
原稿受理(2015-01-05)
情報管理 57(12), 910-917, doi: 10.1241/johokanri.57.910 (http://dx.doi.org/10.1241/johokanri.57.910)
著者抄録
科学技術振興機構バイオサイエンスデータベースセンター(NBDC)が,倫理的配慮や安全な取り扱いを必要とするヒ
トに関するデータを取り扱う「N B D C ヒトデータベース」の正式な運用を 2013 年 10 月に開始して 1 年が経過した。
本稿では,このデータベースについてあらためて概説し,現況も報告する。併せて 1 年間の運用に際して生じた実際
上の問題から主要なものについて対応方針を紹介し,今後の運用に向けた課題とその対策などについて考察したい。
キーワード
ヒトデータ,データベース,共有,制限公開,倫理,セキュリティー,個人ゲノム
1. はじめに
スプロジェクト」の成果を引き継ぐ形で,これらを
基礎研究に利活用できるようにするさまざまな取り
生命科学においては多様な分野で公的資金が用い
組み「ライフサイエンスデータベース統合推進事業」
られたデータベース(以下,DB)が作成されているが,
を実施している1)。現在対象となっている生物種は微
分野ごとに記述内容や実験手法が異なっていること
生物からヒトまで,またデータの種類もゲノムから
や,これまで一元的に受け入れる仕組みがなかった
化合物,文献まで多岐にわたるが,これらのデータ
ことから,散在したままで有効に活用できていなかっ
の形式をそろえたり,意味づけをしたり,利用に関
た。バイオサイエンスデータベースセンター(National
するライセンスを明示したりすることで,データの
Bioscience Database Center: NBDC,以下,NBDC)
利便性を高めている2)。このようなD Bは生命科学研
では,文部科学省委託研究開発事業「統合データベー
究のインフラとして研究の効率的な推進のためには
©2015 JST Licensed Under CC 表示21 日本
910
NBDCヒトデータベース
必須のものとなっている。
ためのルールレベルではなかった。そのため,N B D C
一方で近年,ヒトの個人レベルのさまざまなデー
では,ヒトを対象とした研究データの共有化を進める
タ・情報取得を目的としたUK Biobank3)や東北メディ
ための「N B D Cヒトデータ共有ガイドライン」8)なら
カル・メガバンク4) のような大規模プロジェクト
びに「N B D Cヒトデータ取扱いセキュリティガイドラ
が国内外で推進されている。従来の特定の疾患につ
イン」9)を策定し,2013年4月25日より公開した10)。
いて限定的な地域や集団の中で行われてきた疾患コ
ガイドラインの整備にあたり方針としたのは,
ホート研究とは大きく異なり,将来的にさまざまな
(1)ヒトに関するあらゆるデータが対象
研究の基礎となるデータの取得が目的の1つなので,
(2)多様なデータに対応するために,ガイドライン
膨大なデータが産出されることになるが,これらの
そのものはシンプルに
データは関係者のみで占有することなく,広く共有
(3)データ共有方針や社会的な理解の変化,関係す
してこそ価値が最大化できる。そこでデータを収集・
る法律やガイドラインの改訂に柔軟に対応
公開するための公的な仕組みが必要となるが,その
(4)格納データは匿名化情報のみ
実現には倫理的な問題やデータの安全な取り扱いの
(5)データ提供/利用に関する審査はNBDCが実施
情報セキュリティーに関する問題をいかにクリアす
(6)提供データにはNBDCからID番号を発行し,その
るかが重要なポイントである。
2. NBDCヒトデータベースとは?
メタデータをWebサイトに公開
(7)インフォームド・コンセント(Informed Consent:
IC)で提示された条件は利用時の制限事項として
採用
NBDCでは,生命科学分野のDB統合を実施する研究
(8)データ利用につき,年次(終了)報告書の提出
開発プログラム「統合化推進プログラム」
(
「ライフサ
および成果公開時の謝辞記載等を義務付け
イエンスデータベース統合推進事業」の一部)を実
(9)セキュリティレベルの確保のためにチェックリ
施しており,2011年度採択課題として「ヒト脳疾患
ストにより具体的な手順を明示
画像」
「ヒトゲノム疾患情報」
「ゲノム疫学情報」といっ
といった点である。これらの原則にもとづき,ガイ
た,ヒト由来データを対象とする課題が含まれてい
ドラインにはデータ提供時,およびデータ利用時の
たため,
公開の受け皿を整備する必要があった。また,
条件や手順等の詳細が示され,それぞれの申請を審
研究の効率化や論文の検証のためのデータ共有につ
査するData Access CommitteeとしてNBDCヒトデー
いて世界的な関心が集まり,ヒト由来データを扱う日
タ審査委員会を設置した。
本国内の拠点としてNBDCが機能する必要性が高まっ
ルール作りの一方で実際にデータを共有するため
ており,あらかじめヒト由来データの取り扱いについ
のプラットフォームを国立遺伝学研究所(DNA Data
て整理しておかなければならなかった注1)。
Bank of Japan: DDBJ)と協力して構築し,NBDCヒ
それまで,日本には関連する指針として「ヒトゲノ
トデータベース(以下,本D B)の運用を2013年10
ム・遺伝子解析研究に関する倫理指針(いわゆる三
(図1)。D D B Jは,米国国立衛生研
月より開始した11)
「疫学研究に関する倫理指針」6)および「臨
省指針)
」5)
究所(N I H)傘下の国立医学図書館(N L M)の1部門
床研究に関する倫理指針」注2),7)などがあった。しか
である国立生物工学情報センター(N C B I)や欧州分
し,これらはヒト由来のデータ(=情報)に特化した
子生物学研究所(E M B L)の1部門である欧州バイオ
ものではなく,また指針の性格として大まかな方針
インフォマティクス研究所(E B I)と同様に,I N S D C
を示すものだったため,実際にD Bを構築,運用する
(International Nucleotide Sequence Database,DNA
情報管理 vol. 57 no. 12 2015
911
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
図1 本DB運用の全体図とDDBJとの連携
等の配列情報の世界的な共有の枠組み)の一員であ
に必要なガイドラインの策定や審査についてはNBDC
り,利用にあたって審査が不要なデータについては
が担当するという協力関係を結んで,本D Bの運用に
その大半を3極間で交換している。近年,さまざまな
あたることとなった。なお,dbGaP,EGA,JGA間では,
解析手法の進展により,全ゲノムをはじめとする個
データそのものの交換は行われず,メタデータのみ
人レベルのデータが蓄積される研究が数多く実施さ
が交換される予定で,それぞれのD Bが保有する制限
れている。研究費助成機関であるN I Hやウェルカム
公開データは,各機関で利用申請が受け付けられる
財団からの求めに応じて提供されたこれらのデータ
予定である。
を格納するための公的DBとして,NCBIではdatabase
of Genotypes and Phenotypes(dbGaP)12),EBIでは
European Genome-phenome Archive(EGA)13)が
3. データ提供時,データ利用時の審査手
続き
整備されてきた。日本においても文部科学省や厚生
労働省からの助成などの条件として,研究成果とし
912
本DBへのデータ提供に際してもっとも重要な点は,
てのデータを公的D Bへ格納することが要求され始め
試料提供者の検体を用いて産出したデータをD Bに提
たことや,論文投稿時に根拠となる次世代シーケン
供し,研究者間で共有することが試料提供者に理解
サーデータの公的D BのI Dを要求されるようになった
されているとともに,データの共有が倫理的に承認
ことを踏まえ,日本人のデータを国内で安全に保管
されているかという点である。そのためには,試料
し活用する仕組みが必要となった。このときD D B J
提供者に提示されたIC(説明文書や同意文書)に “デー
はdbGaP,EGAに相当するDB,Japanese Genotype-
タ共有” に関する文言が含まれていること,また,I C
phenotype Archive(JGA)14),15)の構築に着手して
にもとづいた研究計画上でデータを公的D Bに提供す
いたため,データ保管の仕組みはDDBJが,DBの運用
るという点が所属機関の倫理審査委員会による承認
NBDCヒトデータベース
を受けていることが要件となる。ただし,現在デー
ている1,000人規模の健常者の頻度情報などへの関心
タが提供されようとしているプロジェクトの中には,
が高く,ダウンロード数も多い。
過去にICを取得した時点では “データベース” や “デー
提供申請に関してガイドライン作成時には想定し
タ提供” についての想定がなく,また再度I Cを取得す
ていなかった状況が生じたり,関係者や提供申請者
ることが相当に困難なケースもある。本D Bが稼働開
等からの指摘により,検討すべき事項も発生した。
始してから年数が浅く,現在は過渡期であるとして,
その中から主要なものについて,検討内容を紹介し
“データ提供” に関しては,所属機関の倫理委員会の
たい。
審査および所属機関長による承認のみでも提供を受
け付けることにしている。
また,利用申請の際,必要となるのが,研究代表
4.1 研究機関に所属していない個人からのデータ
提供申請
者の当該分野での研究経験の判定と利用施設での情
米国で2006年に設立された23a n d M eは,一塩基多
報セキュリティー状況の確認である。これについて
型(Single Nucleotide Polymorphism: SNP)の解析お
は,関連論文の提示と,セキュリティーチェックリ
よびそれにもとづく体質や疾患リスクの予測をW e b
ストの提出を求めている。特に,セキュリティーに
サイトから閲覧できるサービスを提供していた。米
関しては,これまで具体的な実施基準を示すものが
国食品医薬品局(F D A)が,このサービスを医療的
なかったため,大学等で個人情報を含むデータの保
な診断と見なされると判断したことから米国では現
管が行われているケースのセキュリティー対策や,
在,祖先に関する情報提供に限定している 注3)。し
D D B Jとの検討も踏まえ,なるべく具体的なルールを
かし,米国の女優が遺伝子診断にもとづき,乳がん
示しながらも,特定の装置やソフトウェアに依存す
リスクを回避するための手術を行うなど,遺伝子診
ることがなく,具体的な対策には各機関に一定の自
断への期待も高まっており,次世代シーケンサーの
由度を認めることができるようにという観点で作成
技術の進歩による価格低下なども進んだ。D i r e c t T o
されている。セキュリティー対策については,新た
Consumer(DTC,医療機関を介さずに直接消費者に
な技術の出現や,逆に漏えいリスクの増大なども懸
対して行われる)遺伝学的検査や病院での検査結果
念され,今後も常に検討を重ねていかなければなら
として,個人が遺伝情報を入手できるケースが増え
ない。
てくるのは間違いない。研究機関に属さない個人が
4. 本DBの現況と運営からみえてきた課題
何らかの目的で自身のゲノム情報を公的なD Bに登録
したいと考える可能性がある。結果を先に述べると,
倫理審査を受けていない個人からのデータ提供を本
本D Bの運用開始から1年間が経過し,2014年12月
D Bでは受け付けない。所属機関の倫理委員会によっ
1日現在,国内の大型プロジェクトをはじめとして各
てデータの共有が承認されていることを必須とする,
種プロジェクトから,データ提供申請を31件受理し,
という現行のガイドラインに従ったためである。次
そのうち,オープンデータ5件,制限公開データ4件
の点を重要とした。
を公開した(そのほかは,公開待機,データ登録作
・ 研究機関や企業の研究所等でヒトを対象とした
業中,審査中など)。利用申請が必要な制限公開デー
研究を遂行する場合,必ず倫理審査委員会に研
タについては,特定の疾患患者の少数例などのため,
究計画書を提出し,倫理的に問題がないか審議
第三者が申請して利用するというケースはまだない
され承認を受ける必要がある。
が,利用者からは,オープンデータとして公開され
・ 上記より,データ共有についても機関の長が責
情報管理 vol. 57 no. 12 2015
913
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
任をもつ形となっている。
・ 倫理不正や不適切なデータ使用,ルール違反を
罰する法律が日本の国内にはない。
ただし,今後も情勢を見ながら適宜見直しを行っ
ていく。
なお,検討時には,次のような意見もあったこと
を付記しておく。
における倫理審査委員会に提出した書類にて,
その提供申請を受け付ける。
B . 上記どちらの条件も満たさない場合は,以下の
いずれかの方法とする。
・ 現在の所属機関の倫理審査委員会において「D B
へのデータ提供および研究者間での共有」につ
いて審議・承認を受ける。
・ ゲノム情報は特に,個人の情報であっても血族
・ 何らかの理由で所属機関の倫理審査委員会によ
にまで影響を及ぼすため,どの範囲までの承認
る審査を受けられない場合は,当該研究の研究
が必要なのか,などの判断が難しい。
分担者の所属機関における倫理審査委員会に審
・ 解析結果の品質保証についてどのように担保す
るか。
議を依頼する。
・ ほかに研究分担者が存在せず倫理審査委員会へ
審議を依頼できない場合には,データ提供申請
4.2 所属機関が変更,もしくは研究の継続が困難
になった研究者からのデータ提供
を受け付けない(ただし,データの散逸を防ぐ
という観点からは今後見直しが必要)
。
研究計画書が所属機関の倫理審査委員会に承認さ
なお,欧米では,研究開始時にデータ共有プラン
れてから本D Bへデータを提供するまでに時間を要す
も同時に提出することが求められており,データ提
るため,研究代表者の所属機関の変更や退職(退官)
供の範囲や期限について明確になっているため,こ
しているケースがあった。このような状況は当初の
のようなケースはあまり想定されていないと思われ
ガイドラインでは想定しておらず,運用上対応でき
る。日本でもいくつかの研究助成においてはデータ
なかったため,別途方針を決定する必要が生じた。
の提供が要請されている。しかし,具体的な計画に
現行の本DBへのデータ提供条件としては,
ついての事前の提出は求められていないため,今後
・ ICの説明同意文書および研究計画書に,「DBへの
はデータ共有プランを求めるところまで進めば,迅
データ提供および研究者間での共有」について
速な共有化が促進されるだろう。
記載されており,所属機関の倫理審査委員会に
おいて承認され,所属機関の長の許可を得られ
ていること。
・ 上記事項がI Cの説明同意文書に記載されておら
914
4.3 データの不正利用時の対応
N B D CはN I Hやウェルカム財団のような幅広く包括
的な助成機関ではないため,不正利用された場合に
ず,また,再同意を得ることが難しい場合は,
も,データ利用者に当該データの利用を停止すると
その旨を所属機関の倫理審査委員会によって審
いう限定的な措置しかガイドラインには指定してい
議され承認されていること。
なかった。しかし,
「もう少し積極的な対応が必要」
「可
としているが,データ提供者の労力を考慮し,所属
能であれば罰則規定を強化すべき」という意見が寄
機関や職務内容の変更後の提供申請の受け付け方針
せられた。そのため,以下の点で,不正への対応を
を以下のようにした。
強化することを検討した。
A . 上記どちらかの条件を満たす場合,現在の所属
・「違反が認められた場合」⇒「違反,データの不
機関の倫理審査委員会による承認を得られてい
正利用,セキュリティー対策の虚偽などが疑わ
なくても当該データを産出した当時の所属機関
れる場合」で「
(NBDCヒトデータ審査委員会が)
NBDCヒトデータベース
不正と判断した場合」
・( 追記)
「加えて,不正を行った研究者からの新
規利用申請を一定期間受け付けない。」
4.5 国際的な共有に向けた対応
本D Bの制限公開データを格納するJ G Aはd b G a P,
EGAとの間でメタデータの交換を予定していることも
・(追記)「必要に応じて所属機関長に報告する。
」
あり,今後は国際的な利用申請が出てくることは必
・( 追記)
「状況に応じて,疑いがある段階で利用
至であるため,W e bサイトの英語化を現在準備中で
停止を命じることがある。」
ある。各D Bで保持するデータについての利用申請は
このガイドラインの規定を根拠に民事上の責任を
それぞれの機関(あるいは傘下のプロジェクト実施
問うことはできるが,不正利用の抑止効果を高めるた
機関)で行われる。各基準やルールに従う必要があ
めには刑事罰が与えられることが望ましい。ところが,
ることはもちろんだが,海外にデータが1度出た場合
本D Bは匿名化された情報のみを取り扱うことから,
に,報告義務や利用後の削除などを「どうすれば確
たとえば,個人情報保護法上の違反行為を適用した
実に履行してもらえるか」
「セキュリティーのレベル
刑事罰の適用は難しい。そこで,有識者から不正競争
はきちんと担保されるか」の確認など,現実的な課
防止法16)の適用が可能という示唆を得た注4),17)。万
題は多い。一方で,2013年に活動を開始したG l o b a l
が一の場合はこのような法的な対応も検討したい。も
Alliance for Genomics and Health(GA4GH)18)では,
ちろん,そういう事態が生じないことを第一に望んで
臨床情報も含めたヒトデータの共有に向けて動き出
いる。
している。NBDCも活動に参加することを表明してい
上記の内容については,2014年12月8日に開催され
るが,現在の本D Bの体制のままでは対応できない点
たデータ共有分科会で議論され,ガイドラインの改
について,今後世界の動きに遅れないように事前に
訂案がまとめられたところなので,そのほかに検討
検討することが急務である。
された事項と併せて,近日中に改訂ガイドラインが
公開される予定である。
5. まとめ
ガイドラインの改訂には反映されないが,検討を
進めている課題を4.4と4.5にあげる。
本D Bは,最低限必要なルールだけを決め,個別申
請については実運用に預ける形で走り始めた。そし
4.4 既存のヒトDBとの統合化
て,さまざまな提供申請に直面し,そのたびに関係
「統合化推進プログラム」の課題の1つである「個
者やヒトデータ審査委員会の先生方に諮りながら対
別化医療に向けたヒトゲノムバリエーションデータ
応してきた。国内初となる公的なヒトD Bの運用に際
ベース」においては,従来よりゲノムワイド関連解
しては,米国や欧州での先行するD Bを見ているだけ
析(GWAS)および疾患関連遺伝子領域のリシーケン
ではわからない問題が多々あり,実運用を始めるこ
スデータを蓄積し,公開してきた。これらのデータ
とで具体的にみえてきた。この1年数か月の間に寄せ
について,D B運営者およびデータ提供者との協議の
られた,DBを運用する側,データ提供者,利用者といっ
うえで本D Bのガイドラインにもとづいてデータの共
たさまざまな指摘については,引き続き検討の必要
有を行う予定である。ほかにも限られた分野で公開
がある課題も多いが,今回ガイドライン改訂にあたっ
されているヒト関連のデータがあれば,同様の考え
ては現時点であげられていた多くの検討事項を盛り
方で統合化を進めたい。
込み,現実に即したガイドラインとすることができ
たと考えている。D B運営の事務局としては,日々生
じる問題に追われていたが,実際に挑戦してみて考
情報管理 vol. 57 no. 12 2015
915
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
えるという方法が必要だったように思う。
様なデータの受け入れを目指している。本D Bの運用
今後,本D Bの提供/利用とも増加が見込まれてい
にはデータに対する専門知識が必要なので,生命科
るが,この誌面をお借りし,ともに運用に携わって
学のさまざまな分野の知識が生かされると思う。本
くださるメンバーを募集している。現在はほとんど
D Bの運用を通じて,先端的な生命科学を支える活動
がゲノムを中心とした提供申請であるが,今後は多
にかかわりたい方の参加をお待ちしている。
本文の注
注1) 本データベースを取り巻く状況の詳細については川嶋の報告を参照されたい。川嶋実苗. ヒト由来試料
を用いた生命科学研究とデータ共有化:倫理面に留意したデータ共有への取組み. 医学のあゆみ. 2014,
vol. 251, no. 3, p. 227-232.
注2) 文部科学省および厚生労働省は,
「疫学研究に関する倫理指針(疫学研究倫理指針)
」および「臨床研
究に関する倫理指針」(臨床研究倫理指針)について両指針の統合を前提に見直しに係る合同会議を
開催。
「人を対象とする医学系研究に関する倫理指針(案)
」としてすでにパブリックコメントを終了
している。http://www.mhlw.go.jp/stf/shingi/shingi-kousei.html?tid=127726 (accessed 2014-12-16)
注3) 医療的な診断情報と見なされ,米国ではサービス縮小に追い込まれた23andMeは2014年12月欧州で遺
伝子検査サービスを再開した。https://www.23andme.com/en-gb/ (accessed 2014-12-16)
日本でも同サービスを受けることが可能である。http://xn--dna-wr0gx3c.com/ (accessed 2014-12-16)
注4) 本DBの制限公開データは不正競争防止法の2条6項に定義される「営業秘密」に当たるとの解釈も可能
だと考えられる。D Bからデータの公開を受けた研究者が,図利加害目的で,その営業秘密の管理に係
る任務に背き,媒体等の横領等の方法により営業秘密を領得する行為(同法21条1項の3号)や,この
者が当該営業秘密を図利加害目的で,その営業秘密の管理に係る任務に背き,使用または開示する行
為(同4号)や,また図利加害目的で不正の罪に当たる開示によって当該研究者が取得した営業秘密
を使用又は開示する行為(同7号)をした者については,10年以下の懲役若しくは1,000万円以下の罰
金(又はこれの併科)が科される(同法2条1項柱書)と考えられる。
参考文献
1) 白木澤佳子, 高木利久. ライフサイエンス分野のデータベース統合を目指して: バイオサイエンスデータ
ベースセンター(NBDC)の発足. 情報管理. 2011, vol. 54, no. 3, p. 144-151.
2) 高祖歩美. 生命科学分野におけるデータの共有の現状と課題. 情報管理. 2013. vol. 56. no. 5, p. 294-301.
3) UK Biobank. http://www.ukbiobank.ac.uk/, (accessed 2014-12-16).
4) 東北メディカル・メガバンク機構. http://www.megabank.tohoku.ac.jp/, (accessed 2014-12-16).
5) 文部科学省, 厚生労働省, 経済産業省. “ヒトゲノム・遺伝子解析研究に関する倫理指針”. h t t p : / / w w w .
lifescience.mext.go.jp/files/pdf/n1432_01.pdf, (accessed 2014-12-16).
6) 文部科学省, 厚生労働省. “疫学研究に関する倫理指針”. http://www.lifescience.mext.go.jp/files/pdf/
n1146_01.pdf, (accessed 2014-12-16).
7) 厚生労働省. “臨床研究に関する倫理指針”. http://www.mhlw.go.jp/general/seido/kousei/i-kenkyu/rinsyo/
dl/shishin.pdf, (accessed 2014-12-16).
8) バイオサイエンスデータベースセンター . “N B D Cヒトデータ共有ガイドライン”. h t t p : / / h u m a n d b s .
916
NBDCヒトデータベース
biosciencedbc.jp/guidelines/data-sharing-guidelines, (accessed 2014-12-16).
9) バイオサイエンスデータベースセンター . “N B D Cヒトデータ取扱いセキュリティガイドライン(利用者
向け)”. http://humandbs.biosciencedbc.jp/guidelines/security-guidelines-for-users/, (accessed 2014-1216).
10) 箕輪真理.『N B D Cヒトデータベース』の構築とデータ共有方針. 医薬ジャーナル. 2014, v o l . 50, n o . 3, p .
963-967.
11) NBDCヒトデータベース. http://humandbs.biosciencedbc.jp/, (accessed 2014-12-16).
12) database of Genotypes and Phenotypes (dbGaP). http://www.ncbi.nlm.nih.gov/gap/, (accessed 2014-1216).
13) European Genome-phenome Archive (EGA). https://www.ebi.ac.uk/ega/, (accessed 2014-12-16).
14) Japanese Genotype-phenotype Archive (JGA). http://trace.ddbj.nig.ac.jp/jga/index.html, (accessed 201412-16).
15) Kodama Y. et al. The DDBJ Japanese Genotype-phenotype Archive for genetic and phenotypic human
data. Nucleic Acids Research. 2014, vol. 13. doi: 10.1093/nar/gku1120, (accessed 2014-12-16).
16) 不正競争防止法. http://law.e-gov.go.jp/htmldata/H05/H05HO047.html, (accessed 2015-1-13).
17) 辰井聡子, 境田正樹, 高山佳奈子, 米村滋人, 曽我部真裕. 次世代医療の実現に向けた法制度の在り方:提言.
立教法務研究. 2014, vol. 7, p. 178-188.
18) Global Alliance for Genomics and Health (GA4GH). http://genomicsandhealth.org/, (accessed 2014-1216).
Author Abstract
About one year has passed since National Bioscience Database Center (NBDC) of Japan Science and
Technology Agency (JST) officially launched NBDC human database on October 2013 which shares human
derived research data requiring ethical consideration and the secure handling. In this report, brief introduction
and current status of NBDC human database, and some major examples of practical challenges experienced
during operation and discussions thereof are presented. Presumable problems in future operation are also
discussed.
Key words
human data, database, sharing, controlled access, ethics, security, personal genome
情報管理 vol. 57 no. 12 2015
917
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
連載:インフォプロによるビジネス調査
-成功のカギと役立つコンテンツ
第12回 情報の伝え方
Series: Keys to success of business research - tips and useful contents
Part 12: How to deliver data and information
上野 佳恵1
UENO Yoshie1
1 有限会社インフォナビ(〒113-0033 東京都文京区本郷6-20-4-5)E-mail: [email protected]
1 InfoNavi., Ltd. (6-20-4-5 Hongo Bunkyo-ku, Tokyo 113-0033)
情報管理 57(12), 918-923, doi: 10.1241/johokanri.57.918 (http://dx.doi.org/10.1241/johokanri.57.918)
集めた情報の伝え方によって,その価値は2倍にも
なりうるし,逆に半分にもなりかねない。情報の価
リサーチャーにかぎらず,調査業務の経験があま
りないビジネスパーソンにこのような話をすると,
値を高めるためには「何をどのように」伝えればよ
「言われたから調べただけであって,自分の意見や見
いのか。前回は伝えるべきことの基本となる,情報
解を述べるなど及びもつかない」という声を耳にす
を正しく理解し取捨選択を行っていく手順について
ることがある。そして「判断をするのは上司であっ
述べたが,そうやって絞り込まれた情報を「どのよ
て自分が意見を述べたところでムダである」「意見を
うに」伝えていくのか。ビジネス調査成功の最後の
述べて間違っていたら困る」などと言うのである。
カギである。
確かに,上司とは問題意識も違い,情報の見方も異
1. 調査結果の報告とは
なるだろう。こちらの意見などろくに聞いてくれな
いかもしれない。しかし,言われたから調べる,見
つけた情報をそのまま出す,というだけでは,子供
918
インフォプロがビジネス調査の結果を伝えるパ
の使いでしかない。調査を進めていく途中で気がつ
ターンには,2通りあると考えられる。1つは,集め
いたことは多々あるだろうし,情報を読み込んでい
た情報をあまり加工せずにそのまま渡す場合。そし
く過程で自分なりの見方や意見が出てきたはずであ
て,もう1つは集まった資料からわかることをレポー
る。多くの情報を得た調査担当者として,それを伝
ト形式にまとめる場合である。
えていくのも大切な役割の1つである。
図表に加工をしなくてよい,レポートにまでまと
インフォプロの場合も同様で,依頼を受けて調べ
める必要はないといっても,何もしなくてよいとい
たものだからといって,ただ情報を羅列して報告す
うわけではない。少なくとも集めた情報から何が言
るのでは存在意義はないに等しい。どのような調べ
えるのか,どんなことが読み取れるかぐらいのメッ
方をして,どんな情報があったのか,それともなかっ
セージがなくては,調査結果の報告とはいえない。
たのか,手に入った情報からどのようなことが読み
インフォプロによるビジネス調査‐成功のカギと役立つコンテンツ
取れるのか,などは最低限メッセージとして伝えな
たプランニングを適切に行っていれば,必要な情報
ければならない。さらに情報のプロとしては,入手
のモレは生じていないはずである。とはいっても,調
できなかった情報があった場合,その背景・理由や
査を進めていくと競合企業に関する情報が数多く出
どのような解決策が考えられるのかというオプショ
てきて,ついその収集・読み込みに手間をとられ,
ンが提示できるべきだろう。第9回「ヒアリングと自
消費者情報がおろそかになっていたり,政策が業界
主企画調査」でも述べたように,公開情報では得ら
の行方を左右していることがわかりP E S T(P o l i t i c s,
れない情報を見極め,目的に応じて調査の方向性を
Economy,Society,Technology)のフレームワーク注1)
変える,自主企画調査を行うなどの提案ができるこ
のPolitics(政治)の情報ばかりを集めてしまうという
とこそが,インフォプロのプロたるゆえんである。
ケース等が多々起こりうる。情報の収集→まとめ,と
いう一方向の手順で考えてしまうと,どこかでモレが
2. 情報をまとめる3つのポイント
生じていたり,情報の偏りがあったりしても気づかな
い恐れがある。まとめにかかる前にプランニングに戻
レポートにする場合は,プレゼンテーションソフ
り,リストアップした情報がすべてそろっているのか,
トなどを用い,データを表やグラフに加工しまとめ
フレームワークの中で足りない部分はないのか,とい
ていく。とはいっても,クライアントに対する企画
うことを確認することが重要なのである。
のプレゼンテーション資料ではないので,ビジュア
もっと言えば,常にリサーチプランを思い描きな
ルやイラスト・アニメーションなどの見た目に過度
がら調査を進めていけば,偏りが出そうな時点,モ
にこだわる必要はない。主役はあくまでも情報その
レが生じそうな場合にもすぐ気がつくことができ
ものであり,重要なのは相手にとって必要十分な情
る。プランニングがしっかりできれば調査は半分終
報を,わかりやすく・見やすく,適切なボリューム
わったも同然,と言うのにはこのような意味もある
で提示できるかどうかである。
(図1)。
コンサルティング業界ではMECEという言葉がよく
(1)必要かつ十分な情報か
調査を開始する前に,フレームワークなどを用い
使われる。Mutually Exclusive Collectively Exhaustive
図1 MECEの考え方
情報管理 vol. 57 no. 12 2015
919
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
の略で,日本語にすると「モレなくダブりなく」と
とができる。ただし,選ぶグラフの種類によって情
なる。モレがあるのはもってのほかだし,ダブりも
報の意味合いが的確に伝わらない場合もありうるし,
決して褒められたものではない。何かがダブってい
目盛の取り方などによっては間違ったイメージを伝
るというのは,そこにムダが発生しているというこ
えることにもなりかねない。グラフは形や線の傾き
とである。情報とて同じで,資料がたくさんあれば
などにより,ひと目で誰にでもわかりやすくメッセー
あっただけ役に立つわけではない。インターネット
ジを伝えられる反面,見た目のイメージが情報の本
検索で瞬時に大量の情報が手に入ると言っても,情
質を隠してしまうこともある。情報を伝えるのが第
報を検索・入手し,意味合いを理解するにはそれな
一の目的だとすれば,グラフのパターンも慎重に選
りに時間がかかっている。同様に,その情報を受け
ぶべきであるし,必ずしもグラフ化するのがよいと
取った側にも,情報を読み込み理解するのにはそれ
は限らないことを頭の片隅に入れておいた方がよい
なりの時間がかかることとなる。まさに「過ぎたる
だろう。
Journal of Information Processing and Management
なお
ごと
は猶及ばざるが如し」なのである。
情報のダブりに関しても,プランニングを意識し
すことがポイントとなる。過度な説明や解説,余分
ながら調査を進めていけば,関連する情報が多い部
な修飾語や語尾を削り,箇条書きにする。さらに,
分と少ない部分があるということにどこかで気づく
箇条書きの文章も「主語→述語」の順番でなくても
ことができる。すべての情報が同じレベルでそろう
よい。特にプレゼンテーションソフトでまとめる場
とは限らず,濃淡は必ずや発生するものではある。
合は,相手に文章を一字一句読ませるのではなく,
調査の途中でそれがわかれば,情報がある程度そろっ
抽出したキーワードを文字列として見せるくらいの
ている分野はいいとして,不足していると思われる
つもりの方がよいだろう(図2)。
分野を重点的に見直し,深掘りしていくなどの手が
とれる。
(2)わかりやすく見やすいか
(3)適切なボリュームか
レポートをまとめるにあたって,どのくらいが適
切かという基準は人によっても異なり,一律に決め
フレームワークを用いてリサーチプランニングを
られるものではない。読んでいる時間もないので2 ~
行っていれば,そのフレームワークはそのままレポー
3ページにまとめてほしいという人もいれば,関連す
トの章立てや見出しとして使える。たくさんの情報
る資料・生データをすべて提出してほしいというク
を前に,あらためてどう整理するか,どのような順
ライアントもいるだろう。資料の厚さがいまだに重
番にまとめていくか,などと考える必要はない。情
要視される業界もあると聞く。
報をまとめる枠組みも,実はプランニング段階です
でにできあがっているのである。
920
文章に関して言えば,文字数をできるかぎり減ら
一律の基準はないとしても,一般的に集中して資
料を読み込むことができる時間はどのくらいかと考
数値やデータは,できるかぎり表やグラフ化した
えれば,だらだらとした長いレポートは避けるべき
方がよいだろう。文章の中にただ数字を羅列してい
である。しかし一方で,必要十分な情報に絞り込ん
るのは極めてわかりづらい。表の数値は1つずつ見
だとしても相当のボリュームになってしまうことも
ていかなければならないが,それがグラフ化されて
ありうる。そのような場合は,主要なデータ・資料
いれば,ひと目で傾向をつかむことができる。情報
のみを先にまとめて,残りは資料編や参考資料とし
をわかりやすく伝えるには,一般的には表だけでは
て後付けする,などとしてメリハリをつけるとよい。
なくグラフにした方がよい。表計算ソフトなどを使
たとえば,太陽電池市場規模に関しては,太陽光
えば,さまざまなパターンのグラフはすぐに作るこ
発電協会の統計には用途別,素材別などのデータも
インフォプロによるビジネス調査‐成功のカギと役立つコンテンツ
・ 表と図の違い:太陽電池の出荷推移
数量(枚)
(a)
2008
2009
2010
2011
2012
2013
5,322,527
6,471,304
11,859,571
14,036,256
14,502,897
28,222,370
金額
(百万円)
(b)
213,686
215,045
343,042
369,161
369,635
662,135
ともに資料:経済産業省 生産動態統計
30,000
700,000
25,000
600,000
500,000
20,000
400,000
15,000
VS.
300,000
10,000
200,000
5,000
100,000
0
0
2008
2009
2010
出荷
2011
2012
2013
出荷
・ 文章表記
太陽電池の市場は2000年代後半以降立ち上が
り,2010年代に入り急速に拡大している。特に,
2012年から2013年にかけての拡大幅は目覚ま
しく,前年比○×%の伸びとなった…
・ 2000年代後半=市場の立ち上がり
VS.
・ 2010年代=拡大期
・ 2012-2013年=年率○×%と急成長
© InfoNavi, Ltd. 2015
図2 資料のわかりやすさ
図2 資料のわかりやすさ
あるが,調査目的から素材別のデータの重要性が低
見せていただく機会があるが,多くの場合1ページあ
いと考えられる場合は,全体・用途別のみのデータ
たりの情報量が多すぎて,何が言いたいのかが不明
を取り上げ,資料編に素材別データもあるというこ
瞭なケースが多い。
とを記載する方法などがある。
さらに,プレゼンテーションソフトには多くの機能
得られる情報量によってボリュームが変わるのは
が盛り込まれているために,何でも図にしてみたく
当然なのだが,初めの段階でどの程度のボリューム
なったり,文字の大きさや飾り,図やイラストの細か
が求められているのか,何ページぐらいまでなら許
い色や形にこだわったりすることで,無駄な時間が
容範囲なのかを確認しておくことも必要だろう。会
費やされることが多いようにも感じられる。
議などで調査結果を報告するのであれば,報告時間
情報を伝えるレポートして考えた場合,文書ソフ
によって,レポートの構成やページ数なども決まっ
トに表計算ソフトで作成した表やグラフを貼るなど
てくる。
して,順を追ってまとめていく方が,適切なケース
(4)レポート=プレゼンテーションではない
もあるだろう。レポートの目的,報告する相手,伝
プレゼンテーションソフトというのは,本来スラ
えるべき情報量なども鑑みて,どのような手段(ソ
イドとして視覚的に情報を相手に見せるためのもの
フト)を用いるべきかを考えてみてもよいのではな
である。したがって筆者は,情報を伝えることが第
いだろうか。レポート(情報をまとめる)=プレゼ
一義のレポートには,必ずしもプレゼンテーション
ンテーション(資料を作る)
,というわけではない。
ソフトを使う必要はない,と考えている。
プレゼンテーションソフトではページごとに情報
3. 行動につながる情報
をまとめる必要があるため,全体としてページ数が
多くなる傾向にある。逆に,ページ数を減らそうと
情報が相手に正確に伝わり,その内容を理解して
して1ページに2つも3つも表やチャートを入れたり,
もらうには,ここまで説明をしてきたとおりに,必
数行にもわたる文章を並べてしまうと,結果的に非
要かつ十分な情報をわかりやすく・見やすく伝える
常に見づらいものとなる。いろいろな会社の資料を
ことで可能となるであろう。しかし,情報を伝える
情報管理 vol. 57 no. 12 2015
921
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
ということはそれだけではない。
(1)情報の役割
野を広く保って情報にあたることができる。そうす
れば,プランニングの段階では必要情報リストに入
そもそも,情報とはどんな役割をもっているのだ
れていなかったことでも,最終的な目的から考える
ろう。インフォプロのもとにビジネス調査の依頼が
と役立つ情報が発見できるかもしれないし,依頼さ
あるということは,依頼者が新規事業や新製品開発
れた情報がなかなか見つからない場合でも違う視点
を考えていたり,市場環境の変化をとらえたいと思っ
から考えるなど別な方向に調査を展開していくこと
たり,消費者ニーズを探りたいという場合などであ
も可能となろう。
る。その目的はさまざまだが,共通しているのは情
そのためには,依頼を受ける際に調査の背景や最
報を活用して最終的には何らかの意思決定が行われ
終的な目的などについて,なるべく詳しい話を聞い
たり,方向性が定まったり,行動が起こされたりす
ておくことが欠かせない。昨今,メールで調査依頼
るということである。
がくるケースが多いことと思うが,どんなに詳しく
日常生活においては,ただ単に,面白そうだから
説明されていたとしても,メールでは文面に書かれ
知りたいなど,知的好奇心を満たすためだけに情報
ている以上のことはわからない。もちろん,確認し
を集めるということもあるだろう。しかしながら,
たいことがあれば何度かメールのやり取りをするの
ビジネスにおいては,報告でも,企画でも提案でも,
ではあるが,
その分時間がかかってしまう。第9回「ヒ
そこに盛り込まれた情報は必ず何らかの意思決定や
アリングと自主企画調査」の際に,ヒアリングを電
行動に結びつく。逆に言えば,意思決定や行動につ
話やメールで済ますのと対面で行うのとでは得られ
ながるものでなければ,情報としての価値はないと
る情報量が違うということを述べたが,調査依頼を
いうことになる(図3)。
受ける際も同じである。
(2)依頼者のニーズの把握
対面で話していれば,使っている言葉の定義・意
調査依頼者の意思決定や行動につながる情報を提
味などのすり合わせもその場でできるし,ディスカッ
供するには,まず依頼のニーズの本質をどれだけ理
ションの中でプランニングのアイデアなどが出てく
解できるかがポイントとなる。調査の入り口に戻る
る場合もある。調査依頼ぐらいで相手にわざわざ時
ことになるのだが,いま一度考えておこう。
間をとってもらうのは申し訳ないと考えがちである
目前の調査のテーマだけではなく,至った背景や
が,後になって,思っていたものと違う,自分が必
プロジェクト全体の目的について知っていれば,視
要なのはこのような情報ではない,などと言われて
は元も子もない。急がば回れ,なのである。
(3)情報の説得力
情報が間違いなく正しく伝わり,相手にその内容
を理解してもらったとしても,それだけでは十分で
はない。行動する,これでいこうと決断するには,
頭で理解するだけではなく,自分自身で納得し腹落
ちすることが必要となろう。
伝えた相手に納得してもらう。それには,見た目
で訴えることも大切ではあろうが,情報そのものに
説得力がなくては意味がない。情報に説得力がある
図3 情報の役割
922
というのは,間違った情報や抜け・モレがなく,相
インフォプロによるビジネス調査‐成功のカギと役立つコンテンツ
手のニーズに合致している必要十分な情報であるこ
自分が相手の立場だったら,「どんな情報があれば
と,さらに本質的な目的から考えるとこんな情報が
方向性を決められるだろうか」「何をどのように伝え
あった方がよい,これも役に立つはずだ,といった
られたら一歩前へ進めるだろうか」と常に考えなが
ように,一手先を読むような情報まで提示されてい
ら,臨機応変に進めていくのが,情報のプロという
れば,受け取った側の心にも響くはずだ。
ものである。
また,なぜその情報なのか,その情報から何が言
1年間にわたって,ビジネス調査に臨むにあたって
えるのか,目的に対してどのような意味やインパク
の考え方や有用と思われるコンテンツなどについて
トがある情報なのか,など提示する情報に対して責
述べてきた。ビジネス調査に対し,皆さんがもつ悩
任をもち,きちんと説明できることも必要だろう。
みや疑問には到底答えきれてはいないであろうが,1
疑問の余地があったり,曖昧なメッセージしかなかっ
つでも2つでも,成功に向けてのヒントになることが
たら,受け取る側も「ほかに,もっとよい情報があ
あったとしたら望外の喜びである。
るのではないか」などと不安になりかねない。
本文の注
注1) PESTのフレームワークについては以下の図3を参照
情報管理 57(2), 120-124, doi: 10.1241/johokanri.57.120
参考資料
a) 清水久三子. プロの資料作成力:意思決定者を動かすテクニックとおもてなしの心. 東洋経済新報社,
2012, 189p.
情報管理 vol. 57 no. 12 2015
923
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
インドにおける知 財 訴 訟 の 現 状
独立行政法人日本貿易振興機構 ニューデリー事務所 今 浦 陽 恵
情報管理 57(12), 924-927, doi: 10.1241/johokanri.57.924 (http://dx.doi.org/10.1241/johokanri.57.924)
インクレディブル・インディア!
観光客誘致のためにインド政府観光局が使ってい
今回は,インドの知財訴訟を事例に本件について
考えてみたい。
るキャッチフレーズ,「インクレディブル・インディ
ア!(Incredible!ndia)」。Incredibleには,「信じられ
ない/信用できない」という意味と,それから派生
インドは,その議論好きの国民性も影響してか,
した「信じられないほど素晴らしい」という,大別
訴訟大国といわれる。もちろん,それはあまり肯定
して2つの意味がある。その用法の変化が指摘されて
的な意味ではなく,その弊害として訴訟の長期化が
いる日本語の「ヤバい」と類似したものと言えばわ
指摘されている。
かりやすいであろうか。
「インドの知財訴訟は判決が出るまでに数十年」
「先
このフレーズは,悠久の歴史を背景にした魅惑の
日,弊社の案件も成人式を迎えまして」いずれも日
観光地「素晴らしきインド」の訴求を図るものであ
系企業の知的財産担当の発言である。私が当地に赴
ろう。他方,
「ヤバい」の意味さえスムーズに理解で
任した2012年8月当時,医薬品特許に関して厳しい
きない中年の私は,このフレーズを「インド,信じ
判断が続いていたこととも相まって 注1),「インドで
られない」とついとらえてしまう。4年契約した部屋
の紛争解決に司法は使えない。使えない知財を高額
を「弟家族を住まわせるから」と言われて1年で転居
な費用をかけて取得する必要があるのか」という雰
せざるをえない羽目になり,日本からの出張者を連
囲気が日本産業界に漂っていた。確かに,裁判所で
れた重要な会議の当日に「別の予定が入っている。
紛争解決を図るのに,20年以上もかかるのであれば,
あなたとはアポの話すらしたことがない」としらを
もはや司法は有効に機能しているとはいえない。
切られ。こんな私の体験も,インド社会を知る者に
一方,このころ,インドでは特許をはじめとする
とっては,取り立てて驚くこともないごく普通の「イ
知財権の出願受理件数が年々増加し,インド人弁護
ンドあるある話」である。
士が日本に来てセミナーを開催する回数も増えてい
文化や行動様式が日本とはまったく異なるインド
924
訴訟大国インド
た。訴訟期間に関する質問をすると,その回答は決
は,その特異性が旅行記や滞在記などでとかく面白
まって「インドの訴訟は早くなっている」
。ただし,
おかしく語られる。もちろん,それもインドの魅力の
残念ながら統計情報は示されず,真偽のほどはわか
1つではあろうが,そういった情報が独り歩きするこ
らない。そう思ってもらえればまだよい方で,
彼らの,
とで,本来の「素晴らしきインド」の姿を見誤っては
常に自分に都合のよい彼らの解釈と「来日目的は営
いないだろうか。私生活上の話であればともかく,そ
業」という下心が透けて見え,日本人は,言われれ
れがビジネス上の不利益になっていたとしたら……。
ば言われるほど,
「どうせウソでしょ」と,逆に「イ
視点 ●インドにおける知財訴訟の現状
ンクレディブル」となるのである。
ていれば,第一審から高等裁判所の審理を受けるこ
なにしろ,「一般的に特許取得まで3 ~ 4年で済む
かい り
とができるのである。インドでは,高裁や最高裁の
ようになった」と事実と乖 離 したことを新聞のイン
判事(justice)は,優秀な弁護士や下級裁判所判事か
タビューで平気で答える人たちである。インド特許
らセレクションされ,能力も高くその分社会的な権
局が審査進捗状況を同W e bサイト上で日々更新し,
威も高い。一方,地裁以下の下級裁判所判事(judge)
短いもので4 ~ 7年,長いものだとそれ以上かかって
は,法学部を卒業し,ある程度の研修を受けた者が
いることが公になっているにもかかわらず,である。
なる。
しん
このようなことの積み重ねが,インド人の発言の信
ぴょう
憑性を下げてしまっているのである。
これらを背景に,特に知財事件など専門性が要求
されるものは,第一審から高等裁判所に提訴した方
訴訟となると,すべからくその長期化とかさむ代
がよく,その中でも,デリー高裁は知財保護に積極
理人費用に悩まされるのか,特異な事例に惑わされ
的であり,お勧めであると,「デリー高裁管轄の」弁
ているだけなのか。とりわけインドについては,確
護士は声高に主張するのである。
たる証拠を示さないかぎり,
「何が本当かわからない」
状況なのである。それであれば,一部の事例をもと
にした標本ではなく全案件を抽出して母集団を示す
以外に手はない。
高裁の上級審も高裁?
インドの審級制度には,
ほかにも興味深い点がある。
「デリー高裁は侵害を認めず,原告は敗訴した。こ
れを不服とした原告はデリー高裁に控訴し……」ま
知財訴訟の 7 割はデリー高裁?
たいい加減な報告書送ってきて……。いや,これも
実は,このことはインド赴任前に某日系企業の方か
実は正しいのである。インドの高裁では,第一審は
らリクエストを受けていた。赴任後に早速取りかかっ
「Single Bench」と呼ばれる単独の裁判官によって行
たが,訴訟情報の統計を調べるにも,まずはインド
われ,第二審は「Division Bench」と呼ばれる2人の
における知財訴訟制度や,開示されている情報の範
裁判官による合議で行われる。Single Benchの判断に
囲を把握しなければ,適切な調査は実施できない。
不服の場合には,同じ高裁内のDivision Benchで控訴
委託候補先の弁護士事務所は,「デリー高裁のデー
審が争われ,これは「intra-court appeal」と呼ばれ
タなら収集可能」という。
「なぜ高裁?」と戸惑う私に,
ている。インド人にとっては,あえて記載するまで
「インドの知財訴訟の7割はデリー高裁」と畳み掛け
もない常識であり,
その脳内では,
「デリー高裁(Single
る。日本の審級制度は一般的に地裁-高裁-最高裁
Bench)の判決に対しデリー高裁(Division Bench)
の三審制。なぜ,控訴審である高裁が全件数の5割を
へ控訴」と極めて自然に補完されるのである。唯一
超えるのか。小学生レベルの算数と中学の公民の知
残念なのは,これがJETROのプロジェクトであり,想
識を備えた平均的日本人にとっては,このインド人
定読者は日本人であって,インド人ではないという
の主張はその理解の範疇を超えている。まさに「イ
ことであろうか。
ンクレディブル」。
ちなみに,この2人合議制というのも,日本人にとっ
しかし,結論としては,このインド人の説明は正
ては違和感がある。インドも従前は,
3人合議制であっ
しく,そもそもインドの審級制度が日本とは異なっ
たが,裁判官の定員が埋まらず訴訟件数がこなせな
ているのである。第一審を地方裁判所に提起するこ
いことから,訴訟効率を上げるために取り入れられ
ともできるが,一部の高等裁判所は第一審管轄権を
た苦肉の策である。デリー高裁の判事の月給が8万ル
有しており,一定の訴額を超え,土地管轄を満たし
ピー(約15万円)であるのに対し,Senior Advocate
情報管理 vol. 57 no. 12 2015
925
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
やSenior Councilと呼ばれる上級の法廷弁護士は,1
侵害者にとっては脅威となる制度がある。この一方
回の口頭弁論でこの2 ~ 5倍の報酬を手にする現実を
的差止命令について,デリーは積極的に認めるがム
考えると,裁判官不足も納得がいくであろう。
ンバイはそうでもない,と言われていたが,それも
Journal of Information Processing and Management
審級制度ひとつとっても日本の常識からかけ離れ
事実であることが統計結果から明らかになった。さ
た国,インド。初代知的財産権部長として赴任した
らには,そうしたことも背景にあってか,デリーと
私にとっては今も驚きの連続である。
ムンバイの出訴件数の比も3:1となっており,デリー
高裁に対する明確なフォーラムショッピングが行わ
出遅れた日本
う
れていたのである(表1)。さすがにインド全土の件
よきょくせつ
このように紆余曲折を経て収集されたのが,JETRO
で公表している「インド知財・審判報告書」である。
数は集計できていないが,
「デリー高裁が7割」もあ
ながち的外れな数値とはいえないであろう。
この報告書のキモは,デリー高裁・ムンバイ高裁の
さらに,原 告に占める外国人 比 率を調べたとこ
W e bサイトで公表されるデータをもとに,対象案件
ろ,ムンバイ高裁のそれが約4%であったのに対し,
を可能なかぎり全件抽出し,定期観測を行ったとい
デリー 高 裁 は 実 に45%にも 達してい る( 表1)
。デ
う点である。これによって,
「その案件は特別でしょ」
リー高裁における原告の国籍別の内訳を見てみると,
という議論を排し,母集団に近い全体像のイメージ
29%を米国企業,14%を欧州企業が占めているのに
をつかもうというものである。分析の信頼性を担保
対し,日本は,1%にも遠く及ばない。日本企業が小
するためにも,また,各人の関心にもとづきソート
田原評定に時間を費やす間にも,欧米企業は積極的
を可能にするためにも,各報告書には,表形式の個
にこれを活用し,着実に経験と成果を積み上げていた
別データを掲載している。
のである。
その結果,知財侵害訴訟の第一審は,約55%が1年
以内に終結し,約3 / 4が3年以内に終結していること
巻き返しにかかる日本
が判明した。10年を超えた案件も3%ほどあるが,数
五里霧中にあったインドの知財訴訟の現状が徐々
十年かかるのが一般的でないことは確かである
(図1)
。
に明らかになる中,日本企業からは,「J E T R Oが『仮
また,インドの訴訟制度には,一方的差止命令と
差止はすぐに出る』というので,
実際にやってみたら,
いう,被告の反論を聞かずに原告の主張のみを聞い
本当にすぐに出て驚きました」といった,うれしい
て迅速に仮差止を命じる,権利者にとっては強力な,
反応も寄せられるようになった。
また,インドの知財民事訴訟では,裁判所から任
命されたLocal Commissioner(LC)が,被告の所在
地に赴き,侵害物品の差し押さえ等を行う「アント
0-1年
1-2年
2-3年
3-5年
5-7年
7-10年
ンピラー・オーダー」も頻繁に活用される。
「迅速に
L Cが任命されたが,被告の所在地まで飛行機で行か
なければならず,費用が思ったより高くついた」と
10年超
表1 デリー高裁・ムンバイ高裁における知財侵害第一審訴訟
(元データ : 2013 年 3 月~ 2014 年 8 月に終結した案件)
図1 デリー高裁・ムンバイ高裁における
知財侵害第一審訴訟の審理期間
926
一方的差止命令認容率
外国人比率
デリー高裁
約70%
約45%
ムンバイ高裁
約37%
約4%
元データ : 2013 年 3 月~ 2014 年 8 月に提訴された案件
視点 ●インドにおける知財訴訟の現状
いった話も聞いた。
まだ「インド,信じられない」を日々経験している段
「多くの案件で仮差止がすぐに出るのはわかったけ
階だが,産業界との連携と現地駐在の利点を生かし,
ど,出ない案件もある。こういったケースで訴訟の
生活面はともかく,インドの司法制度については,こ
長期化が懸念されるがどう対処すればよいのか」と
れを「素晴らしきインド」と実感できる状況を構築
いう疑問も側聞している。本件に関する明確な回答
できるよう,引き続き微力ながら貢献して参りたい。
は現時点でもち合わせていないが,JETROが提供した
情報を源泉に,それを活用した企業からのフィード
ひも
バックや,新たに生じた疑問を1つずつ紐解いていく
ことで,日本産業界全体のインド知財に関する知識
と経験のボトムアップを実現していきたい。
終わりに
インドでは,
「イギリスが残していった最高のもの
は,司法制度である」と言われている。私自身はい
執筆者略歴
今浦 陽恵(いまうら あきよし)
1999年,特許庁に入庁。2003年,審査官昇任(特許
審査第一部ナノ物理)。特許審査業務に携わる傍ら,経
済産業省模倣品対策・通商室,文部科学省原子力関係在
外研究員(ミシガン大学),特許庁国際課を経て,2012
年8月から現職(知的財産権部長)
。インドをはじめ,
南アジア,中東地域の知的財産に関する情報収集等に従
事している。
本文の注
注1) 2012年3月,医薬品に対する強制実施権を許諾。2012年9月,後発医薬品の侵害を否認等。
情報管理 vol. 57 no. 12 2015
927
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
Building networks among info pros
̦̾̈́ͦͼϋέ΁ίυ
日下 九八
第 18 回
情報管理 57(12), 928-932, doi: 10.1241/johokanri.57.928 (http://dx.doi.org/10.1241/johokanri.57.928)
ぼくたちが住んでいる街には,ぼくたちが訪れる
街には,さまざまな顔がある。歴史があり,自然が
あり,伝統があり,新しく生まれる建物や文化があ
ア編集者の中立性が問われ,ちょっとした騒動に発
展した。
日本で行われている「ウィキペディアタウン」注2)
る。これらは街の魅力として,住民の心の糧になり,
という試みは,こうした動きとはあまり関係なく始
あるいは観光資源にもなる。ありふれたもののよう
まった。2013年1月13日Facebookで,本エッセーの第
で,1つひとつに個性がある。当たり前のように知っ
5回でLinkedData.jpを紹介している加藤文彦さん注3)
ているつもりでも,調べてみると新しい発見がある。
から,こんなメッセージが飛んできた。
そうしたものの中には,地元の人が知っているちょっ
としたトリビアにすぎないものもあるし,身びいき
> ご 存 知 か も し れ ま せ ん が,2/23( 土 ) に
で大層なものと思っていても,やっぱりありふれた
International Open Data Day(http://opendataday.
ものにすぎないものもある。だけど,百科事典の記
org/)というのがあります.世界中の都市でOpen
述として,あるいは単独項目として取り上げるに足
Dataについてのイベントを行おうというものです.
りるものだってたくさんある。
>横浜でもイベントを行うことになっていまして,
その中の一つとして,横浜の地域資源をWikipedia
プロジェクトのはじまり
にアップするワークショップの企画が挙がってい
「ウィキペディアタウン」注1) と呼ばれるプロジェ
ます.内容としては,1. Wikipediaのレクチャー 2.
クトは,2012年にイギリス・ウェールズのモンマス
チームで調査・街歩き 3. Wikipediaに実際にハンズ
で始まった。人口9,000人ほどの町に,無料のWi-Fiを
オンで書いていくといったことを考えています.
設置し,博物館や学校など1,000か所の建造物・展示
>そこでご相談なのですが,W i k i p e d i aについて
物に,ウィキペディアへの検索が行えるQ Rコードを
のレクチャーやハンズオンについてくさかさんに
付け,携帯電話,スマートフォンなどから簡単にア
お願いできないでしょうか.もし無理でしたら他
クセスできるようにした。ウィキペディアの編集者
に適任の方を紹介していただけると大変助かりま
の提案によるもので,町議会の協力のもと,ボラン
す.また,申し訳ございませんが,無給であるこ
ティアが新たに約500項目の記事を執筆し,6か月か
とをご了承ください.
けて準備をしたという。続くプロジェクトがジブラ
ルタルで始まったが,こちらは主導するウィキペディ
もちろん,
「いいですよー。喜んで!」と返信した。
本稿の著作権は著者が保持し,クリエイティブ・コモンズ 表示-継承 3.0 非移植(CC BY-SA 3.0 Unported)ライセンスの
下に提供する。
928
リレーエッセー ●つながれインフォプロ
2013年といえば,行政のさまざまな情報を,いち
オープンライセンスで作られている百科事典なので,
いち許諾を得たり申請したりすることなく,改変や商
ライセンスを守るかぎり,写真も文章も自由に使う
用利用も認める「オープンライセンス」を付けて公
ことができる。ウィキペディアを編集したり,ウィ
開し,ネットで閲覧できるだけではなく,市民や企
キペディアで使う写真などをまとめておくウィキメ
業もデータやコンテンツを自由に使えるようにする
ディア・コモンズに写真をアップロードすれば,そ
ことで,透明性を高め,経済的な効果を期待するオー
れらは「オープン」なコンテンツになる。
プンガバメントとオープンデータの動きが形になり
ウィキペディアのテンプレートから情報を抽出し
始めたころだった。オープンデータに取り組む世界同
て,よりデータとして扱いやすいものへと変換する
時多発的イベント「インターナショナルオープンデー
DBペディアというプロジェクトもある。いろんなデー
タデイ」の日に,横浜市で「分科会3」として試みら
タを,結びつけたり,分析したり,意味としてわか
れたのが日本でのウィキペディアタウンのはじまり
りやすいものにするためには,地方自治体がもつ統
ということになる(図1)
。その後,2014年末までに
計情報や地理情報だけでは足りない。これを補うの
二子玉川,京都,山中湖,奈良でも開催され,2015
が,DBペディアで作られるデータだ。
年には,岡山県笠岡市北木島(1月11 ~ 12日)
,北海
こうしたオープンなコンテンツやデータは,自由
道 森 町(1月17日)
,長 野 県 伊 那 市(1月24 ~ 25日)
に使えるもので,その使いやすさから,拡散も速い。
ほか,高知,金沢,三陸沿岸の自治体でも計画があ
ウィキペディアは,多くの人に利用されているのだ
ると聞く。
から,より充実させ,より正確になることだけで
も,大きな社会的貢献となる。できあがったコンテ
オープンなコンテンツ
ンツは,さらにさまざまに活用されることだろう。
ウィキペディアは,クリエイティブ・コモンズ 表
G o o g l eの検索結果の右側に表示される要約や写真
示-継承 3.0非移植(CC BY-SA 3.0 Unported)という
は,ウィキペディアから再利用されていることも多
い。緯度経度情報から地図に取り込むこともできる。
2020年の東京オリンピック/パラリンピックの開催
時には,世界中からたくさんの人々が日本を訪れる。
ウィキペディアの記事は,翻訳だって自由にできる。
ほかのプロジェクトとの連携
街歩きを基本として,地域の文化財,文化施設,
歴史的建造物などを訪れる。実物に触れ,写真を撮
る。図書館の協力を仰ぎ,資料をあたって,百科事
典の記事を作る。撮影した写真をアップロードする
(図2 ~ 4)
。ウィキペディアに掲載する情報は,情報
源を明らかにしなければいけない。その情報となる
書籍や雑誌は,図書館にある。せっかく街歩きをす
るのだから,オープンライセンスで地図を作るプロ
図1 最初に開催された横浜でのウィキペディアタウンで作成さ
れた記事のひとつ「インド水塔」
ジェクトの「オープンストリートマップ」注4)や,地
理情報と古地図を使ったアプリ「ちずぶらり」注5)を
情報管理 vol. 57 no. 12 2015
929
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
写真 : 藏野文子
図2 北木島での街歩きから
写真 : 駒沢給水塔風景資産保存会 (CC BY-SA 3.0 Unported)
図5 建築時の駒沢給水塔(竣工は1923年)
写真提供 : 東急沿線情報サイト 『とくらく』
図3 地域の文化資源に触れる
二子玉川での第2回ウィキペディアタウン
写真 : Yoshi ban (CC BY-SA 3.0 Unported)
図6 横浜能楽堂の楽屋
バックヤードツアーでの撮影
い情報については,localwiki注7)や,深谷市のフカペ
ディア注8)のような独自のプロジェクトとも連携して
いく余地がある。二子玉川では,地域の保存会の方々
が参加し,貴重な写真(図5)を提供してくれた。横
浜みなとみらいホールや横浜能楽堂では,普段は入
れない楽屋(図6)や準備室などバックヤードツアー
が行われた。図書館,文書館,博物館,美術館など
写真 : 平賀研也
図4 伊那・高遠図書館での共同編集
930
文化施設とウィキペディアの編集者の共同プロジェ
クトは,GLAM-WIKI注9)と呼ばれ,バックヤードツアー
のほかにもさまざまな取り組みがある。また,地域
活用するコミュニティ「図書館ぶらり部」注6)と連携
の風景や建物を撮影するイベントはWikipedia takes
することも増えてきた。ウィキペディアで書きにく
your townと呼ばれる。日本のウィキペディアタウン
リレーエッセー ●つながれインフォプロ
は,GLAM-WIKIとWikipedia takes your townを合わせ
いろな世代のさまざまな得意分野の知識や経験が入
たような企画注9)ともいえる。
り乱れていく。能動的な情報の発信や修正ができる
人が増えることは,インターネット社会で重要な変
コラーニングの実践
化であり,ウィキペディアタウンは,著作権,インター
ウィキペディアの地元に関係する記事を執筆する,
ネットを介した情報の取得と発信のリテラシー,図
と考えれば,1人でもできる。図書館の協力がなくて
書館や自治体などのサイトの活用方法,学術・科学
も,住人として図書館から借りたり,手持ちの資料
の方法論を踏まえた文章作法が,実感とともに身に
を使ったりしてもいい。そういう気軽なものでもあ
つく機会としても機能する。百科事典としての中立
る。でも,インフォプロの皆さんがいれば,このウィ
性を保つために,宣伝的な文句を削ることで,逆に
キペディアタウンという取り組みは,さまざまに活
魅力が浮かび上がる。現地で目にとまり撮影した建
用できそうではないですか?
物の出っ張りに意味のあることが,図書館で調べて
これまで,主催・運営にかかわってきたのは,地
いるうちにわかる。1つの給水塔の記事を調べ始めれ
域に根付いた活動をしているN P O,公共図書館関係
ば,より広範囲の水道事業にたどり着き,地元の能
者が多い。参加者は,地元を愛する人もいれば,オー
楽堂の魅力を伝えるには,「能」の記事そのものの充
プンデータに興味をもつ人もいる。共同で執筆する
実が不可欠だと知る。そうして,ぼんやり理解して
百科事典であるウィキペディアにはウィキペディア
いたことが,
膨大な背景を抱えていたことを知る。
「経
の方針やガイドラインがあり,独自の記法がある。
験」や「蓄積」を書誌情報を示しながら,正しく後
ちゅう ちょ
編集への 躊 躇を振り払い,あるいは削除を回避する
世に伝えられるようにしたり,ネット上の論文の調
には,ウィキペディアの編集・執筆にかかわる人の
べ方を教えあったり。何年も前にやっと探しあてた
参加が好ましい。宣伝やお国自慢にしないためには,
複写資料の曖昧な奥付から書誌情報をWebOPACで確
検証可能性や特筆性といった方針に目を通す必要が
認したり。かと思えば,パソコンを使うのが苦手だ
ある。もちろん,団体で図書館の資料を使うためにも,
と言ってる人たちが,地図ができていく様子を,じっ
資料を使いこなすにも,司書・図書館関係者の存在
と見つめていたりする。
は力強い。地域の保存会やN P O,研究者や学芸員の
知ることと,伝えることに夢中になった大人たち
ほか,取り上げる記事についての知識がある人たち
は,時間ギリギリまで駄々をこねて作業を続けよう
に参加いただけると,なお助かる。人を介して情報
とする。これはまさに地域の知の拠点であり,世代
をつなぎ,情報を介して人をつなぐ。
を超えたコラーニングの実践なのだ。
ウィキペディアという広く知られた便利なツール
の編集への参加,オープンガバメントやオープンデー
タという話題の取り組みへの参加は,人目を引くキー
ワードだし,図書館や地域の文化施設の活用,情報
かん よう
リテラシーと情報収集力の涵 養,住人の地域への関
心の掘り起こしと世代を超えた交流,観光情報の発
信といったものも参加への動機付けにもなる。編集
を始めると,地域の歴史,地理,文化を核に,いろ
執筆者略歴
日下 九八(くさか きゅうはち)
ウィキペディア日本語版の参加者(User: Ks aka 98)
。
コミュニティの信任を得て,2006年から管理者。2009年
から断続的に開催しているウィキメディア・カンファレ
ンス・ジャパンのスタッフ。東京ウィキメディアン会,
OpenGLAM Japanのメンバー。
情報管理 vol. 57 no. 12 2015
931
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
March
http://johokanri.jp/
本文の注
注1) ウィキペディアタウンについての解説は,日本語版の項目「ウィキペディアタウン」
http://ja.wikipedia.org/wiki/ウィキペディアタウン
注2) 日本で開催したウィキペディアタウンのアーカイブは「プロジェクト:アウトリーチ/ウィキペディア
タウン/アーカイブ」
http://ja.wikipedia.org/wiki/プロジェクト:アウトリーチ/ウィキペディアタウン/アーカイブ
注3) 加藤文彦氏の記事については以下を参照
「つながれインフォプロ 第18回」情報管理 56(11), 794-796, doi: 10.1241/johokanri.56.794
注4) オープンストリートマップ. https://openstreetmap.jp/
注5) ちずぶらり. http://atr-c.jp/burari/
注6) 図書館ぶらり部. http://alpha3.chizuburari.com/clubs/24
注7) localwiki. http://localwiki.jp/
注8) フカペディア. http://fukapedia.com/
注9) G L A Mとウィキペディアの連携については,日本語版のプロジェクトページ「プロジェクト: G L A M」
.
http://ja.wikipedia.org/wiki/プロジェクト:GLAM
英語版「Wikipedia:GLAM」.http://en.wikipedia.org/wiki/Wikipedia:GLAM
932
過去からのメディア論 ●プライバシーの多義性を考える
SeeingÊcurrentÊmediaÊretrospectively
過去
からの
メディア論
プライバシーの多義性を考える
大 谷 卓 史( 吉 備 国 際 大 学 ア ニ メ ー シ ョ ン 文 化 学 部 )
情報管理 57(12), 933-935, doi: 10.1241/johokanri.57.933 (http://dx.doi.org/10.1241/johokanri.57.933)
プライバシー概念はとてもとらえがたいものだ。
まず,いろいろなものがプライバシーと呼ばれる。
おけるプライバシー概念の発展からみえてくる分類
である。
次に,何がプライバシー情報であるかは文脈依存的
1890年,S. WarrenとL. Brandeis4)が放っておいて
である。今回は,前者のプライバシーの多義性につ
もらう権利(the right to be let alone)としてプライ
いて考える。
バシーの権利を定義した際,イエロー・ジャーナリ
プライバシー法の専門家D . S o l o v eによれば,放っ
ズムからの避難がこの権利の重要な内容であった。
ておいてもらう権利や,自己への限定アクセス(ア
私生活をのぞかれたり暴かれたりしないというのは,
クセスの限定)
,秘密,個人情報のコントロール,人
私生活の情報を保護するという意味であった。1960
格性(personhood),親密性(intimacy)がプライバ
年,W. Prosser5)がプライバシーの不法行為の4類型
シーと呼ばれる1)。さらに,歴史的にみれば,家族や
を定義した際も,プライバシー情報の保護を目的と
身体,性,住居,通信など多様なものがプライバシー
するものであった3)。
の名のもとに保護されてきた2)。
私的空間の保護はローマ法以来の伝統といえるが6),
哲学者J. W. DeCewが執筆する『スタンフォード哲
プライバシーの権利という思想は,情報の保護とい
学百科事典(Stanford Encyclopedia of Philosophy)
』
う概念とともに成長してきたのである。情報プライバ
の「プライバシー」の項目によれば,プライバシー
シーという概念は,このように不法行為法におけるプ
の多義性は次のように説明される3)。
ライバシーの権利の定着の中で生まれてきた。
第1に,人や情報の状態を記述するという意味での
一方,避妊具の使用や人工妊娠中絶について,カッ
記述的意味でのプライバシー。また,その価値や保
プルや女性の自己決定権を認めない州法の違憲性を
護すべき理由を主張する場合には,規範的意味でプ
争う中で,自己決定権的プライバシーの概念が生まれ
ライバシーという言葉が使われる。
る。Griswald v. Connecticut(1965)で,夫婦に対し
次に,規範的意味で使われる場合も,それが権利
て避妊情報を提供する行為を禁じるコネチカット州
であると考える論者もいれば,利益であると考える
法が違憲とされた。Roe v. Wade(1973年)で,妊娠
論者もいる3)。権利か利益かは,論者の倫理学的立場
の継続を決定する権利が女性にはあるとして,人工妊
によって議論が分かれそうだ。カント主義や権利論に
娠中絶を禁止するテキサス州法が違憲とされた7)。
立つ者ならば権利として考え,功利主義者であれば,
Griswald判決においては,米国連邦憲法には,自己
権利という概念を立てずに,利益と考えるだろう注1)。
決定権的プライバシー権について言及がないものの,
第3に, 情 報 的 プ ラ イ バ シ ー(i n f o r m a t i o n a l
半月が暗くなっている部分も存在してはじめて1つの
privacy)とプライバシーの憲法的権利(constitutional
月であるように,自己決定権的プライバシー権は権
right to privacy)という分類がある。これは,米国に
利章典(米国連邦憲法の修正条項)に暗黙裏に書か
情報管理 vol. 57 no. 12 2015
933
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
れているという「半影理論」が用いられたことでも
て説明している11)。Soloveは,DeCewの分類に従え
著名である8)。
ば,共通要素がないという点では還元説に近いもの
Journal of Information Processing and Management
このような分類があったとしても,S o l o v eの指摘
の,プライバシーの価値を認めているという点では,
でみたように,多義的なプライバシー概念の定義を
整合説の立場に立つという複雑な立場をとっている
行うことは容易ではない。米国では,不法行為の分
こととなる注4)。
野では,Prosserの4類型のどれに当てはまるか,自己
決定権の侵害がないかで,プライバシー侵害があっ
プライバシーの価値を認めながらも,ほかの概念
に置き換えて理解しようとする論者は少なくない。
たかどうか判断されたり,当然普通人であればプラ
たとえば,コンピューター倫理学の創始者の1人で
イバシーが期待される場面であるかどうか(これを
あるJ . M o o rは,プライバシーは,ある特有の社会に
プライバシーの合理的期待説と呼ぶことがある)9)
おける「中核的価値(core values)
」の1つである安
で,プライバシー侵害があったかどうかが判断され
全(security)の表現であると主張する12)。
ていて,プライバシーとは何かという定義に関する
議論は避けられる傾向にある注2)。
中核的価値とは,人間の価値評価において共有さ
れ,根本的である価値のことである。中核的価値は,
プライバシー概念は多義的であるようにみえるも
人類社会が生き延びるために必要なもので,通文化
のの,実はプライバシーと呼ばれるいろいろなもの
的なものだと主張される注5)。Moorによれば,社会が
には,整合的な根本的な価値(共通要素)を共有
大きくなり相互作用が高度となって,それと同時に
していて定義が可能であると考える立場は,前出
親密さが減少してくると,プライバシーは安全への
のD e C e w3)やF. S c h o e m a n10)に従って,「整合説」
欲求の自然な表現となるという注6),12)。
(coherentism)と呼ばれる注3)。一方,プライバシー
ところが,法哲学者・倫理学者のC. Fried13)にはじ
と呼ばれるものには共通要素はないし,ほかの立場
まる立場によれば,プライバシーは人間関係の構築・
に還元可能で,独自の価値はないと考える論者もい
維持のために必要であるとされるし,法哲学者のS .
る。
この立場は,
「還元説」
(reductionism)
と呼ばれる。
Benn14)の立場では,プライバシーは人格性の概念に
前出のS o l o v eはプライバシーの多義性を認めた
根を下ろし,人間の尊厳にかかわるとされる。これ
うえで,プライバシーと呼ばれるものはすべてに
らの議論を聞くかぎり,安全という価値だけに還元
共通する要素は有していないものの,それぞれが
できるようには思えない。
別の概念と比べると一部意味上重なる要素や類似
の要素があるからプライバシーと呼ばれるのだと,
プライバシーの多義性に多くの論者が気づいてい
るものの,決定的な解釈はまだ生まれていない注7)。
Wittgensteinの「家族的類似」という概念を使用し
本文の注
注1) プライバシーの利益と権利をめぐる議論は,動物解放論における権利論と功利主義の立場の対立から
よく理解できそうである。動物解放論における権利論と功利主義の論点に関しては,参考文献15)を
参照。
注2) なお,日本においては,(1)私事性,
(2)非公知性,(3)一般人の羞恥困惑の3点から,ある情報がプ
ライバシー情報であるかどうかが判断されてきた。近年では,本文で指摘したプライバシーの合理的
期待説が採用される判例も見られる。参考文献16)参照。
934
過去からのメディア論 ●プライバシーの多義性を考える
注3) なお,Schoeman10)は,整合説以外に,離接説
(distinctive theory)
という学説の分類を提示する。これは,
プライバシーと呼ばれるものは整合的な根本的価値を共有しているわけではなく,それぞれ別(離接
したdistinctive)の価値を有するという学説上の立場である。DeCew3)は,プライバシーの価値を認
めるという点で,いずれも整合説に含める分類を示している。
注4) 前出のSchoemanの分類に従えば,離接説のニューバージョンということになるだろう。
注5) Moor12)によれば,中核的価値は,生命(life)
,
幸福(happiness)
,
自由(freedom)
,
知識(knowledge)
,
能力(ability),資源(resources),安全(security)である。
注6) 児玉聡「ジェームズ・ムーア,『情報時代におけるプライバシー理論の構築に向けて』」
(http://www.
fine.bun.kyoto-u.ac.jp/tr2/kodama.html (accessed 2015-01-06))は,本論文の抄訳紹介である。
注7) プライバシーの合理的期待説に対しては,Soloveの反論9)が注目される。つまり,合理的な普通人が
プライバシーを期待していない場合でも,プライバシーがあるべきという願望や規範は存在するから,
合理的期待のみではプライバシーは説明できないというのだ。
参考文献
1) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 20-47.
2) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 68-85.
3) DeCew, Judith W. Privacy. Stanford Encyclopedia of Philosophy. 2002-2013. http://plato.stanford.edu/
entries/privacy/, (accessed 2015-01-13).
4) Warren, S. D.; Brandeis, L. D. The Right to Privacy. Harvard Law Review. 1890, vol. 4, p. 193-220.
5) Prosser, W. Privacy. California Law Review. 1960, vol. 48, p. 383-423.
6) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 78-81.
7) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 29, 39-40.
8) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 54.
9) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 92-97.
10) Schoeman, Ferdinand. Privacy: Philosophical Dimensions of the Literature. Fedinand Schoeman, ed..
Philosophical Dimensions of Privacy: An Anthology. Cambridge University Press, 1984, p. 1-33.
11) Solove, Daniel. プライバシーの新理論:法と概念の再考. みすず書房, 2012, p. 92-97. p. 59-62.
12) Moor, James H. Toward a theory of privacy for the information age. Computers and Society, 1997, vol. 27,
no. 3, p. 27-32.
13) Fried, Charles. Privacy [A Moral Analysis]. The Yale Law Journal. 1968, vol. 77, p. 475-493.
14) Benn, Stanley I. Privacy, Freedom, and Respect for Persons. In Roland Pennnock and J. W. Chapman eds.
Nomos XIII: Privacy. Atherton Press, 1971, p. 1-26.
15) 伊勢田哲治. 動物解放論. 加藤尚武編. 新版 環境と倫理 自然と人間の共生を求めて. 有斐閣, 2005, p .
111-133.
16) 岡村久道. 個人情報保護法の知識〈第2版〉
. 日本経済新聞出版社, 2010, p. 102.
情報管理 vol. 57 no. 12 2015
935
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
2014 年 DOI アウトリーチ会議
日 程
2 014 年 11月2 1日( 金 )
場 所
T h e G r a nd Vi sc o nt i Pa l a c e H o t e l , M i l a n, It a l y
主 催
I D F( Int e r na t i o na l D O I Fo und a t i o n,国 際 D O I財 団 )
情報管理 57(12), 936-941, doi: 10.1241/johokanri.57.936 (http://dx.doi.org/10.1241/johokanri.57.936)
1. はじめに
国際DOI財団(the International DOI Foundation:
I D F)は1998年に設立された非営利の機関で,デジ
タルオブジェクト識別子(Digital Object Identifier:
DOI)登録機関(Registration Agency: RA)の管理,
DOIレゾリューション注1),DOI全体にかかるポリシー
の策定を担っている。
ジャパンリンクセンター(Japan Link Center: JaLC)
は2012年3月にR AとしてI D Fの認定を受け,日本発の
図1
DOI Outreach Conference 2014 の会場の様子
図1 DOI Outreach Conference 2014の会場の様子
学術コンテンツ情報を収集し,普及・利用を促進す
るために,I D FのもとでD O I登録にかかる活動を行っ
3. 講演概要
ている。このたび,I D FからのD O Iに関する最新動向
3.1 Introduction
の収集,関係者との情報交換,DOI登録をコアとした
Dr. Norman Paskin(IDF, Managing Agent)
周辺サービスの世界でのひろがりを把握し,J a L Cの
D O Iに関する最新動向としては,全世界における
今後の活動の指針を得るため,2014年DOIアウトリー
DOI登録件数が2014年9月に1億件を突破し,またDOI
チ会議に参加した。
レゾリューション数は20億回に達した。I D FではD O I
レゾリューションやデータモデルなどの技術インフ
2. 会議概要
D O Iアウトリーチ会議は,D O Iの普及を目的として
毎年冬季に開催されている。今年は,I D Fとヨーロッ
パのRAであるmEDRA注2)の共催で行われた。各国の
RAおよび出版社等から約100名が参加した(図1)。
Warner Bros と Microsoft Xbox Live との取引の例
対するアウトリーチを行うなどの共通の問題を取り
扱ってきた。
またたとえば,2014年には世界全体のモバイル機
器利用者数がデスクトップP C利用者数を追い越すな
IDFからのIntroductionに続けて,3セッションに分
ど,情報通信技術が大きく変わってきている状況を
けて13の講演が行われた。各講演者からは興味深い
踏まえ,次世代に向けたさらなる取り組みが必要で
話題が提供され,意見交換を行うことができた。また,
ある。
DOIコミュニティーにおけるキーパーソンとのパイプ
を構築することもできた。
次章では,この中で特に注目した講演について報
告する。
936
図2
ラを提供したり,標準化や新たなコミュニティーに
集会報告 ●Meeting
2014年現在のDataCiteにおけるDOI登録件数は370
3.2 Session 1
学術と研究環境における点と点との結合:
万件であり,D O Iレゾリューション数は1,400万回に
CrossRef(出版物),DataCite(データセット)
,
達している。登録されている研究データのタイプは,
Cineca(大学における研究情報システム)におけ
地震事象,気象モデル,海底写真,医薬治験データ,
るDOIのユースケース注3)
音声記録,灰色文献,動画などである。
(1)Ed Pentz(CrossRef, Executive Director)
研 究 デ ー タ に 対 す るD O I登 録 の 意 義 に 関 し て,
1990年代,電子ジャーナルが出はじめのころ,論
D a t a C i t eは,登録によりその視認性が高まり,研究
文の参考文献欄には書誌情報とともにURLのリンクが
データに対する科学的評価が向上するのみならず,
はられていた。ところが出版社は頻繁にURLを変更す
データの再利用と検証が容易に行われることで,重
るため,リンク切れの問題が深刻となった。CrossRef
複研究の防止につながるという点を強調している。
はD O Iを用いてこの問題を解決するために,D O I登録
さらにはこうした科学データが世界共通性をもつと
機関の1つとして設立された。出版社がU R Lを変更し
いう視点から,地球規模でデータ引用を推進してい
た際には,DOIに対応するURLを更新することにより,
くためにグローバルな標準やワークフローが必須で
ユーザーは永続的に当該論文にたどり着くことがで
あるので,国際連携を強く意識した活動を展開して
きる。
いる。
現在,81か国の出版社がC r o s s R e fの会員であり,
きょう じん
DataCiteの理念は「Anything that is the foundation
強 靭 なネットワークを形成している。2014年現在,
of further research is research data.」
(さらなる研究
C r o s s R e fを通じたD O I登録件数は7,000万件,また,
への礎となるのは研究データ以外にない。
)
,
「Data is
D O Iレゾリューション数は11億回に達し,引用文献
evidence.」
(データは証拠である。
)である。
の恒久的なリンクの実現に貢献している。CrossRefで
注4)
(3)Susanna Mornati(Cineca)
,
C i n e c aは,1969年にイタリア国内のすべての大学
Text and Data Mining(TDM)注5),FundRef注6)など,
や高等教育局のコンソーシアムとして設立された非
DOIに関する周辺サービスの充実も図っている。
営利組織であり,現在72の会員からなる。イタリア
は,さらに被引用リンクの情報提供,CrossMark
(2)Jan Brase(DataCite)
国内の大学等のコンテンツの拡散(dispersion)や,
1998年に研究データの引用のためにD O Iを用いる
異種の素材(heterogeneous resources)の問題に対
という考えが,ドイツのポツダム地球科学研究セン
し,システムを統合し,互換性のある標準を採用し
ター(GFZ Potsdam)から出され,2000年にドイツ
ている。出版物には,mEDRA DOIやCrossRef DOIを,
研究振興協会(Deutsche Forsehungsgemeinschaft:
研究データにはDataCite DOIを,資金配分プロジェク
DFG)によってワーキンググループが結成された。そ
トにはFundRefを,研究者にはORCIDの識別子を標準
の後,2003年にD F Gの資金援助により実施されたプ
的に付与している。
ロジェクト “Citability of primary data” が,DataCite
これら互換性の高い標準を採用する取り組みによ
のはじまりである。当初のメンバーは,WDC MARE,
り,研究情報マネジメントシステム内のデータは,
WDC CLIMATE,GFZ Potsdam,TIBの4機関であっ
強健で,持続的で,見つけられやすく,再利用可能
た。そして,2004年3月18日に研究データへのD O I登
なものとなった。
録がはじめて行われることとなった。2014年現在,
D a t a C i t eは22会員と,9の準会員から構成されてい
る。JaLCは2014年3月に20番目の会員となった。
情報管理 vol. 57 no. 12 2015
937
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
3.3 Session 2
その背景として,E U諸国の公的セクターから毎年,
新たなDOI登録対象への拡張:EIDR(映画・エン
大量の情報が出版され,また,出版物にアラビア語,
ターテインメント産業),OPOCE(公的セクター)
,
中国語,日本語,ロシア語など50以上の言語版が存
Airiti(教育素材とMooC)におけるDOIのユース
在するという欧州特有の事情により,E U諸国の公共
ケース注7)
の利益のため,それらの視認性を高めることが重要
(1)Raymond Drewry(EIDR)
EIDR(The Entertainment Identifier Registry)は,
になってきた。
2014年現在O P O C Eでは,100万件以上のE U諸国の
DOIを技術基盤としてエンターテインメントのコンテ
コンテンツにDOIを登録している。また,引用文献リ
ンツに固有のI Dを登録し管理することにより,デジ
ンクサービスを提供するため,CrossRefとも協同して
タルコンテンツの流通促進と,特有の複雑なサプラ
いる注8)。こうした活動を通じて出版物の視認性や被
イチェーンの最適化を行うことによるコンテンツ業
引用頻度が高まることで,それら出版物はもちろん
界全体の競争優位性獲得の促進を目的としている。
のこと,E Uの研究助成プログラムから創出された成
E I D R D O Iは,劇場版から,テレビ放送版,ビデオ
果が世界で支持される。
オンデマンド版まで切れ目なく適用されている。
O P O C Eは今後,E Uの研究データに対するD O I登
E I D Rはコンテンツホルダーとコンテンツ供給者との
録の可能性を探る計画を立てており,D a t a C i t eや
間に入り,発注,供給,販売,ロイヤルティーの報
C r o s s R e fと同様,出版物とデータセットのリンクも
告までを担っているため,これら両者の取引コスト
視野に入れている。また,DOIのみならずISBNの登録
の低減に寄与している。EIDRは,これにより年間650
機関として,双方のシナジー効果を最大限に発揮す
時間の直接的な節約ができていると試算している。
るべく,DOIとISBNとを引用可能な単一識別子である
図2はコンテンツ配給会社であるWarner Bros.と,サー
ISBN-Aに統合する計画もある。
ビスベンダーであるMicrosoft Xbox Liveとの取引例で
ある。
(2)Carol Riccalton
(3)Chuuk Wei(Airiti, Inc.)
Airitiは台湾のDOI登録機関であり,台湾国内の教育
コンテンツにDOIを登録している。
欧州委員会出版局(P u b l i c a t i o n s O f f i c e o f t h e
1つ 目 の ユ ー ス ケ ー ス と し て,T a i w a n
European Union: OPOCE)は,欧州域内の公的機関の
OpenCourseWare Consortium(TOCWC)には,台
発効する文書を出版することを目的とした機関であ
湾国内27大学,1高校が提供するオンラインコース
り,これらのコンテンツにDOIを登録するため,2004
からのメタデータが提供されている(図3)。そして,
DOI Outreach Conference 2014 の会場の様子
年にDOI登録機関となった。
TOCWCからAiritiにDOI名とメタデータがデポジット
図1
図2
938
http://johokanri.jp/
March
Warner Bros と Microsoft Xbox Live との取引の例
図2 Warner Bros.とMicrosoft Xbox Liveとの取引の例
図3
TOCWC の概念図
図3 TOCWCの概念図
集会報告 ●Meeting
されDOIが登録される。
学生は,T O C W Cポータルにアクセスすることで,
ら出てくる。これを解決するのが,マルチプルレゾ
リューションで,1つのD O Iをリンク素材に活用した
各大学のコンテンツを横断的に検索でき,さらにDOI
り,メタデータサービスに活用したり,また,コンテ
によるリンクで所望のコンテンツにたどり着くこと
ンツサービスへ使用したりすることが可能となる。
ができる。また,学期が終了したあとに,同じ教授
m E D R Aでは,D O I登録機関として欧州のコンテン
の周辺科目の講義も容易に探すことができる。加え
ツを中心にD O I登録を行うとともに,このように権
て,コンテンツを再利用したいユーザーは,DOIのク
利処理の容易化に資するサービスの提供を試みてい
エリにより当該コンテンツの権利情報も入手するこ
る。図4は現在開発中のマルチプルレゾリューション
とができる。
のデモである。
もう1つのユースケースは,台湾教育省の支援によ
この例でいうと,1つのD O Iに結び付けられたマル
るプロジェクトとして実施されたMOOCs(Massive
チプルレゾリューションのページ(図4-1)から,コ
Open Online Courses)のコンテンツに対するDOI登
ンテンツのロケーションへリダイレクト(n o r m a l
録である。M O O C sは世界中の誰もが無料で参加でき
resolution)
(図4-2)か,権利処理のための選択肢の
るオンライン学習環境であるが,A i r i t iがこれらのコ
ページ(right-aware resolution)
(図4-3)に案内さ
ンテンツのメタデータを収集し,DOIを登録すること
れる。さらに,この権利処理のための選択肢のペー
により,利用者は容易に所望のコンテンツを見つけ
ジからは,ライセンス条件等を記述したx m lファイ
出し,DOIリンクによりそのコンテンツにたどり着け
ル(metadata.rights)(図4-4)
,クリックスルーで利
る。さらに,A i r i t iでは,コンテンツの権利管理など
用態様に応じたライセンスを購入できるページ(図
の統合的なサービスも提供している。教員がM O O C s
4-5,4-6)へ案内される。
上のコンテンツを再利用したいときには,各権利者
このように,権利を利用したいユーザーがそのDOI
に個別に許諾を得るのではなく,A i r i t iを窓口として
を見つけて,D O Iをキーとして活用することにより,
権利処理を行うことができる。Aritiは利用者からロイ
容易にW e bサイト上で利用許諾の手続きをすること
ヤルティーを徴収し,権利者への配分も行っている。
ができるようになる。まさに,DOIが永続的識別子で
あることを生かしたDOI利用の拡張形である。
3.4 Session 3
容易な著作権管理をサポートするためにどのよう
4. おわりに
にDOIを活用できるか。:mEDRA, RDI project, UK
D O I登録件数が全世界で1億件を突破し,各D O I登
Copyright Hub, EIDR, FORWARD projectからの報
録機関は,D O I登録対象コンテンツを拡張したり,
告注9)
DOI登録をコアとしつつも,その周辺のサービスを模
(1)Paola Mazzucchi(mEDRA)
m E D R AではD O Iを著作権管理にも活用するための
索する等してきており,DOIの世界がまさに広がって
いることを身をもって感じた。
検討を行った。D O Iの万能性からたとえば,D O Iのラ
CrossRefや,OPOCE,そしてJaLCも研究データに
ンディングページをフルテキストページにしたい,自
対するD O I登録の検討を始めている1),2)。論文のエビ
身のプラットフォームのメタデータページにしたい,
デンスとしての研究データの重要性や,また研究デー
あるいはD O Iを関連するコンテンツへのリンクに使用
タを公開し再利用してもらい重複研究を避けること
したい,D O Iをライセンスの選択肢を示すことのみに
による研究の進展の加速の重要性が再認識されたた
使用したいといった,さまざまな要望がユーザーか
めだと考える。
情報管理 vol. 57 no. 12 2015
939
情報管理
JOHO KANRI
2015
vol.57 no.12
http://johokanri.jp/
March
Journal of Information Processing and Management
[normal resolution].
[right-aware resolution]
図4 Context Aware Multiple Resolutionのデモ
また,今回は特に,DOI登録と権利処理とを統合す
著作権処理を行える基盤を整備しておくことが重要
るサービスが,
新しく感じられた。昨今,諸外国で
である。今後,ますますデジタル化・ネットワーク
は権利者不明時における著作物等の利用円滑化のた
化が進展していく状況では,m E D R Aが試みているよ
3)
めの法制度が検討されている 。その中で,著作権は
うに,著作物の公表の段階ですべての著作物にDOIが
その他の知的財産権と比べてその存続期間が長い注10)
登録され,そのD O Iの永続性に相乗りするかたちで,
ため,実際に権利者不明の著作物を利用するとなる
最初から権利管理情報も付加しておくことにより,
と,手続きが煩雑なものとなってしまい,どの国も
後世の人々が当該著作物を円滑に利用できるように
当該著作物の利用の円滑化には苦慮しているという
なると期待される注11)。
現状が指摘されている。このような状況下,著作物
(科学技術振興機構 余頃祐介,
中山久美子,
水野 充)
が創作され公開される当初から,システマチックに
本文の注
注1) DOI名の前に「http://doi.org/」を付してインターネットで検索されたとき,DOI名とともに管理され
ている所定のランディングページにリダイレクトを行うこと。
注2) https://www.medra.org/
注3) Joining the dots in the academic and research environment, including DOI use cases from CrossRef
(publications), DataCite (datasets) and Cineca (Research Information System for Universities)
注4) 論文のDOIのランディングページに表示された「CrossMark」のロゴをクリックすることにより,その
改版情報を確認することができるサービスである。論文が出版された後,訂正等が行われることがあ
るが,「CrossMark」により常に最新版の論文にたどり着くことができる。
注5) CrossRefのAPIで研究者等が出版社サイトに掲載された全文コンテンツに横断的にアクセスし,学術文
940
集会報告 ●Meeting
献のテキスト・データマイニングができるサービスである。実施許諾の同意をクリックスルーで提示
できる仕組みも提供している。
注6) D O I登録時にメタデータとして各種書誌情報とともに研究助成機関の情報も収集することにより,特
定機関の助成研究論文を容易に特定等できるようにしたサービスである。従前は研究助成機関の情報
はメタデータの書誌事項には含まれておらず,
論文の著者ごとに区々に「謝辞」や「Acknowledgements」
の形式で書かれていた。そのため,研究成果(研究論文)と研究助成機関とを結びつけることはほぼ
不可能であった。FundRefはこのような問題を解決することを目指し開発された。
注7) Expanding the DOI to new context of applications, including DOI use cases from EIDR (movie and
entertainment industry), OPOCE (Public Sector) and Airiti (educational and MooC)
注8) ジャパンリンクセンターにおいても同様に,CrossRefやPubMedと連携し,全文リンクサービスを提
供している4),5)。
注9) How DOI can be used to support easy rights management, including speakers from mEDRA, RDI
project, UK Copyright Hub, EIDR, FORWARD project
注10) たとえば,特許権の存続期間は出願後20年間であるのに対し,著作権の保護期間は著作者の死後50年
を経過したときとされている。さらに,映画の著作物の場合は公表後70年を経過したときとされてい
る。
注11) mEDRAはRAとして,EUの小さな国々のコンテンツへのDOI登録を取りまとめるとともに,mEDRA自
身がその周辺サービスとして権利処理基盤の構築を試みている。ジャパンリンクセンターもmEDRAと
同様のR Aではあるが,ジャパンリンクセンターは公的機関が共同で運営をしているという主体の特殊
性から,このようなD O I登録の周辺サービスは,サードパーティーの力を借りながら実施をしていく
という立場である。そのためには,引き続き関係者との対話・共創6)を続けながら運営していくこと
が肝要と考える。
参考文献
1) 中島律子, 武田英明. DataCite2014年年次会議:データに価値を与える. 情報管理. 2014, vol. 57, no. 9, p.
686-689.
2) 火口正芳, 余頃祐介. 第16回図書館総合展フォーラム:識別子ワークショップ: J a L C,C r o s s R e f,D O I,
ORCID,そして…. 情報管理. 2014, vol. 57, no. 10, p. 776-780.
3) 情報通信研究所. “平成24年度文化庁委託事業「諸外国における著作物等の利用円滑化方策に関す
る調査研究報告書” .(2013年3月), http://www.bunka.go.jp/chosakuken/pdf/riyou_enkatsuka_
houkoku_201303.pdf, (accessed 2015-1-20)
4) 加藤斉史, 土屋江里, 久保田壮一, 宮川謹至. ジャパンリンクセンターによるリンク管理と日本語の電子的
学術コンテンツへのDOI付与. 情報管理. 2012, vol. 55, no. 1, p. 42-46.
5) 余頃祐介. ごぞんじですか?ジャパンリンクセンター(通称:JaLC(ジャルク)
)
:国際標準の識別子DOI
を通じて,学術情報流通の輪に入ろう!. 専門図書館. 2013, no. 257, p. 40-46.
6) 中島律子. ジャパンリンクセンター活用の為の対話・共創の場(第1回)
:機関リポジトリのコンテンツへ
のDOI登録. 情報管理. 2014, vol. 57, no. 8, p. 591-595.
情報管理 vol. 57 no. 12 2015
941
情報管理
JOHO KANRI
2015
vol.57 no.12
http://johokanri.jp/
March
Journal of Information Processing and Management
ICSTI 2015 年次メンバー会合&APE 2015
~欧州の学術コミュニケーションの動向~
日 程
2 015年 1月1 9日(月)∼ 21日( 水 )
場 所
ドイツ ベルリン
Ho t e l N H Be r l i n M i t t e /Br a nd e nb ur g A c a d e m y o f S c i e nc e s
主 催
I CS TI/A PE O r ga ni z a t i o n Co mmi t t e e
情報管理 57(12), 942-945, doi: 10.1241/johokanri.57.942 (http://dx.doi.org/10.1241/johokanri.57.942)
1. はじめに
科学技術情報流通の促進を目指す国際科学技術
情報評議会(International Council for Scientific and
業界の動向の把握とネットワークの構築を図ったメ
ンバーが多かった。筆者も同様に2つの会合に出席し
たので,本稿では併せて報告する。
Technical Information,以下,ICSTI)は,2015年1月
19日,ドイツのベルリンにおいて冬季会合を開催し
た。2014年10月,科学技術振興機構(JST)の運営に
2. ICSTI 2015年冬季会合
冬季会合で行われた2つのワークショップI T O Cと
より日本科学未来館にて年次会合およびシンポジウ
TACCから主なトピックスを紹介する(図1)。
ム(以下,ICSTI 2014 in Tokyo)1)を開催したが,今
2.1 ITOCワークショップ
回は2015年の冬季会合に出席したので,その開催内
容を報告する。
(1)概要
ITOCワークショップでは,
「デジタル時代における
ICSTIは,年2回,一堂に会したメンバー会合を開催
“真” の科学的インパクトをいかに管理すべきか」を
している。夏季の会合は,ICSTI 2014 in Tokyoのよう
テーマとした事例が発表された。オルトメトリクス
にシンポジウムを伴うものであるが,冬季に開催さ
(altmetrics)2)指標等を活用し,研究論文の共有,イ
れる会合は,シンポジウムは開催せず,I C S T Iのメン
ンパクト向上を図る研究者支援サイトK u d o s,エン
バーによる会合となっている。
ドユーザー調査から得られた結果をもとにデジタル
今回も例年のように,会の運営に関し討議を行う総
技術による新たなサービスを展開しようとするシュ
会,科学技術情報に関する最新情報を話し合うI T O C
(Information Trends and Opportunities Committee)
ワークショップ,科学技術情報流通の技術的課題
を話し合うTACC(Technical Activities Coordinating
Committee)ワークショップで構成された。本稿では,
主としてITOCワークショップとTACCワークショップ
で討議された内容について紹介する。
また今回の冬季会合は,科学技術情報に携わる出
版社,図書館等が学術コミュニケーションの動向に
関する情報・意見交換の場を提供することを目的と
したAPE 2015(Academic Publishing in Europe 10)
が併せて開催されたため,2つの会合に出席し,出版
942
図1 ICSTI 2015におけるITOC&TACCの発表風景
集会報告 ●Meeting
プリンガー社の取り組みが紹介された。また,I C S T I
セスの透明性を高め,論文の被引用数以外に,研究
Rafols氏1)か
データの引用で研究成果を評価するための新たな取
2014 in Tokyoでも講演を行ったIsmael
ら,ICSTI 2014 in Tokyoでの講演に引き続き計量書誌
り組みである。
分析にもとづいた研究成果のポートフォリオによる
評価アプローチの発表が行われた。
これまで,研究成果の評価には,論文の被引用数
2.2 TACCワークショップ
(1)概要
をもとにした方法が主な指標として活用されてき
T A C Cワークショップでは,「検索および分析にお
たが,今回のI T O Cワークショップでは論文に掲載
けるイノベーション」をテーマに発表が行われた。
された図や表に着目し,その引用を評価指標の1つ
以下に特筆すべき発表を記す。
とする試みが紹介されたことがもっとも興味深かっ
(2)米国エネルギー省の取り組み
た。その一例として欧州分子生物学機構(European
米国エネルギー省(DOE)の科学技術情報局(OSTI)
Molecular Biology Organization,以下,EMBO)の2
からは,2014年6月に新しいモデルで公開されたエ
つの発表を以下に紹介する。
ネルギー関連の情報共有システムWorldWide Energy
(2)EMBOの取り組み
(W W E)注1)が紹介された。同ポータルは,米国,ド
EMBO科学政策プログラム・マネージャー Michele
イツ等のエネルギー関係のデータベース,W e bサ
Garfinkel氏からは,「サンフランシスコ研究評価宣言
イトを対象としており,多言語による自動検索が可
(San Francisco Declaration on Research Assessment:
能となっている。本 サービ スは,同局が 提 供する
D O R A)」の意義,研究評価の政策的観点,関係者の
WorldWideScienceをベースとして,英語,ドイツ語,
役割が説明された。また研究者にとって,査読付き
スペイン語,スウェーデン語の4言語に対応し,1,000
論文が研究成果の報告,研究者の評価の主な手段と
のデータベース,W e bサイトを横断的に検索する構
なっている現状を踏まえて,研究者,出版社,研究
成になっている。マイクロソフト社の自動翻訳システ
支援・管理者,助成機関,評価指標の提供者それぞ
ムTranslator注2)を採用し,これら4言語のいずれかで
れの立場から,被引用数以外の新しい評価指標を検
キーワードを入力すれば,言語を問わずすべてのデー
討すべきであることが示唆された。
タベースから自動で情報を入手できるよう整備され
また同機構が発行しているオープン・アクセス
誌『Molecular Systems Biology』編集長のThomas
ている。
(3)ドイツ国立科学技術図書館の取り組み
L e m b e r g e r氏から,研究データの扱いについての取
ドイツ国立科学技術図書館(G e r m a n N a t i o n a l
り組み事例が発表された。研究データは論文の中で
Library of Science and Technology: TIB)からは,
は図や表の形で表されるが,再分析や体系的なデー
2014年4月公開の動画検索ポータルT I B AV注3) が紹
タマイニングを実施するために,図や表のもとにな
介された。同ポータルでは,非テキスト資源(ビデ
るデータセットにアクセスできなければならない。
オや3D画像など)のセンターとなるべく,科学ビ
同誌のプロジェクト “SourceData” では,図や表をデー
デオにサイテーション・リンクを埋め込むといった
タセットと組み合わせたパッケージとしてとらえ,
開発を行っている。T I Bが保有するG N D(英語では,
これら図や表をメタデータ,もととなる “ソースデー
Integrated Authority File)という用語集をベースとし
タ” につなげ,“ソースデータ” を検索,再利用可能
た自動インデックス化を基本としている。今後は検
にするツールの開発を行っている。データのアクセ
索オプションの改善,動画分析により得られた結果
ス性,発見性を向上させることにより,科学的プロ
の編集,
Linked Open Data(LOD)に準拠したメタデー
情報管理 vol. 57 no. 12 2015
943
情報管理
JOHO KANRI
2015
vol.57 no.12
http://johokanri.jp/
March
Journal of Information Processing and Management
タの提供等が検討されているとのことである。
(4)ドイツ・カールスルーエ専門情報センターの取
り組み
ドイツ・カールスルーエ専門情報センター(F I Z
Karlsruhe)からは,数式検索,セマンティックな方
法論など,数学における最近の技術動向が説明され
た。同組織の取り組みとして,数学の論文検索ポー
タルzbMATH,EuDML,適切な分類と文脈的情報に
もとづいた自動インデックス化を目指すT I Bとの共同
プロジェクトDeLiVerMath注4)が紹介された。数学の
特性として,高度な形式化(formalization),結果の
図2 APE2015会場の様子
持続性(persistence),数式の多さがあげられる。トー
ス」と題し,WikipediaのようなWeb情報の活用方法
クナイザー(tokenizer)をコーパスに適合させ,抄
に関する講義や,
「セマンティックで儲 けるには?」
録に含まれる数式,レファレンス,テキストを区別
と題したショート・セッションを設けるなど,セマン
し,自動分類を可能とする方法が説明された。グロー
ティックWebに焦点を絞った発表が多数行われた。こ
バルな数学のデジタル図書館を目指し,検索精度を
こでは各セッションのテーマを簡単に紹介する。
高めていくとしている。
3.1 プログラムの概要
もう
主催者によるオープニング・スピーチに引き続
3. APE2015
き,欧州委員会(E u r o p e a n C o m m i s s i o n : E C)の
A P Eは,2006年以降毎年開催され,今年で10回目
Open Access to Scientific Publications and Data部門
を 迎 え る。2013年 に は,英 国 の 公 的 助 成 を 受 け た
長Celina Ramjoué氏から,論文のオープン・アクセ
研究成果のオープン・アクセス化に関する報告書
スからオープン・データ,そしてオープン・サイエ
“Accessibility, sustainability, excellence: how to expand
ンスへと推進すべく,H o r i s o n 2020,オープン・サ
access to research publications”,通称Finch Reportの
イエンスに向けたECの方針が説明された。
しょうへい
執筆者の1人であるJanet Finch氏等を招聘し討議の場
World Wide Web Consortium(W3C)のPhil Archer
をつくるなど,その時々の学術出版の最新動向をテー
氏らによる基調講演の後,著作権に関するセッショ
マとしている。2015年は,
「Web25:学術コミュニケー
ン「オープン・リサーチあるいは著作者の権利の侵
ションと学術出版の未来(Web25: The Road Ahead:
害? 論文のC C B Yの適合性」
,出版プロセスの効率
Exploring the Future of Scholarly Communication &
化のための「O Aの実務-論文投稿料(A P C)管理シ
Academic Publishing)
」をテーマに1月20,21日の2日
ステム」,セマンティックW e bによる「コンテキスト
間にわたり開催され,主に欧州各国の出版社等から総
とコンテンツの発見性」,動画活用等による「研究の
勢250名が参加した(図2)
。ちなみに「W e b25」は,
質と再現性の担保」という4セッションに分かれ,そ
1989年欧州原子核研究機構(CERN)にてティム・バー
れぞれ数名のスピーカーによる発表,そして締めく
ナーズ=リー卿がWebの原型となる文書「Information
くりとして「研究成果のコミュニケーション」と題し,
Management: A Proposal」を提出し,当時の上司から
パネル・ディスカッションが行われた。
承認を得た日から,2014年3月12日で25周年を迎えた
ことを記念して名づけられた。
「構造化された知識レー
944
集会報告 ●Meeting
3.2 著作権に関するセッション
近年,助成機関によりクリエイティブ・コモンズ・
4. おわりに
2つの会合を通じ実感したことは,欧州圏における
ライセンス(CC BY)が義務付けられつつあるが,学
オープン・アクセスに関する活動は,日本と比べて,
術関係者の中にはこれに対し異論をもつ者も多い。
2歩も3歩も先を行っているということである。欧州
このセッションでは,助成機関であり英国ウェルカ
圏における論文のオープン・アクセスは確実に実践
ム図書館の親機関でもあるウェルカム財団からなぜ
されており,大学図書館や助成機関等は,IT企業等関
CC BYを義務化したかが発表され,ドイツの知的財産
連業界と連携し,デジタル技術を活用した次なるス
を専門とする法律事務所Boehmert & Boehmertから
テップ,研究データ共有へと新たな取り組みを始め
は法律的観点から,著作権に関する研究者の意識と
ている。また論文のオープン・アクセスにおいて主
法律的考察が発表された。特に,公的機関が助成し
たる担い手である出版社も,デジタル化への変遷を
た研究から産出した研究成果を,あらゆる企業活動
ビジネス・チャンスととらえ,出版工程の効率化へ
の中で利用する場合の商業利用に関し,会場を交え
の取り組み,W e bを活用した新たなサービスを模索,
た活発な議論がなされ,欧州においては最大の関心
実践するステージへと進んでいる。
事であることがうかがえた。
また,主にICSTI冬季会合で討議された内容として,
論文のオープン・アクセス化により,被引用数以外
3.3 パネル・ディスカッション
「研究成果のコミュニケーション」と題したパネル・
ディスカッションでは,研究データの財政的負担に
での評価手法で論文を評価する動きが活発化してお
り,さまざまな方法が提案されたことは,助成機関
としてとても有意義であった。
ついての質問があった。出版社はデータの収集,共
次なる課題である研究データについては,欧州に
有について研究者を支援する立場にあり,助成によ
おいても取り組みが始まったばかりである。オープ
り得られた研究成果の長期的保存については助成機
ン・サイエンスへと推進すべく,財政面を含め,官
関の役割であるとする明確な意見が出版社側から示
民および研究機関の役割について十分に議論を重ね,
されたことが大変印象的であった。
学術情報流通を具現化していく必要性を強く感じた。
(科学技術振興機構 遠藤裕子)
本文の注
注1) WorldWide Energy http://worldwideenergy.org/, (accessed 2015-02-12).
注2) Microsoft Translator http://www.microsoft.com/translator/, (accessed 2015-02-12).
注3) TIB AV-PORTAL https://av.getinfo.de/;jsessionid=72B06EC91D23AD6FE652DD37A396F192?0,
(accessed 2015-02-12).
注4) DeLiVerMath http://www.ifis.cs.tu-bs.de/content/delivermath, (accessed 2015-02-12).
参考文献
1) 藤平俊哉. ICSTI 2014 in Tokyo 年次会合 & シンポジウム. 情報管理. 2014, vol. 57, no. 10, p. 769-775.
2) 宮入暢子. オープンサイエンスと科学データの可能性. 情報管理. 2014, vol. 57, no. 2, p. 80-89.
情報管理 vol. 57 no. 12 2015
945
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
ジャパンリンクセンターの新機能
6HUYLFH2YHUYLHZIURP-67
情報管理 57(12), 946-948, doi: 10.1241/johokanri.57.946 (http://dx.doi.org/10.1241/johokanri.57.946)
ジャパンリンクセンター(J a L C)注1),1),2) は2014
できる。
年12月に新システムとして刷新し,新機能を追加し
世界で9機関がR Aとして活動している。学術コン
た。本稿では,J a L Cの概要および新サービスを開発
テンツに対してDOI登録を行い,引用被引用情報の提
するに至った背景を簡単に述べ,その後新機能につ
供サービスを行うCrossRef,研究データに対してDOI
いて説明する。
登録を行うDataCite,映像データに対してDOI登録を
1. JaLCの概要と新サービスの背景
行うEIDR(the Entertainment Identifier Registry)
,中
国の科学技術信息研究所(ISTIC: Institute of Scientific
and Technical Information of China)
,台湾のAiriti Inc.
(1)JaLCの概要
などがある。
JaLCはDOI(Digital Object Identifier)という識別
JaLCはRAの1つとして日本の学術コミュニケーショ
子の登録を行う機関である。D O Iとは個別のコンテ
ンの事情に即したDOIの登録サービスを行う。科学技
ンツ(主として電子的なコンテンツ)を識別するた
術振興機構(J S T)
,国立情報学研究所(N I I)
,物質・
めに割り振られた文字列であり,世界で広く用いら
材料研究機構(NIMS)
,国立国会図書館(NDL)が共
れている。DOIは各コンテンツの所在URL情報とペア
同で運営しており,J a L Cの方針を議論し意思決定を
で管理されている。そのためDOIの前に「http://doi.
行うためにJaLC運営委員会を設置している。
org/」を加えたURLはコンテンツの所在URLに置き換
えることができる。
コンテンツの発行者の事情や,コンテンツの保管
者が替わることでコンテンツのURLが変わることがあ
り,コンテンツにアクセスするのに不便であったが,
DOIによりコンテンツへの持続的なアクセスを可能と
する。
J a L Cを利用するにはJ a L Cの会員となる必要があ
る。会員は正会員と準会員に分かれている。準会員は,
直接J a L Cのシステムを利用するのではなく正会員を
通じてJaLCに登録を行う。
(2)新機能を開発するに至った背景
より多くのコンテンツにDOIが付き,コンテンツの
利用につなげるため,「D O I登録するコンテンツの拡
DOIは国際DOI財団(International DOI Foundation:
大・メタデータ項目の拡大」「同一メタデータへの対
I D F)が統治しているが,I D Fがすべてを担っている
応」「コンテンツ情報の流通促進」が求められてきた
のではなく,D O Iの登録については傘下のD O I登録機
関(Registration Agency: RA)に任されている。RAは,
ジャーナル論文,研究データ,映像データなど特定
(表1)。
2. 新機能の内容
の種類のコンテンツを扱う機関とコンテンツの種類
によらず国や地域のコレクションを扱う機関に大別
946
新システムでは前述したニーズに応え「DOI登録対
JSTサービス紹介 ●ジャパンリンクセンターの新機能
表1 JaLC新システムに求められるニーズ
表2 DOI登録の対象となるコンテンツ
項目名
内容
D O I登録するコンテンツの拡大 ・ ・ DOI登録対象を学術論文から書
メタデータ項目の拡大
籍, 研究データ等に拡大する
・ メタデータ項目に研究者ID, ファ
ンド情報を追加する
同一メタデータへの対応
・ メタデータが同じだが内容が異
なるコンテンツに対応する
・ 同一コンテンツが複数の場所に
所在するときに対応する
・ JaLCコンテンツ情報の流通を促
コンテンツ情報の流通促進
進する
ジャーナル
アーティクル*
書籍、 報告書*
研究データ**
e-learning
汎用データ
* CrossRefのDOI登録も選択可能
** DataCiteのDOI登録も選択可能
版論文と著者の手元に残った原稿とが,それぞれ公
象コンテンツの拡大」「メタデータ項目の拡大」「異
開されている場合,後者は,たとえば,同じタイトル
版コンテンツへの対応」「マルチプルレゾリューショ
が単行本,文庫,朗読C D等さまざまな形態で刊行さ
ン」「Linked Dataでの情報提供」といった新機能を備
れている場合である。
えている。
(1)DOI登録対象コンテンツの拡大,メタデータ項目
異版を扱うために,バリエーション(出版版,著
者版等)
,
バージョン(1.0,
2.1等)
,
フォーマット(PDF,
の拡大
M P3等)の3種類の版情報をメタデータの項目として
新システムでは,DOI登録の対象となるコンテンツ
用意する。
を表2の6種に拡大する。従来は「アーティクル(学
術論文)」のみが対象であった。
(3)マルチプルレゾリューション
完全に同一のコンテンツが複数のW e bサイトで公
「アーティクル」「書籍,報告書」はCrossRefのDOI
開されている場合には,コンテンツが公開されてい
登録かJ a L CのD O I登録かを選択できる。また,「研
る複数のU R Lを1つのD O Iに登録するマルチプルレゾ
究データ」はD a t a C i t eでのD O I登録を選択できる。
リューションとする。
CrossRef,DataCiteは海外展開を重視する場合にはメ
リットがある。一方日本語のメタデータの取り扱い
という点ではJaLCにメリットがある。
また,版情報(詳しくは次の「(2)異版コンテンツ
への対応」を参照),研究者ID(ORCIDなど)情報,
ファ
(4)Linked Dataでの情報提供
JaLCでDOI登録したコンテンツのメタデータの一部
をR D F形式で提供する。提供するメタデータ項目は
DOI,タイトル,著者名,ISSN,巻,号,開始ページ,
発行日である。
ンド情報,研究データ関連情報をメタデータ項目に
追加した。
(2)異版コンテンツへの対応
以上2014年12月22日にリリースした新機能を中心
としてJ a L Cの概要を紹介した。今後も,J a L C運営委
コンテンツがもともとは同じであるがコンテンツ
員会,各分科会,対話・共創の場2) などから関係者
に改定が行われた,あるいはその形態が異なる場合,
の意見を取り入れながら機能強化を図っていきたい。
異版として別のD O Iで登録する。前者はたとえば,出
(科学技術振興機構 加藤斉史)
情報管理 vol. 57 no. 12 2015
947
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
March
http://johokanri.jp/
本文の注
注1) ジャパンリンクセンター , http://japanlinkcenter.org/.
参考文献
1) 加藤斉史, 土屋江里, 久保田壮一, 宮川謹至. ジャパンリンクセンターによるリンク管理と日本語の電子的
学術コンテンツへのDOI付与. 情報管理. 2012, vol. 55, no. 1, p. 42-46.
2) 中島律子. ジャパンリンクセンター活用の為の対話・共創の場(第1回)
:機関リポジトリのコンテンツへ
のDOI登録. 情報管理. 2014, vol. 57, no. 8, p. 591-595.
948
この本!おすすめします ●人生のお供に図書館を
神 代 浩 (文化庁文化財部伝統文化課)
人生のお供に図書館を
2014年3大図書館本+α
情報管理 57(12), 949-952, doi: 10.1241/johokanri.57.949 (http://dx.doi.org/10.1241/johokanri.57.949)
2014年は図書館を題材にした良書が次々と刊行さ
メンタリーである。
れ,空前の図書館本ブームが起きた。その中から代
何より驚かされるのは,目的実現に向かって遺憾
表作3冊と,末席を汚した拙著について紹介したい。
なく発揮される彼女の発想力,決断力,行動力であ
る。大災害に遭った地域に対する移動図書館事業は
『走れ!移動図書館 本でよりそう復興支援』
これまでにもあったが,車両登録や運転手の確保な
鎌倉幸子
どさまざまな条件をクリアする必要があるために,
ちくまプリマー新書,2014年,840円(税別)
事業開始に時間がかかる場合が多かった。
しかし,難民支援事業で鍛えられた彼女はこれら
のハードルを軽々と飛び越えていく。まるで日本の
図書館界の閉塞状況を打ち破るかのように。
なぜ彼女はこんなに強いのだろうか? そんな思
いを抱きながら読み進めていくと,四章に「本のチ
カラを信じて」という言葉が出てくる。この信念こ
そが彼女の力の源泉なのだろう。
移動図書館事業が軌道に乗ってくると,本のチカ
ラが多くの人々に変化を与えていくことが明らかに
なってくる。被災地で本を必要としているのは子供
だけではない。大人も生活再建などに関する実用的
な情報や,精神的な不安を和らげる娯楽や遊びが必
要なのである。
http://www.chikumashobo.co.jp/product/9784480689108/
私たちはこのプロジェクトを被災地支援の一エピ
わい しょう
ソードと矮 小 化してはならない。これは,平時の社
著者は公益社団法人シャンティ国際ボランティア
会の職員として,カンボジアの難民キャンプで子供
会における図書館の在り方に対する強烈な問題提起
でもあることを,真摯に受け止めねばならない。
たち向けに図書館活動や絵本の出版などに従事して
こられた。本書は,その経験を生かして東日本大震
災の被災地の子供たちへ本を届けるために移動図書
館事業を立ち上げ,展開していく過程を描いたドキュ
情報管理 vol. 57 no. 12 2015
949
情報管理
JOHO KANRI
2015
vol.57 no.12
http://johokanri.jp/
March
Journal of Information Processing and Management
『つながる図書館 コミュニティの核をめざす
試み』
揺るぎない信頼である。
それを象徴するのが,タイトルにも使われている
猪谷千香
「つながる」という表現である(ちなみに鎌倉さんも
ちくま新書,2014年,780円(税別)
「本は「つなぐもの」
」と書いておられる。面白い)
。
図書館は,本という有形物を人という生物に貸し
出すという無味乾燥なサービスを提供する施設では
ない。本と人がつながり,人と人がつながり,まち
と人がつながる場である。図書館という公共施設を
このように再定義すれば,各地の図書館がどのよう
な役割を果たすべきか,自ずから答えは見えてくる。
その答えを正しく認識し,答えのとおりに実践して
きた図書館が本書で取り上げられていると言っても
過言ではない。
この本は,図書館の利用者にとっては「こんな使
い方もあるんだ」との気付きがたくさん得られ,
「自
分の街の図書館をこうしたい」といった夢を膨らま
せることができる。また,図書館職員など関係者に
http://www.chikumashobo.co.jp/product/9784480067562/
とっては,「わが図書館はどうあるべきか」を考える
うえでさまざまな選択肢を提供してくれる資料とし
著者は産経新聞の記者などを経て,現在はハフィ
ても不可欠である。
ントンポスト日本版のレポーターとして活躍してお
『未来の図書館、はじめませんか?』
られる。
この本には実にさまざまなタイプの図書館が登場
する。図書館のことを「無料貸本屋」と批判的に見
岡本真;森旭彦著
青弓社,2014年,2,000円(税別)
る風潮がまだまだ強いわが国において,これだけ多
様な図書館の存在を知ることができただけでも,本
書が刊行された意義は大きい。
次にこの本のすごいところは,著者がこれらの個
性的な図書館について,いいあんばいの関心と距離
感をもって紹介していることである。このアプロー
チは,過疎対策の成功事例として高く評価される島
あ
ま
根県海士町の「島まるごと図書館構想」に対しても,
賛否両論がいまだに激しく行き交う佐賀県武雄市図
書館に対しても,まったく変わらない。
なぜ彼女はこんなに冷静でいられるのだろうか? 読み進めるうちにだんだん伝わってくるのは,本書の
む く
底流にある,著者の図書館に対する純真無垢の愛情と
950
http://www.seikyusha.co.jp/wp/books/isbn978-4-7872-0053-2
この本!おすすめします ●人生のお供に図書館を
前述の2冊で図書館の可能性に対する認識が広がる
『困ったときには図書館へ 図書館海援隊の挑戦』
のを待っていたかのように,12月に刊行されたのが
神代浩
この本である。
悠光堂,2014年,1,800円(税別)
本書は岡本・森両氏の共著という形をとっている
が,この中で主張されている内容はすべて岡本さん
である。以下その前提で進めることにする。
岡本さんはYahoo! JAPANで「Yahoo! 知恵袋」の企
画・設計などを担当された後,アカデミック・リソー
ス・ガイド(A R G)という会社を立ち上げ,学術的
∼図書館海援隊の挑戦∼
何度も図書館ネタで語りあってきた私が抱いた実感
困った
ときには
図 書 館へ
のアイデアであると考えてよい。これは今まで彼と
なインターネットの知見を研修やコンサルティング
神代 浩
を通じて広めておられる。
と彼の会社の業務紹介をしてもピンとこないだろ
う。私の表現で彼を紹介すれば,「日本全国の図書館
を知り尽くし,そこから得られた知見をこれからの
悠光堂
http://youkoodoo.co.jp/item/ 困った時には図書館へ~図書館海
援隊の挑戦~ /
図書館運営や新たな図書館建設に反映すべく奔走し
ているスーパーマン」ということなる。
第1章のタイトル「図面から生まれる図書館は正し
いのか」を見ただけで予想されるとおり,彼の日本
以上の3冊と同列に論じるのは甚だおこがましい
が,昨年の10月に刊行した拙著についても紹介する
ことをお許し願いたい。
の図書館に対する見方はかなり厳しい。そして,日
私は2009年7月から翌年7月まで文部科学省の社会
本の図書館に彼が求めることは挑戦的であり,時に
教育課長として,主に公共図書館に関する業務を担
は挑発的とすら読める部分もある。しかし,これら
当していた。当時の図書館をめぐる状況は決して楽
の指摘の大半に私はうなずき,時折首を傾げて考え
観的なものでなく,図書館界も元気がないように見
る,といったことを繰り返しながら読み進んだ。ま
えた。その一方でリーマンショック以降の経済低迷
さに刺激満載の本である。
からまだ脱していなかった当時のわが国では,派遣
彼が思い描く「未来の図書館」を実現するには,
切りなどに遭った失業者・困窮者への対策が課題と
今の図書館がその機能を「拡張」させる必要がある,
なっていた。彼らに対して図書館にできることはな
との主張には大いに共感する。しかも,彼がいう「拡
いか? との私の呼び掛けに,鳥取県立など7つの公
張」が住民向けのサービス充実だけでなく,行政機
共図書館が応えてくれた。こうして始まった有志の
関として行政内部での存在価値を高めるための努力
ネットワークが図書館海援隊である。
(都市総合計画を読んで得た情報をもとに行政支援,
拙著は図書館海援隊発足の経緯から現在に至るま
議会支援へ)についてもしっかり書き込んでいるあ
で の 活 動 ぶ り を 紹 介 す る 前 半 と,2013年11月 に 福
たりは,行政の立場にいる私にとっても学ぶべき点
岡県立図書館で行われた「図書館海援隊フォーラム
が多い。
2013」における議論の記録をまとめた後半から成る。
また,巻末の「図書館をつくるための本棚」に紹
介されている本の数々も有益なものばかりである。
この本の主人公は全国の元気な図書館員たちであ
る。地域住民の課題解決のために図書館として貢献
情報管理 vol. 57 no. 12 2015
951
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
できることを日々考え,実践し続ける「スーパー司書」
わが街の図書館を少しでも良くしていくために行動
たちの存在を多くの人々に知ってもらうことで,人
を起こすことである。
生で何か困ったことに直面したら,次にとる行動の
これでうまくいけばよいが,いかなかったらどう
選択肢の1つに図書館を加えてほしい,そのような思
するか? ぜひ『困ったときには図書館へ』を手に
いを込めた。
していただきたい。全国の元気な図書館員たちが必
ずやあなたを激励してくれるはずである。
なお,あくまで著者の片想いだが,拙著と先の3冊
とは密接な関係がある。東日本大震災の被災住民に
対して図書館に何ができるか,図書館海援隊の仲間た
ちも考え,実行したし,
『つながる図書館』のプロロー
グには図書館海援隊サッカー部も紹介されている。
そして,岡本さんは図書館海援隊のよき理解者で
あるとともに厳しい観察者でもあり続け,しばしば意
見やアドバイスをいただいてきた。このような縁も
あって,岡本さんとはこの1月にそれぞれの本につい
て紹介し合うトークイベントを開催した注1)。
これからの図書館関係者と利用者である住民に求
められることは『走れ!移動図書館』で投げ掛けら
れた問題提起を真正面から受け止め,『つながる図書
館』で紹介された個性豊かな図書館について学び,
自分が住む地域にふさわしい図書館の在り方を考え,
『未来の図書館、はじめませんか?』を手引きとして,
執筆者略歴
神代 浩(かみよ ひろし)
1962年大阪生まれ。東京大学法学部卒業。1986年文部
省(当時)入省。北海道教育庁企画管理部企画室参事,在
米国日本国大使館参事官,文部科学省生涯学習政策局調査
企画課長などを経て2009年7月~ 2010年7月まで同局社会
教育課長。2014年2月より文化庁文化財部伝統文化課長。
本文の注
注1) 概要はhttps://twitter.com/hashtag/神代岡本?src=hashを参照。
952
情報界のトピックス ●Topics of the information community
情報管理 57(12), 953-957, doi: 10.1241/johokanri.57.953 (http://dx.doi.org/10.1241/johokanri.57.953)
Authors Guild対HathiTrust訴訟が和解
お,HathiTrustには現在,103の機関が参加しており,
デジタル化された資料は,1,300万冊を超える。
著 作 権 の 公 正 使 用( フ ェ ア ユ ー ス ) を め ぐ っ
(http://www.unc.edu/~drhansen/agvhtdismissal.
て,A u t h o r s G u i l d( 作 家 組 合 ) が2011年9月 に,
pdf) (http://www.hathitrust.org/resolution_authors_
H a t h i T r u s tと5つの大学(ミシガン大学,カリフォ
guild_hathitrust) (http://www.hathitrust.org/
ルニア大学,ウィスコンシン大学,インディアナ大
documents/hathitrust-updates-review2014.pdf )
学,コーネル大学)を相手取って起こした訴訟が,1
(accessed 2015-02-05).
月6日に和解に達した。連邦地方裁判所は,大学の蔵
書をスキャンしてHathiTrust Digital Libraryに保管す
新しいオープンアクセス誌の査読者への支払
ることは,公正使用の範囲内であるとの判断を2012
い計画
年10月に下したが,これを不満としてAuthors Guild
は控訴した。しかし,2014年6月に控訴審は,蔵書
1月20日,カリフォルニア大学出版局(University
のスキャンは変形的利用(t r a n s f o r m a t i v e)である
of California Press: UCP)はオープンアクセス出版プ
として,HathiTrust側の公正使用を認めた。ただし,
ログラム,メガジャーナルCollabraとLuminos(モノ
HathiTrustが長期保存目的で著作物のデジタルコピー
グラフ)を公式に開始した。この2つのプログラムは,
を保存することは,公正使用とは見なされない,と
ファカルティ,ライブラリアン,その他の主要なス
するAuthors Guildの主張に関しては,そのような主
テークホルダー(利害関係者)による,数百回にわ
張をする資格があるかどうかの検討が,地方裁判所
たる話し合いの後に具体化されたものである。
で検討されなかったとして差し戻された(vol. 57, no.
メガジャーナルCollabraは,論文発表によって生ま
5の本欄にて既報)。和解では,HathiTrust側は,著作
れる価値を編集者と査読者間で共有するためにデザ
権法108条「図書館および文書資料館による複製」に
インされた,革新的モデルに基づいたプログラムで
従って,原本が損傷を受け,変質,紛失もしくは盗
ある。UCPは,著者が支払う論文掲載料(APC)から
難にあった場合,あるいは公正な価格で未使用の代
生み出される資金を全額保持し,編集者と査読者の
替物を入手できなかった場合にのみ代替コピーを作
労力に対する補償を直接行う。編集者と査読者は受
成してきたとの見解を示し,Authors Guildはこれを
け取った金を自分のものにしてよいが,他の研究者
受け入れた。さらに,HathiTrust側は著作者たちの不
を助けるためにAPCの権利放棄ファンド(APC waiver
安を和らげるために,今後5年間,この見解を変える
f u n d)に寄付したり,自分が属する機関のオープ
場合には,Authors Guildに通知する義務を自らに課
ンアクセス活動のために提供したりすることもでき
すことを約束した。北米研究図書館協会(Association
る。当初は重点的に生物医学,生態環境科学,社会・
of Research Libraries: ARL)は,今回の和解は公正使
行動科学の3分野に取り組む。学術ジャーナルの論文
用にとっての大きな勝利であると歓迎している。な
掲載料は,通常数百~ 3,000ドルだが,U C Pは875ド
情報管理 vol. 57 no. 12 2015
953
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
ルとし,そのうちの250ドルを「研究コミュニティー
中止させることができなかった。このため,プライ
ファンド」に入れ,それを編集者と査読者への支払
バシー擁護派から強い批判を受けていたベライゾン
いに充てる予定である。支払い金額はファンドに集
社は,上院通商務・科学・運輸委員会のメンバーで
まる金額と,出版プロセスへの関与に基づいて編集
ある民主党議員4名が,ベライゾン社のCEO,Lowell
者と査読者が獲得するポイントによって決定される。
C. McAdam氏に書簡を送った翌日の1月30日になって
モノグラフL u m i n o sは,出版のためのコスト負担
ようやく,コードを使った追跡を,利用者が完全に
を,学術コミュニティー全体で分かち合うプログラ
止めることができるオプションを付け加えると発表
ムである。おのおののタイトルに対して,U C Pは多
した。書簡の内容は,AT & T社が同様の手法を試みよ
額の金額を出費し,支援図書館からのメンバーシッ
うとしたものの,賢明にも中止したにもかかわらず,
プファンドがそれを増強する。著者は残りのコスト
ベライゾン社はスーパークッキーを継続していると
をカバーするために出版費用を確保するよう求めら
して,同社のデータセキュリティーとプライバシー
れる。支援図書館や売り上げからの収入は,著者の
保護のポリシーを批判し,説明を求めるものだった。
権利放棄ファンドをサポートするのに役立つ。書籍
プライバシー擁護派の中には,今回の決定は十分
は,クリエイティブ・コモンズ・ライセンスのもと
ではないと考える人たちがおり,
「ベライゾン社は
に出版される。
この機能をデフォルトで中止し,ターゲティング広
(http://www.collabraoa.org/) (http://www.
告プログラムを望む人のみが自発的にスイッチを入
luminosoa.org/) (http://johokanri.jp/stiupdates/
れるようにすべきである」との声も聞かれる。電子
northamerica/2015/01/010677.html) (accessed 2015-
フロンティア財団(Electronic Frontier Foundation:
02-05).
E F F)は,ベライゾン社と同社のデジタルマーケティ
Journal of Information Processing and Management
ベライゾン社が顧客へのプライバシー侵害行
為を修正
ング・ソフトウェアにペナルティーを課すことを連
邦機関に求める,消費者請願の呼び掛けを開始し,1
月末の時点で署名者の数は2,000名を超えている。
(http://bits.blogs.nytimes.com/2015/01/30/verizon-
米国の大手電気通信事業者ベライゾン・ワイアレ
ス(以下,ベライゾン社)が,広告主によりよいサー
ビスを提供するために,2012年以降,携帯電話契約
wireless-to-allow-complete-opt-out-of-mobilesupercookies/?_r=0) (accessed 2015-02-05).
者のブラウザーに無断で,削除不可能な追加のコー
サイバー攻撃に遭いやすいユーザーを判定す
ド「Unique Identifier Header(UIDH)」を組み込み,
る技術
モバイルW e bやモバイルアプリケーションを利用す
954
る顧客の活動を追跡してきた事実が明るみに出たの
富士通と富士通研究所は1月19日,サイバー攻撃に
は,2014年10月のことである。これは,スーパークッ
遭いやすいユーザーを心理・行動特性で判定する技
キー(supercookie)と呼ばれる手法で,ベライゾン
術を開発したと発表した。メールやW e bなどのP C操
社の持続的なトラッキングを利用して,W e b利用者
作から,サイバー攻撃の被害に遭いやすいユーザー
のブラウジング行動プロファイルを継続的に,第三
を判定し,個々のユーザーや組織に合わせたセキュ
者である広告主が本人の同意なしに集めることを可
リティー対策を可能にするとしている。今回の技術
能にしている。これまで利用者は,ターゲティング
開発ではまず,ネット上のアンケートによりウイル
広告プログラムの中の,マーケティングの側面しか
ス被害・詐欺・情報漏えいという3種類の被害に遭
情報界のトピックス ●Topics of the information community
いやすい人の心理特性と行動特性の関連を社会心理
(U S P T O)が2014年に企業に発行した特許について
学的に明らかにした。分析の結果,たとえば,リス
の調査結果を発表した。企業別の特許取得件数では,
クよりもメリットを優先する人はウイルス被害に遭
米I B Mが22年連続で1位になった。同社の取得件数は
いやすい,P Cを使いこなしている自信の強い人は情
7,534件(前年比10%増)で,1年で7,000件以上の特
報漏えいのリスクが高いなどの傾向が明らかになっ
許を取得するのは同社が初だとしている。2位以下は
た。そのうえで,P Cフリーズ時などのP C上の行動特
前年と変わらず,Samsung Electronics,キヤノン,
性と,被害に遭いやすい心理特性を分析して数値化
ソニー,Microsoftだった。USPTOは2014年,過去最
し,ユーザーの被害リスクを算出した。今後は,被
高となる30万678件の特許を発行している。
害に遭いやすい状態にあるユーザーの検知精度を向
( h t t p : / / w w w. i f i c l a i m s . c o m / i n d e x . p h p ? p a g e =
上させて,2016年の実用化を目指すとしている。
ne ws &typ e = vie w&id= if i- c la ims %2F if i- cl a i m s -
(http://pr.fujitsu.com/jp/news/2015/01/19.html)
announces_4&keep_session=1622904655) (accessed
(accessed 2015-02-05).
2015-02-05).
Facebook,新興国市場向け軽量アプリを公開
放送番組の違法配信撲滅へ啓発テロップ表示
Facebookは,新興国ユーザーをターゲットとした軽
日本民間放送連盟は2月3日,2月23日から3月1日ま
量版の公式アプリ「Facebook Lite」をテスト公開し
で,全国の民放テレビの番組に,放送番組のインター
た。同アプリは,「インターネットへの接続が限定的
ネットへの違法配信をしないよう呼び掛ける啓発テ
な地域や2Gネットワーク(第2世代移動通信システム)
ロップを表示すると発表した。期間中の午後7時から
が使用されている地域」を対象に開発された。携帯
深夜2時に放送する15分以上の収録番組すべてで,
「番
電話に必要な容量は252KBと軽量だが,Facebookの
組をインターネットに許諾なく公開することは違法
基本機能(メッセージング,プッシュ通知,写真共有)
です。
」というテロップが5秒間表示される。
はすべて利用できる。すでにアジアやアフリカの一
(http://www.j-ba.or.jp/category/topics/jba101439)
部(バングラデシュやネパール,ナイジェリア,南
(accessed 2015-02-05).
アフリカ,スリランカ,スーダン,ベトナム,ジン
バブエなど)で試験運用が始まったとみられる。
Facebookは以前から,高速インターネット接続や
アマゾン,Windows向けKindle閲覧アプリを
公開
スマートフォンが普及していない新興国市場向けの
サービスを展開している。また,インターネット環
アマゾンジャパンは1月21日,W i n d o w s P C上で
境をもたない50億人をインターネットにつなげるこ
Kindle書籍を読むことができる無料アプリケーション
とを目指す活動Internet.orgを立ち上げている。
「Kindle for PC」を公開した。和書を含むKindle書籍
(https://play.google.com/store/apps/details?id=com.
を閲覧でき,他のKindleアプリと同様に,読書の進捗
facebook.lite) (accessed 2015-02-05).
状況をKindleリーダーやモバイルデバイスなどと同期
米特許取得数,IBMが22年連続で1位
することができる。これまでKindle書籍は,
Kindleリー
ダーやスマートフォン/タブレット以外では,2014
年9月にリリースされたブラウザ専用アプリケーショ
米IFI Patent Intelligenceは1月12日,米特許商標庁
ン「Kindle Cloud Reader」でも閲覧できたが,洋書
情報管理 vol. 57 no. 12 2015
955
情報管理
JOHO KANRI
2015
vol.57 no.12
March
http://johokanri.jp/
やコミック,雑誌に限られ,和書は非対応だった。
ターまで毎日往復74キロ(約8時間)のうち34キロを
「Kindle for PC」はコンテンツをダウンロードできる
徒歩で通勤している。利用できる公共交通機関がほ
Journal of Information Processing and Management
ため,インターネット接続がない環境でもコンテン
ツを読むことができる。
とんどないためだ。
地元の新聞『デトロイト・フリープレス(D e t r o i t
(http://www.amazon.co.jp/gp/press/pr/
Free Press)
』によると,勤務交代時間の午後2時に間
20150121/ r e f = a m b _ l i n k _72607249_1? p f _ r d _
に合うように自宅を朝8時に出て,仕事が終わるのは
m=AN1VRQENFRJN5&pf_rd_s=center-1&pf_rd_
夜10時。午前1時のデトロイト行きの最終バスに乗り,
r=129AW2B88H157F29P3CC&pf_rd_t=2701&pf_rd_
自宅に帰るのは朝の4時という生活を10年以上続けて
p=192573889&pf_rd_i=home-2015) (accessed 2015-
いる。同紙がこの記事を報じて以降,多くのコメン
02-05).
トがFacebookに寄せられた。
こうした過酷な通勤事情を知った地元の大学生が
実は20代男性の平均読書時間が長かったこと
クラウドファンディング「G o F u n d M e(ゴー・ファ
が判明
ンド・ミー)」で寄付金を呼び掛けたところ,2月3日
時点で22万6,310ドル(約2,685万円,1ドル=118.62
電子書籍サービスの会社トゥ・ディファクトが20 ~
円 換 算 ) の 募 金 が 寄 せ ら れ て い る と い う。 ま た,
40代の男女300名を対象に行ったアンケート調査によ
Facebookには,自動車メーカーからの車の無償提供
ると,
「20代男性」の読書時間が一番長かったことが
の申し出もあったという。
判明した。毎月1冊以上の本や電子書籍を読んでいる
(http://www.gofundme.com/l7girc) (accessed 2015-
のは,
「30代女性」で66.0%だが,1日の平均読書時間
02-09).
がもっとも長かったのは意外にも「20代男性」で「39.1
分」だった。40代男女はともに「30分以下」で,全
東日本大震災の体験に基づき整理した国交省
体的に40代より20 ~ 30代の方が読書している結果と
の「災害移動期指揮心得」がKindleストアで無
なった。
料配信
また,どの世代でも電子書籍よりも紙の本で読む
人が圧倒的に多かった。インターネットの影響で読
国土交通省が東日本大震災の実体験に基づき作成
書時間が減ったと回答した人は40代に多く,男性
した,災害時の行動指針「災害移動期指揮心得」の
42%,女性56%と,20 ~ 30代より10ポイント近く
日本語版と英語版が,2月9日からK i n d l e本として無
高かった。
料ダウンロード可能となった。
( h t t p : / / w w w.2d f a c t o . c o . j p / p d f /150204_1. p d f )
(accessed 2015-02-09).
毎日30キロ以上を徒歩通勤する男性にクラウ
ドファンディングの救いの手
「災害移動期指揮心得」は,今後巨大地震が発生し
た際に,地方整備局の指揮官の行動規範となる具体
的な指針を整理した内部資料で,以下の3点を基本と
してまとめられている。
・東日本大震災を実体験した者にしかわからない
「経験知」を,関係者共通のものとすること
米国デトロイトに住むジェームズ・ロバートソン
956
・防災計画に沿った復旧・復興が軌道に乗るまでの,
さんは,10年ほど前に自家用車が故障して以来,勤
シナリオのない,最もシビアな決断を迫られる最
務先のプラスチック工場のあるミシガン州ロチェス
初の1週間を乗り切るための指針となること
情報界のトピックス ●Topics of the information community
・想定される首都直下や東海・東南海・南海地震な
本大震災で問題視された原子力発電所事故対応,自
どの大規模災害に対して,地方整備局の各クラス
衛隊との連携などまで多岐にわたり対応指針が記さ
の指揮官が心得ておくべき指針としてとりまとめ
れている。
ること
( h t t p : / / w w w . a m a z o n . c o . j p / d p / B00S8U X G9G )
同書は救援ルートの確認や地域支援の準備,東日
(accessed 2015-02-09).
情報管理 vol. 57 no. 12 2015
957
情報管理
JOHO KANRI
2015
vol.57 no.12
Journal of Information Processing and Management
http://johokanri.jp/
March
最近,30年後の未来が頻繁に取り上げられてい
ます。2月12日発行の『R25』に掲載された石田衣
良氏「空は、今日も、青いか?」では,「技術的特
異点の向こう側」と題して,30年後を話題にして
います。難問を一緒に考えてくれる相棒として人工
知能に期待する一方で,労働形態に大変革が起こる
可能性にも触れています。
1月3日から2月8日に全5回で放送されたN H Kス
ペシャル『NEXT WORLD 私たちの未来』をご覧
になった方も多いかと思います。「技術的特異点=
シンギュラリティ(singularity)」すなわち,「汎
用人工知能が実現し,その知能が人間を超える時点」
以降の世界を描いた番組でした。2045年問題とも
呼ばれるシンギュラリティは,いまや現実的な問題
として注目を集めています。情報処理学会『情報処
理』1月号は,
「人類とICTの未来:シンギュラリティ
まで30年?」の特集を組んでいます。
2045年なのかどうかはともかく,遅くとも今世
紀中に人工知能が人間を超えることは確実のようで
す。当然,社会構造に大きな影響が出るでしょう。
雇用の問題は深刻です。人間は何をして,どう生き
ていくのかという根源的な問題を突き付けられます。
山口高平教授(慶應義塾大学,人工知能学会前
会長)は,
「サンフランシスコの病院では、忙しく
て最新手術事例を調べられない臨床医に代わって医
学論文のデータベースを意味リンクで調べる『医療
Watson』が活用されています。このように、ただ何
かを調べるだけの職業は今後なくなっていくでしょ
う」
(
『エンジニアt y p e』
,2014年10月)と述べてい
ます。情報に関連した職業に就く者として,人間に
しかできないことは何なのか考えさせられます。
松原仁教授(公立はこだて未来大学)は,人工知
能学会会長就任挨拶で「人工知能の発展は人間の敵
ではなく必ずや人間のためになるはず」と述べてい
ます。前向きに考えたいものです。
連載「インフォプロによるビジネス調査―成功の
カギと役立つコンテンツ」は今号で終了します。ご
(KM)
愛読ありがとうございました。
□次号予定
●大学マネジメントにおけるエンロールメントマネジメントとインスティテューショナル・リサーチ:山形大学
「総合学生情報データ分析システム」構築事例からの考察
●化学物質リスク情報の統合と利用
●BIBFRAMEとその問題点:RDAメタデータの観点から
●電子書籍貸出サービスの現状と課題:米国公共図書館の経験から
●第5次科学技術基本計画の「コア技術」策定に向けたエビデンス作成方法
情報
管理
JOHO KANRI
Journal of Information Processing and Management
科学技術振興機構
vol.57 no.12 March 2015
●編集委員会
<委員長>加藤治(科学技術振興機構)
<編集委員>
江草由佳(国立教育政策研究所)・岡安渉子(富士通㈱)
・
小河邦雄(大正製薬㈱)・気谷陽子(放送大学)・
山下正隆(旭化成㈱)・植松利晃・木村美実子・佐藤恵子・
嶋田一義・白石淳子・土屋江里・中村拓・火口正芳・
樋廻美香子・余頃祐介(以上 科学技術振興機構)
●編集事務局
木村美実子(事務局長)
藤井昭子・本橋野枝・及川優子・中山広之(以上 科学技
術振興機構)
2015年3月1日発行(月刊)
年間購読定価 本体 ¥12,960(税込)
1部定価
本体 ¥1,296(税込)
●版下作成・印刷
昭和情報プロセス株式会社
発行
独立行政法人 科学技術振興機構
〒102-8666 東京都千代田区四番町5番地3
「情報管理」編集事務局
Tel. 03(5214)8406 Fax. 03(5214)8420
E-mail: [email protected]
http://johokanri.jp/
Published monthly by Japan Science and Technology Agency (JST)
JOHO KANRI Editorial Office, JST, P.O.Box 2, Kojimachi Tokyo 102-8666 JAPAN
・本誌に落丁・乱丁がありました節は,まことに恐れ入りますが,編集事務局宛に現品をご返送ください。送料は当機構
の負担で,お取り替えいたします。勝手ながら現品送付のない場合は,お取り替えいたしかねます。
・未着事故などのご連絡は発行後2か月以内にお願いします。以後は原則としてお受けできません。
© Japan Science and Technology Agency 2015 無断転載を禁ず
958
情 報 管 理
J O H O K A N R I : Journal of Information Processing and Management
vol. 57
no. 1 - 12
2014. 4 - 2015. 3
(p. 1 - 958)
独 立 行 政 法 人 科 学 技 術 振 興 機 構
༎ਬ͍̈́ͣͅอ࣐૽
ඊၛ࣐ଽ༹૽ȁ‫੅ܿڠش‬૦‫ࢹܥޟ‬ȁȁ
ૂ༭ْܑ໐ġ໐ಿȁ‫ح‬൥ȁহ
ɧIJıijĮĹķķķȁ൐‫ނ‬സ୷యനߊঅ๔಴ Ķ ๔౷ Ĵ
ȶૂ༭‫ۯ‬ၑȷ༎ਬমྩޫ
ġ
7HO)D[
(PDLOMRKRNDQ #MVWJRMS
85/KWWSMRKRNDQULMS
Ⓒ-DSDQ6FLHQFHDQG7HFKQRORJ\$JHQF\
年間記事索引●Index
情報管理 第 57 巻 年間記事索引
挨拶・所感
巻頭言
JST情報資産のビッグデータとしての活用
(大竹 暁) 57(1)1-2
(加藤治彦) 57(10)705-708
座談会・インタビュー
座談会:3i研究会「情報を力に変えるワークショップ」(前編) メンバーが語るその活動と魅力
(伏見祥子,本田瑞穂,大久保武利,山中とも子,真銅解子,中村 栄) 57(3)157-169
座談会:3i研究会「情報を力に変えるワークショップ」(後編) メンバーが語るその活動と魅力
(伏見祥子,本田瑞穂,大久保武利,山中とも子,真銅解子,中村 栄) 57(4)251-256
インタビュー:研究データの共有と活用の基盤整備をめざして
DataCite Executive Officerに聞く
(Brase, Jan;インタビュー:恒松直幸) 57(12)871-881
本記事
患者中心の情報管理とそれを可能にする新しいインフォームドコンセント (森田瑞樹)
機械翻訳のいま 統計的手法を中心に
(隅田英一郎)
JDreamIIIの紹介とサービス連携
(長谷川均)
日本版NIH創設に向けた新しい指標の開発(4) パイプラインにつながる特許の判別指標
(治部眞里,長部喜幸)
レジリエントな社会を実現する情報技術
(渡辺日出雄)
オープンサイエンスと科学データの可能性
(宮入暢子)
インターネット上の名前・アイデンティティ・プライバシー
(折田明子)
佛教大学図書館におけるウェブスケールディスカバリー Summonの導入効果と課題
(飯野勝則)
わが国の著作権制度における権利管理
(児玉晴男)
人間可読性から機械可読性の時代へ XML組版への製作現場からの提言 (中西秀彦)
経営に求められる文書情報マネジメント
(木戸 修)
日本版NIH創設に向けた新しい指標の開発(5)
パイプラインにつながる特許判別指標の応用
(治部眞里,長部喜幸)
日比谷図書文化館という多面体 図書部門の活動から
(樋口万季)
聴覚障がい者向け手話サービスへの情報技術の応用~ Tech for the Deaf ~
(大木洵人)
リコーイメージング株式会社における特許評価活動
(最上谷誠)
(高木 聡)
3Dプリンターからみる新たなものづくり 付加製造技術の可能性
図書館の諸活動に関する著作権2014 「教えて!著作権」その後
(南 亮一)
電子行政における使用漢字の問題
(榎並利博)
電子教科書の現状
(田村恭久)
記録管理の国際標準「ISO 30300」への期待と和訳試案
(渡邊 健,小谷允志,伊藤真理子,小根山美鈴,白川栄美,山田敏史)
AMED(日本版NIH)創設に向けた新しい指標の開発(6)
疾病別にみた医薬品開発の現状俯瞰・将来予測
(長部喜幸,治部眞里)
MOOCとは何か ポストMOOCを見据えた次世代プラットフォームの課題
(山田恒夫)
研究戦略のための計量書誌学の実践的活用と応用
(福成 洋)
産業日本語の取り組み 特許ライティングマニュアルを中心に
(松田成正)
57(1)3-11
57(1)12-21
57(1)22-28
57(1)29-37
57(2)69-79
57(2)80-89
57(2)90-98
57(2)99-108
57(2)109-119
57(3)149-156
57(3)170-177
57(3)178-186
57(4)223-233
57(4)234-242
57(4)243-250
57(4)257-265
57(5)291-297
57(5)298-306
57(5)307-314
57(5)315-322
57(5)323-333
57(6)367-375
57(6)376-386
57(6)387-394
index1
情報管理 Vol.57
AMED(日本版NIH)創設に向けた新しい指標の開発(7)
米国のファンディング動向
(治部眞里,長部喜幸) 57(6)395-406
出版倫理と情報管理の関わり
The Committee on Publication Ethicsでの経験から(ウェイジャー , エリザベス) 57(7)443-450
Journal of Epidemiologyにおける出版倫理の取り組み
(橋本勝美) 57(7)451-456
シンガポールの新図書館情報政策 コミュニティーにおける公共図書館の役割
(宮原志津子) 57(7)457-467
化学産業における国際標準化の目指すべき方向
(松本芳彦) 57(7)468-474
オープンアクセス出版と英国王立化学会
(イーグリング, ロバート;福田佳子;浦上裕光;ウィルソン, エマ) 57(7)475-483
人間力・社会力を強化する情報通信技術 人工知能を中心に
(西田豊明) 57(8)517-530
(藤井孝藏) 57(8)531-538
学会論文誌のあり方 日本機械学会における学術論文誌の再編から
高齢者・障害者の感覚特性データベース
製品・サービス・環境のアクセシビリティ向上のために
(倉片憲治) 57(8)539-547
大学図書館書籍アーカイブHathiTrust
(時実象一) 57(8)548-561
AMED(日本版NIH)創設に向けた新しい指標の開発(8)
医薬品研究開発における知識の流れ
(治部眞里,長部喜幸) 57(8)562-572
PLOS ONEのこれまで,いま,この先
(佐藤 翔) 57(9)607-617
EPUB概説:電子出版物とWeb標準
(高瀬拓史) 57(9)618-628
Scientific Data データの再利用を促進するオープンアクセス・オープンデータジャーナル
(ヒリナスキエヴィッチ, イアン;新谷洋子) 57(9)629-640
ほぼあらゆるものをつくるファブラボ
ファブラボ鎌倉における実践とその可能性
(渡辺ゆうか) 57(9)641-650
国立国会図書館サーチのメタデータ収録状況 Europeanaとの比較調査
(塩崎 亮,菊地祐子,安藤大輝) 57(9)651-663
学術系クラウドファンディング・プラットフォーム「academist」の挑戦 (柴藤亮介) 57(10)709-715
57(10)716-724
電子実験ノートを用いた知的財産保護の最前線
(原田明彦,間杉奈々子)
大学学習資源コンソーシアム 学習・教育のための利用環境整備
(三角太郎) 57(10)725-733
未来のデータサイエンティストを探せ! 研究分野遷移から見た人材マッチング
57(10)734-740
(釋 宏介,中井洋平,笹谷俊徳)
緊急アピール:電子ジャーナルの問題解決のための「3つの提言」
(石田武和) 57(10)741-746
電子教科書の規格とEDUPUBの現状
(田村恭久) 57(11)791-798
電子行政における文字環境の整備
(平本健二) 57(11)799-808
自動運転技術の開発動向と技術課題
(須田義大,青木啓二) 57(11)809-817
シュプリンガーの学術書籍出版とオープンアクセス
(田辺祐子) 57(11)818-825
サイバーフィジカルシステムとIoT(モノのインターネット) 実世界と情報を結びつける
(岩野和生,高島洋典) 57(11)826-834
音声の障がい者のための最先端音声合成技術
(山岸順一) 57(12)882-889
生きている国語辞典『デジタル大辞泉』の挑戦
(板倉 俊) 57(12)890-899
自動記事分類技術を用いた「日経テレコンナビ型記事検索」
情報収集に気づきを提供する新スタイル
(出口信吾) 57(12)900-909
NBDCヒトデータベース 運用開始から1年で見えてきた新しい課題
(箕輪真理,川嶋実苗,三橋信孝,堀尾 徹) 57(12)910-917
連載
インフォプロによるビジネス調査-成功のカギと役立つコンテンツ
第1回 ビジネス調査とは
第2回 プランニングの実際
第3回 企業情報
index2
(上野佳恵) 57(1)38-42
(上野佳恵) 57(2)120-124
(上野佳恵) 57(3)187-192
年間記事索引●Index
第4回 業界・市場調査(1)
第5回 業界・市場調査(2)
第6回 消費者動向情報
第7回 人物情報
第8回 調査に役立つ情報源
第9回 ヒアリングと自主企画調査
第10回 海外ビジネス情報
第11回 情報の読み方・使い方
第12回 情報の伝え方
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
(上野佳恵)
57(4)266-271
57(5)334-339
57(6)407-412
57(7)484-489
57(8)573-578
57(9)664-669
57(10)747-754
57(11)835-840
57(12)918-923
視点
デジタルなら海を越えられるか 海外の日本研究を支援するために
(江上敏哲)
大量情報時代における知識の積み上げ
(有田正規)
リサーチ・アドミニストレーターと図書館の研究情報資源
(鳥谷真佐子)
インドの特許出願公開制度
(今浦陽恵)
ユーザはどこにいるか 海外の日本研究を支援するために
(江上敏哲)
世界最遅のコンピューター
(有田正規)
研究力強化のための情報統合と分析 リサーチ・アドミニストレーターの立場から
(鳥谷真佐子)
インド特許局の特許情報とその活用
(今浦陽恵)
デジタル化を拒む素材とアウトリーチ 情報メディア学会パネルディスカッションから
(江上敏哲)
グローバルランキングの罪
(有田正規)
研究評価と研究戦略における研究力分析
(鳥谷真佐子)
インドにおける知財訴訟の現状
(今浦陽恵)
57(1)43-46
57(2)125-128
57(3)193-195
57(4)272-275
57(5)340-343
57(6)413-416
57(7)490-493
57(8)579-583
57(9)670-673
57(10)755-758
57(11)841-844
57(12)924-927
リレーエッセー
つながれインフォプロ 第7回
つながれインフォプロ 第8回
つながれインフォプロ 第9回
つながれインフォプロ 第10回
つながれインフォプロ 第11回
つながれインフォプロ 第12回
つながれインフォプロ 第13回
つながれインフォプロ 第14回
つながれインフォプロ 第15回
つながれインフォプロ 第16回
つながれインフォプロ 第17回
つながれインフォプロ 第18回
(齋藤久実子)
(黒田 潔)
(松浦智佳子)
(金澤敬子)
(渡邊清高)
(須藤公夫)
(迫田けい子)
(今野創祐,中込 栞,八木澤ちひろ)
(鈴木 敦)
(西内 史)
(平野正明)
(日下九八)
57(1)47-49
57(2)129-131
57(3)196-198
57(4)276-278
57(5)344-347
57(6)417-419
57(7)494-496
57(8)584-587
57(9)674-677
57(10)759-761
57(11)845-848
57(12)928-932
情報論議 根掘り葉掘り
アイデアの独占 その正当化への迷い
クレタ人は嘘つきだとクレタ人は言った
自動生成論文 虚偽か遊びか? あるいは真実も?
著作物の公正使用 おとぎ話同然?
プライバシー・バイ・デフォルト
ノウハウ 対 標準 ジャパン・アズ・ナンバー・ワンの時代
(名和小太郎)
(名和小太郎)
(名和小太郎)
(名和小太郎)
(名和小太郎)
(名和小太郎)
57(1)50-54
57(3)199-203
57(5)348-351
57(7)497-500
57(9)678-682
57(11)849-852
index3
情報管理 Vol.57
過去からのメディア論
何が複製を許諾する権利の対象か? 中世から近代にかけての著作物概念の変遷
(大谷卓史)
(大谷卓史)
ネット中毒と「読書中毒」
SNSは世論を製造するか?
(大谷卓史)
職務発明制度改革 技術者倫理からの考察
(大谷卓史)
知的財産権制度はなぜ必要か 歴史と倫理からの考察
(大谷卓史)
プライバシーの多義性を考える
(大谷卓史)
57(2)132-135
57(4)279-281
57(6)420-422
57(8)588-590
57(10)762-764
57(12)933-935
集会報告
第21回情報活動研究会 「使いこなそう!国立国会図書館のウェブコンテンツ」
(中村文胤) 57(1)55-56
データサイエンス・アドベンチャー杯
(伊藤 祥) 57(1)57-61
第22回情報活動研究会
「図書館・情報部門は,この時代をどう生き抜いていくのか?」ワールド・カフェの試み
(岡 紀子) 57(2)136-138
Code4Lib カンファレンス 2014
(江草由佳) 57(3)204-207
研究データ同盟(Research Data Alliance)第3回総会
(恒松直幸,浅野佳那) 57(3)208-212
第23回情報活動研究会 「J-GLOBAL! こんな使い方・あんな使い方 知って得々!」
(勝山 麗) 57(5)352-355
ORCIDアウトリーチ・ミーティング in シカゴ
(坂東慶太) 57(6)423-428
情報メディア学会 第13回研究大会
(原島大輔,石川大介,植松利晃,岡野裕行,岡部晋典,角田裕之,中林幸子,天野 晃)
57(6)429-431
第31回医学情報サービス研究大会(MIS31)
(佐藤正惠) 57(7)501-503
ジャパンリンクセンター活用の為の対話・共創の場(第1回)
~機関リポジトリのコンテンツへのDOI登録~
(中島律子) 57(8)591-595
Code4Lib JAPAN カンファレンス2014
(奥山智靖) 57(9)683-685
DataCite2014年年次会議 ~データに価値を与える~
(中島律子,武田英明) 57(9)686-689
第24回情報活動研究会 超入門! 大学図書館とラーニング・コモンズ
-日本最大級! 関西学院大学発「アカデミックコモンズ」-
(岡 紀子) 57(9)690-693
ORCIDアウトリーチ・ミーティング in 東京
(宮入暢子) 57(10)765-768
ICSTI 2014 in Tokyo 年次会合 & シンポジウム
(藤平俊哉) 57(10)769-775
第16回図書館総合展フォーラム 識別子ワークショップ ~ JaLC,CrossRef,DOI,ORCID,そして…~
(火口正芳,余頃祐介) 57(10)776-780
2014年CrossRef年次総会
(中島律子) 57(11)853-855
第11回情報プロフェッショナルシンポジウム(INFOPRO2014)
57(11)856-860
(佐藤正樹,藤平俊哉,木下健太郎)
2014年DOIアウトリーチ会議
(余頃祐介,中山久美子,水野 充) 57(12)936-941
ICSTI 2015 年次メンバー会合&APE 2015 ~欧州の学術コミュニケーションの動向~
(遠藤裕子) 57(12)942-945
JSTサービス紹介
ジャパンリンクセンターの新機能
(加藤斉史) 57(12)946-948
この本!~おすすめします~
科学×文学
情報を身につける
エビデンスに基づく意思決定
index4
(坂下鈴鹿) 57(1)62-64
(高田高史) 57(2)139-142
(伊藤裕子) 57(3)213-215
年間記事索引●Index
自然に学ぶ情報の利活用
理系漫画家から文系大学院生へ 思考と言語とコミュニケーション
イノベーションの実践のために
イノベーションとは 科学技術の視点から 「本を通じた人とのつながり」を設計する
アナログと,デジタルと 計算機と知識の伝承
善き先達と善き道しるべを探すためのヒント
地方消滅
人生のお供に図書館を 2014年3大図書館本+α
(西成活裕)
(はやのん)
(松井くにお)
(山下恭範)
(常川真央)
(飯野勝則)
(和知 剛)
(結城章夫)
(神代 浩)
57(4)282-285
57(5)356-359
57(6)432-435
57(7)504-509
57(8)596-599
57(9)694-697
57(10)781-784
57(11)861-863
57(12)949-952
図書紹介
RDA入門 目録規則の新たな展開 JLA図書館実践シリーズ23
文書と記録のはざまで 最良の文書・記録管理を求めて
ホームスの冒険 謎解き・紐解き・文献検索:医学文献を求めて
RDA 資源の記述とアクセス 理念と実践
(南山泰之)
(瀬畑 源)
(佐藤正惠)
(村上 遥)
57(2)143
57(3)216
57(6)436
57(11)864
情報界のトピックス
57(1)65-67,57(2)144-147,57(3)217-220,57(4)286-289,57(5)360-364,57(6)437-440,57(7)510-513,
57(8)600-603,57(9)698-702,57(10)785-789,57(11)865-868,57(12)953-957
PINUP
57(3)221,57(5)365,57(6)441,57(7)514-515,57(8)604-605,57(9)703,57(11)869
編集後記
57(1)68,57(2)148,57(3)222,57(4)290,57(5)366,57(6)442,57(7)516,57(8)606,57(9)704,57(10)790,
57(11)870,57(12)958
その他
2014年(vol. 57)投稿規定・著作権規定
57(1)appx1-appx6
index5