専門図書館No.273(2015.9) 第 5 分科会:オープンサイエンスと研究データ公開 3.研究データの発信に向けて: 「ホームページによる情報発信」の次を考える 林 賢 紀(国立研究開発法人 国際農林水産業研究センター) 1.はじめに これまで「ホームページによる情報発信」とし て、図書館はじめ各所で様々な情報が発信され続 けている。 一方、大学図書館を中心として、「オープンア クセス」が学術情報流通の一つとして推進されて おり、その手段として機関リポジトリやデジタル アーカイブの構築が進められている。近年では、 書誌情報や論文だけでなく研究データにまでその 領域は広がろうとしている。 にコストや手間がかかっている」という状態にあ このような動きは、これまでの「ホームページ ることが指摘されている 2 )。 による情報発信」と何が違うのか。本発表では必 メタデータが整備され、きちんと管理がなされ 要な要件の整理や今後必要となる取り組みについ ているデータももちろん多いが、公開されている て検討したい。 研究データを自身の研究のために二次利用を行う 場合、利用のためのライセンスの整備も課題であ 2.これまでの情報発信 ろう。 これまで多くの「ホームページ」が公開されて いるが、その公開されている情報やデータベース 3.オープンアクセスとオープンサイエンス の種類、名称等の検索についてはgoogleなどの検 3.1 オープンアクセス 索エンジンに依存し、メタデータの整備も十分で 学術論文を誰でも無料で閲覧可能とするオープ はない。また、少なくない費用と時間をかけて構 ンアクセスについては、商業学術雑誌の高騰への 築したデータが担当者の異動等により更新が止ま 対抗手段の一つでもあるが、本稿では「学術情報 り陳腐化する、ドメイン名の変更によりアクセス に誰でもアクセスできる」という側面から取り上 ができなくなる、あるいはデータそのものが散逸 げる。 するなどの状況はよく見られるところである。 オープンアクセスは全世界的な取り組みである 公開されているデータの形式も、たとえば日本 が、日本においては第 4 期科学技術基本計画にお 政府においてはその41%がPDF、34%がHTMLと いて「研究情報基盤の整備」の推進方策として「国 1) 二次利用に適さない形式が多く 、その内容も、 は、大学や公的研究機関における機関リポジトリ 「人が読む(画面上又は印刷して)という利用形態 の構築を推進し、論文、観測、実験データ等の教 に適したデータの構造 (タグの付け方、表の形式 育研究成果の電子化による体系的収集、保存やオ 等)やデータ形式」で公開され、 「検索も難しく、 ープンアクセスを促進する。また、学協会が刊行 大量・多様なデータをコンピュータで高速に、横 する論文誌の電子化、国立国会図書館や大学図書 断的に又は組み合わせて処理・利用しようとした 館が保有する人文社会科学も含めた文献、資料の 場合、データの構造やデータ形式を変換するため 電子化及びオープンアクセスを推進する。」こと − 71 − 専門図書館No.273(2015.9) とされている。また、これらの動きを受けて、各 ついては、すでに機関リポジトリなどで実績があ 大学等において論文をアーカイブし公開する機関 ることから、図書館の役割を期待する声もある 4 )。 リポジトリの構築も進んでいる。国立情報学研究 所の集計 3 )では2007年末の57機関から2014年末に 4.研究成果のWebでの発信の実際 は426機関、公開コンテンツ総数は200万件を超え るなど、その数は年々増加している。 実際の研究現場では、どのような経過をたどり 研究データの作成と公開が行われてきたか、筆者 各大学等で構築された機関リポジトリは、国立 情報学研究所の学術機関リポジトリポータル の所属する国際農林水産業研究センターでの事例 を元に紹介したい。 JAIROと連携し、蓄積した情報のうち書誌情報 農業研究、特に育種分野では作物の生長に伴い などが記録されたメタデータを提供している。こ 様々なデータを記録する必要がある。たとえば の連携によりCiNiiなどの検索サービスから機関 「雑草防除技術の開発」という研究テーマでは、 リポジトリ上の学術論文が検索可能となるなど、 主要な雑草について種の採取から実際の生育状況、 メタデータの交換など「情報を流通しやすい環境 また除草剤への反応や生態系全体への影響など、 を構築する」ことが学術情報の検索可能性や発見 様々なデータを記録し、これらを経年的に分析し 性の向上に大きく貢献しているといえる。 た上で除草体系の策定が行われる。 3.2 オープンサイエンス 開に支障がないデータについては、 「西アフリカの これら研究の過程で得られたデータのうち、公 「学術情報に誰でもアクセスできる」というオ サバンナ低湿地帯の雑草データベース」5 )として公 ープンアクセスの理念は、学術論文だけでなく論 開しており、この更新作業をWebサイトの管理担 文のエビデンスとなっている研究データにまで広 当者である図書館担当部署が行っている。 がっている。詳細は本分科会の林氏のご発表に譲 しかし、データ作成と更新の主体はあくまで担 るが、これらを前提としたサイエンスの進め方が 当の研究者であり、図書館で行っているのはリン 「オープンサイエンス」と呼ばれている。公的研 ク漏れなどの確認と他のページとのリンクの設定、 究資金による研究成果については、研究データを またWebサーバへのアップロードなどに限られる。 含めて公開することで、研究成果の共有と相互利 先の「オープン研究データに関する 5 原則」に当 用の拡大が期待できる。 てはめれば、 (a)の記述メタデータやデータフォ G 8 の下に置かれている政府高官グループ (GSO) で合意された「オープン研究データに関する 5 原 則」を以下に挙げる。 ーマットの策定に関わることもなく、かろうじて (d)に必要な管理を行う程度であり、きわめて限 定的な関わりであるのが現状である。 (a)容易に探せること(discoverable) これは機関リポジトリの運用でも同様ではない (b)容易にアクセスできること(Accessible) だろうか。各機関リポジトリの案内などによれば、 (c)容易に理解できること(Understandable) リポジトリのメリットについて言及しつつ、「登 (d)容易に管理できること(Manageable) 録をお願いします」と論文の刊行と登録を待ち受 (e)人材(People) の確保 けているものが多い。また、所属する教員の論文 これらのうち、(a)は記述メタデータの標準化、 が刊行されたタイミングで登録の依頼を行う、業 適切なデータフォーマットの採用、 (b)はDOI (デ 績管理システム等と連携し書誌情報が自動登録さ ジタルオブジェクト識別子)のような標準的な仕 れるなどの事例もある。しかし、成果物である 「論 様に沿ったデータの同定と所在地などが含まれる。 文を登録する」機関リポジトリであるためか、研 (d)については効率的・永続的な管理に必要な方 針と計画を定めることとしている。また、(e)に 究活動そのものとの連携事例については確認でき ていない 6 )。 − 72 − 専門図書館No.273(2015.9) 5. 「ホームページで情報発信」とオープンサイエ 6.図書館で今できることを考える 6.1 利用者と資料を知る ンスの違い 図書館サービスにおいては当たり前のことでは 「ホームページで情報発信」と「オープンサイ あるが、研究データを扱うという状況においても エンス」との違いについて整理したい。 大きく異なるのは、単に「公開する」だけにと どまらない、という点であろう。研究機関におい 利用者とそのニーズ、行動、そして対象となる資料 (ここでは研究データ) を知ることからはじめたい。 ては「研究成果の理解促進」などのためにWeb まず、研究のプロセスとそれぞれで生産される を活用した情報公開が行われているが、オープン 情報について把握する必要があるだろう。一般的 サイエンスにおいては「公開した後の利用」のあ な科学研究の方法論では 1 )疑問を持つ、 2 )仮説 り方を重要視しているとも言えよう。 を立てる、 3 )実験・観察、 4 )結果の分析、 5 ) 研究成果の受益者は研究者に限らない。アマチ 結論を導出というプロセスをたどる。これまでの ュアの専門家による科学研究活動は古くから存在 機関リポジトリにおいては 5 )の生産物であると しており、近年では電波望遠鏡のデータを自宅な ころの学術論文を主に取り扱っていたが、研究デ ど多数のPCで解析して地球外知性の探索(SETI) ータは 3 )以降の過程ですでに生成されている。 7) を行う科学実験SETI@home など、市民参加型 また、研究の再現や検証のためには、 3 )で使用 の活動も見られる。 したツール、プログラムなども研究データに準じ また、村山ら 8 )は、 「科学が社会と密接にかか て扱われる。 わればかかわるほど、社会から科学知、科学的判 目の前の資料に対して書誌データを作成し分類 断の信頼を得ることは重要となり、そこでは科学 整理し目録を作成する、また後の利用に耐えるよ 者集団と社会との情報共有とオープンな検証の担 う適切な保存手段を講じるのが従来の図書館員の 保が重要」であり、 「批判や再試験、検証ができ 業務であるが、研究データに対してもまた同様で る資料の提供機会をつねに維持していることが重 あろう。適切なメタデータを付与して研究データ 要となる」としており、科学者集団と社会との情 の検索性や発見性を向上させ、研究データを再利 報共有とオープンな検証の担保の重要性を論じて 用可能な状態に保つなど、これまで図書館員が養 いる。 ってきた技能で対応できることは多い。 これらを実現するためには、Webを活用して単 に研究成果を公開するだけでなく、 「オープン研 6.2 研究コミュニティと作法を知る 研究データを生成し記録するのは研究者であり、 究データに関する 5 原則」に挙げられるような 「見 つけやすい」 「アクセスしやすい」 「わかりやすい」 「管理しやすい」「訓練された人材による運営」が これらを共有するための知見はそれぞれの研究コ ミュニティで醸成されてきた。論文を例にとれば、 査読前の論文を公開するプレプリントサーバ 必要であると考えられる。 9) このうち「人材」について、真板 は研究者の arXivは、物理学分野において研究者の間で多く 立場から「長期的な保全・管理体制があって初め のプレプリントが流通しているという文化の元に て安定的な公開・共有が可能となる」という観点 成り立っており、他の学術分野では見られない。 研究データの取り扱いにおいても同様であり、 から、「研究者自身によるデータ公開が必ずしも 適切ではない」と述べている。また、特定の主題 「『国際的動向を踏まえたオープンサイエンスに関 について一定の知識があるサブジェクトライブラ する検討会』報告書」10)においても、 「研究分野の リアンが注目されていることにも触れている。 特性に対する配慮」として、研究分野による研究 データの保存と共有の作法に違いがあることを認 識する必要があるとしている。 − 73 − 専門図書館No.273(2015.9) 図書館で用いられる件名標目やシソーラスが分 が大きなポイントである。適切な識別子(ファイ 野などに応じて多々存在するように、研究データ ル名も識別子の一つである)の付与や、文字コー を蓄積するプラットフォームやメタデータ記述な ドの選定、また特定のアプリケーションに依存し どのツールも研究分野ごとに存在しており、これ たファイル形式を使用していないか、などが挙げ らを把握することが必要である。 られる。またPDFのような汎用性のあるファイ 例えば生物の分布情報や標本、調査・観察デー ル形式や画像データであっても、「コンピュータ タ は「 生 物 多 様 性 情 報 」 と 呼 ば れ、 こ れ ら は に与えて、解析させるためには、事前に人間がそ GBIF (Global Biodiversity Information Facility、 の画像にあるデータを表計算ソフトウェアに入力 地球規模生物多様性情報機構)において地球規模 して保存するか、又は画像認識等の技術により公 での蓄積と共有が図られている。また、標本、観 開されているデータから数値やテキストを得て、 察データを記述するメタデータ標準については、 それをコンピュータに与える必要がある。これは Darwin Coreがあり、GBIFなどで採用されている。 情報利用者に負担を求める方法であり、効率的で ない」12)とし、表であれば表として認識しその中 6.3 データフォーマットの見直し の値を正しく処理可能とすることが求められる。 「より利用しやすくする」ことを考えれば、デ ータの記述方法やライセンスについても検討する 7.まとめ 必要がある。ここでは「オープンデータ」でとら れている方法が参考になろう。 本稿では、オープンサイエンスを推進するため に必要となる研究データの公開にあたり、図書館 オープンデータとは、 「機械判読に適したデー タ形式で、二次利用が可能な利用ルールで公開さ で今、何ができるか、その手がかりについて紹介 した。 れたデータ」であり、日本政府においては、 「電 11) 研究データ公開については、 「情報を整理して 子行政オープンデータ戦略」 の元、二次利用可 提供する」という図書館でこれまで取り組まれて 能な形での行政データを提供する取り組みが進め いた業務と本質的には変わらないが、作法や技術 られている。 には見直すべき、あるいは新たな学びを必要とす このオープンデータの作成・整形・公開に当た っての留意事項などについては「オープンデータ る点も多い。また、情報の生産者である研究者と、 より密接な連携も必要となるだろう。 12) ガイド」 にまとめられている。大きくは「利用 どこまで、またどのようにして図書館が研究デ ルール」と「技術」の 2 つの観点からまとめられ ータに関わるかは今後も議論されるテーマである ており、研究データ公開においても参考になる点 が、図書館が蓄積してきた情報管理の技術が活か が多い。 されうる分野であり、積極的に関わるべきである まずライセンスについては、 「二次利用を認め と考える。 る」ことが大前提となるが、 「オープンデータガ イド」においてはクリエイティブ・コモンズ(CC) 8.おわりに 余談であるが、研究者との関係についてのエピ ライセンスや政府標準利用規約などが例として示 されている。なお、研究データの場合には、特許 ソードを一つ紹介したい。 や知財として保護・利活用される場合もあり得る 忘年会シーズンになると、研究所で圃場を管理 ため、原則は公開としても保護期間が過ぎた後に する技術支援スタッフは毎日のように研究室の宴 公開するなどの措置が必要となる場合があること 席に招かれる。日夜、田畑を整え様々な研究室と に留意しておきたい。 協力して作物を育成する「縁の下の力持ち」であ 技術については「機械判読が可能であること」 る彼らと研究者との関係の強さが伺えるが、図書 − 74 − 専門図書館No.273(2015.9) 館員はそこまでの関係を利用者と築けているだろ 6 )機関リポジトリの構築や運用事例については、 うか。また、その覚悟があるだろうか。 Patron デジタルリポジトリ連合(Digital Repository ではなく Contributor として利用者と向きあう、 F e d e r a t i o n)のW e bサ イ ト (h t t p : / / d r f . l i b . それが図書館に求められている。 hokudai.ac.jp/drf/index.php?)内の事例報告集 (はやし たかのり) 参考文献 に各地での発表がまとまっている。 7) SETI@home. SETI@home . 1 )内閣官房情報通信技術 (IT) 総合戦略室. デー http://setiathome.ssl.berkeley.edu/ タカタログサイト試行版「DATA.GO.JP」の最 (参照2015-6-8) 新の状況 . 8 )村山泰啓、林和弘. 科学技術動向研究 オープ http://www.kantei.go.jp/jp/singi/it2/densi/ ンサイエンスをめぐる新しい潮流(その 1 )科学 dai6/sankou1.pdf.(参照2015-6-8) 技術・学術情報共有の枠組みの国際動向と研究 2 )高度情報通信ネットワーク社会推進戦略本 のオープンデータ. 科学技術動向. 2014, No.146, 部. 電子行政オープンデータ推進のためのロ p.12-17. ードマップ(平成25年 6 月14日高度情報通信ネ 9 )真板英一.「研究データ公開」における人材と ットワーク社会推進戦略本部 (IT総合戦略本 体制の問題─研究図書館の可能性─. 日本生態 部)決定). 学会誌. 2014, Vol.64, No.1, p.81-86. http://www.kantei.go.jp/jp/singi/it2/kettei/ 10)国際的動向を踏まえたオープンサイエンスに pdf/20130614/siryou3.pdf.(参照2015-6-8) 関する検討会. 我が国におけるオープンサイエ 3 )国立情報学研究所. 機関リポジトリ公開数と ンス推進のあり方について∼サイエンスの新た コンテンツ数の推移 . な飛躍の時代の幕開け∼ . https://www.nii.ac.jp/irp/archive/statistic/ h t t p : / / w w w8. c a o . g o . j p / c s t p / s o n o t a / irp_2015_statistic.html.(参照2015-6-8) openscience/index.html(参照2015-6-8) 4 )第 8 期学術情報委員会. 第 8 期学術情報委員 11)高度情報通信ネットワーク社会推進戦略本 会(第 3 回) 配付資料、資料 2 「学術情報のオー 部. 電子行政オープンデータ戦略(平成24年 7 プン化」に係る審議について(案). 月 4 日高度情報通信ネットワーク社会推進戦略 http://www.mext.go.jp/b_menu/shingi/ 本部決定). gijyutu/gijyutu4/036/attach/1359371.htm h t t p : / / w w w . k a n t e i . g o . j p / j p / s i n g i / i t2/ (参照2015-6-8) pdf/120704_siryou2.pdf.(参照2015-6-8) 5 )国際農林水産業研究センター . 西アフリカ 12)オープン&ビッグデータ活用・地方創生推進 のサバンナ低湿地帯の雑草データベース . 機構. オープンデータガイド .第 2 版. http://www.jircas.affrc.go.jp/project/Ghana/ http://www.vled.or.jp/news/1507/150730_ contents/botanical_index_jp.html(参照2015-6-8) 001192.php.(参照2015-7-31) 研究データの発信に向けて :「ホームページによる情報発信」の次を考える 林 賢紀(国立研究開発法人 国際農林水産業研究センター) 「オープンサイエンス」に必要となる研究データの発信と提供について、 「ホームページによる 情報発信」との違いを元に概説した。また図書館で可能な取り組みについて検討した。特に、研 究データの生産者である研究者との連携が必要になると考える。 − 75 −
© Copyright 2024 Paperzz