貴重資料のデジタル化とWebベースによる提供 平成15年10月23日(木) 第44回中国四国地区大学図書館研究集会 松山大学 大阪市立大学学術情報総合センター 平方善雄 はじめに n 他大学、他機関の紹介 (1)MADO(Dream Technologies) 山口県文書館 岡山大学附属図書館 (2)Gigav i ew(PFU) 東北大学附属図書館 国際日本文化研究センター (3)DjVu(LizardTech) 東京薬科大学情報センター 大正大学附属図書館 (4)LuraDocument(Algo Vision) 琉球大学附属図書館 (5)MrSID(LizardTech) アメリカ合衆国議会図書館 パノラマ地図 島根県立図書館デジタルライブラリー 大阪市立大学における貴重資料データベース化の 取り組み n 平成 8年度∼11年度 森文庫マイクロフィルム画像データベース 伏見屋善兵衛文書画像データベース 大坂町触全文テキストデータベース n 平成12年度∼13年度 日本経済史資料画像データベースを含めて上記 4データベースのバーチャル図書館化(近世資料室) n 平成14年度∼15年度 近世大坂三郷・近郊古文書画像データベース ゾンバルト文庫データベースのバーチャル図書館化 経費と開発体制 経費 市費 47,700千円(H10∼H15) 科研費 26,300千円(H10∼H12,H14-15) 内訳 データ構築委託費(最も多い) 機器借上費、機器購入費 アルバイト費、開発委託費 n 開発体制 学情教員(開発リーダー)、職員(維持管理) 院生アルバイト(プログラム)、アルバイト(データ入力) 委託業者(プログラム、Webデザイン) 委託業者(マイクロ化、デジタル化) n データベース化貴重資料一覧 [1]『日本経済史資料』画像データベース[Jecoh] 資料件数 627種類、総2万丁、約20,000画像 [2]『伏見屋善兵衛文書』画像データベース[Fushimi] 資料件数 1259点、1,986画像 [3]『大坂町触』全文テキストデータベース[Ofure] 資料件数 御触、補触、口達等 10,708件 [4]『森文庫』マイクロフイルム画像データベース[Mori] 資料件数 2,259冊、297,177コマ(画像) [5]『ゾンバルト文庫』マイクロフイルム画像データベース [Sombart] 資料件数 4,283冊、481,452コマ(画像) [6]『ゾンバルト文庫』貴重資料画像データベース[Sombart] 資料件数22冊、5,800コマ(画像) [7]『近世大坂三郷古文書』画像データベース[Sango] 資料件数 約4,000通、約15,000コマ(画像) 森文庫マイクロフィルム画像データベース MIRS−システム構成 16mmカートリッジ 200本、最大100万コマ Sun Sparc Solaris 2.4 目録DB オート WWWサーバ CGI連携 検索エン ジン リーダ ストッカー FDIP6200 AS-10 近世資料アーカーイブズと Webによる提供 0次資料 古文書・ 古文献資料 2次資料 カラー マイクロフィルム デジタル 化 目録/全文 テキストデ ータベース 画像デー タベース CD-ROM 保存・デジタル化 1次資料 提供 他機関 Z39.50サーバ 検索エンジン OpenText5 目録 Z39.50 サーバ 独自検索 iLisSurf 統 合検索 Z39.50 Web Gateway 利 用 者 実現した”近世資料室” n n バーチャル書架と利用環境 n ウォークスルーとバーチャル書架(日本経済史資料) n 資料の注釈・研究成果の公開(日本経済史資料) n マウス指示による翻刻表示(伏見屋善兵衛文書) n ドキュメントの相互参照と動的リンク (大坂町触) n マイクロフィルムのon the fly検索(森文庫) Z39.50 標準による統合検索 n 目録、全文テキストのXML記述 n Z39.50ターゲット(サーバ) n Z39.50クライアント-Z39.50 Web Gateway Z39.50クライアント/ターゲット(GlobalFinder) とXML全文DB構成 他のZ39.50 サーバ PAT50 インデックス XML記述 全文テキスト/ 画像データベース Z39.50 Target サーバ CGIBIN HTTP 利用者 検索エンジン OpenText5.1 PAT50 Z39.50 Client Gateway 『日本経済史資料』の電子化内容 n 電子化への結論 n 記録・保存 カラーマイクロフィルム(30∼250年) n 提供 CD-ROM、JPEG圧縮形式 カラーマイクロフィルム化 ・対象 和書、627点、約20,000コマ ・カラーマイクロフィルム 35mmタイプR ・35mm用マイクロカメラ n 電子メディア化 n デジタル化編集作業 n 日本経済史資料画像データベースシステム構成 クラ WWW イアント Windows NT サ ーバ SunSparc Solaris2.6 CGI 制御 プログラム CD-ROM 制御 全文検索 WWWサーバ 目録DB CD-ROM 200枚収納 CD-ROM チェンジ ャー 大坂三郷文書とゾンバルト文庫データベース 化における主な特徴(H15開発) n n n JPEGからDjVuファイルへの変換 n 拡大・縮小表示や文字の可読性が保持されるため、 印刷にも適している。 n 高圧縮(700KBの2,300×2,000dpiのJPEGがDjVuで は、約400KBに)。一般的には、PDF・JPEGの1/5∼ 1/10のファイルサイズ n オープンソース (無料) DjVuLibre http://djvu.sourceforge.net/index.html n Web上でのDjVuファイルの一括変換 600MBのJPEGファイルを15分ぐらいで変換 ページ数の代わりに現在の画像のフレーム数を表示し、 指定のページにもジャンプできる。(ゾンバルト文庫) 一覧画面に該当の文書の丁数分のサムネイルを表示 する。(大坂三郷文書) 公開内容・方法の検討 n 古文献データベース作成委員会の設置 n 電子化の計画・内容などの検討 n 古文書等に記載された内容の検討 n 文、経済学部教員、学情教員、職員 n WWWによる利用約款の表示 利用目的、所属、氏名、E-Mailアドレスの 利用者による宣言、利用情報記録機能 n 今後の課題ー終わりにー n システムのバックアップとセキュリティ n n n データのバックアップと機器更新に伴うシステム移行 OSの脆弱性によるセキュリティ対策(パッチの更新) 画像フォーマットの問題(標準フォーマットの行方) 企業買収と画像フォーマット DjVu,MrSIDのLizardTech社を日本企業のセラーテ ムテクノロジー社が2003.6.20に買収した。 n VFZ,JPEG2000,MrSID,DjVu,LuraDocument,Gigaview MADO,PDFなど−特徴に合わせてどのフォーマットを 採用するか? n 安定した維持管理体制の確立 n 予算削減の問題 n 参考文献 柴山 守ほか “「日本経済史資料」のカラーマイクロ化と WWWによる画像検索システム” (学術情報総合センター紀要 Vol.1, pp.32-37,2000) n 柴山 守ほか “近世資料アーカイブズのためのバーチャル 図書館” (「人文科学とコンピュータシンポジウム」, pp.109-116 平成13年12月) n 柴山 守ほか “近世資料データベースとZ39.50標準による 統合検索” (学術情報総合センター紀要 Vol.3, pp.41-49,2002) n 大阪市立大学学術 j情報総合センター電子図書館パンフレット n
© Copyright 2024 Paperzz