橡 貴重資料のディジタル化とWebベースによ

貴重資料のデジタル化とWebベースによる提供
平成15年10月23日(木)
第44回中国四国地区大学図書館研究集会
松山大学
大阪市立大学学術情報総合センター
平方善雄
はじめに
n 他大学、他機関の紹介
(1)MADO(Dream Technologies)
山口県文書館
岡山大学附属図書館
(2)Gigav
i
ew(PFU)
東北大学附属図書館
国際日本文化研究センター
(3)DjVu(LizardTech)
東京薬科大学情報センター
大正大学附属図書館
(4)LuraDocument(Algo Vision)
琉球大学附属図書館
(5)MrSID(LizardTech)
アメリカ合衆国議会図書館 パノラマ地図
島根県立図書館デジタルライブラリー
大阪市立大学における貴重資料データベース化の
取り組み
n
平成 8年度∼11年度 森文庫マイクロフィルム画像データベース
伏見屋善兵衛文書画像データベース
大坂町触全文テキストデータベース
n 平成12年度∼13年度
日本経済史資料画像データベースを含めて上記
4データベースのバーチャル図書館化(近世資料室)
n 平成14年度∼15年度
近世大坂三郷・近郊古文書画像データベース
ゾンバルト文庫データベースのバーチャル図書館化
経費と開発体制
経費
市費 47,700千円(H10∼H15)
科研費 26,300千円(H10∼H12,H14-15)
内訳
データ構築委託費(最も多い)
機器借上費、機器購入費
アルバイト費、開発委託費
n 開発体制
学情教員(開発リーダー)、職員(維持管理)
院生アルバイト(プログラム)、アルバイト(データ入力)
委託業者(プログラム、Webデザイン)
委託業者(マイクロ化、デジタル化)
n
データベース化貴重資料一覧
[1]『日本経済史資料』画像データベース[Jecoh] 資料件数 627種類、総2万丁、約20,000画像
[2]『伏見屋善兵衛文書』画像データベース[Fushimi]
資料件数 1259点、1,986画像
[3]『大坂町触』全文テキストデータベース[Ofure]
資料件数 御触、補触、口達等 10,708件
[4]『森文庫』マイクロフイルム画像データベース[Mori] 資料件数 2,259冊、297,177コマ(画像)
[5]『ゾンバルト文庫』マイクロフイルム画像データベース
[Sombart]
資料件数 4,283冊、481,452コマ(画像)
[6]『ゾンバルト文庫』貴重資料画像データベース[Sombart]
資料件数22冊、5,800コマ(画像)
[7]『近世大坂三郷古文書』画像データベース[Sango]
資料件数 約4,000通、約15,000コマ(画像)
森文庫マイクロフィルム画像データベース
MIRS−システム構成
16mmカートリッジ
200本、最大100万コマ
Sun Sparc
Solaris 2.4
目録DB
オート
WWWサーバ
CGI連携
検索エン
ジン
リーダ
ストッカー
FDIP6200
AS-10
近世資料アーカーイブズと
Webによる提供
0次資料
古文書・
古文献資料
2次資料
カラー
マイクロフィルム
デジタル
化
目録/全文
テキストデ
ータベース
画像デー
タベース
CD-ROM
保存・デジタル化
1次資料
提供
他機関
Z39.50サーバ
検索エンジン
OpenText5
目録
Z39.50
サーバ
独自検索
iLisSurf 統
合検索
Z39.50
Web
Gateway
利 用 者
実現した”近世資料室”
n
n
バーチャル書架と利用環境
n ウォークスルーとバーチャル書架(日本経済史資料)
n 資料の注釈・研究成果の公開(日本経済史資料)
n マウス指示による翻刻表示(伏見屋善兵衛文書)
n ドキュメントの相互参照と動的リンク
(大坂町触)
n マイクロフィルムのon the fly検索(森文庫)
Z39.50 標準による統合検索
n 目録、全文テキストのXML記述
n Z39.50ターゲット(サーバ)
n Z39.50クライアント-Z39.50 Web Gateway
Z39.50クライアント/ターゲット(GlobalFinder)
とXML全文DB構成
他のZ39.50
サーバ
PAT50
インデックス
XML記述
全文テキスト/
画像データベース
Z39.50
Target
サーバ
CGIBIN
HTTP
利用者
検索エンジン
OpenText5.1
PAT50
Z39.50
Client
Gateway
『日本経済史資料』の電子化内容
n
電子化への結論
n 記録・保存 カラーマイクロフィルム(30∼250年)
n 提供
CD-ROM、JPEG圧縮形式 カラーマイクロフィルム化
・対象 和書、627点、約20,000コマ
・カラーマイクロフィルム 35mmタイプR
・35mm用マイクロカメラ
n 電子メディア化
n デジタル化編集作業
n
日本経済史資料画像データベースシステム構成
クラ
WWW
イアント
Windows NT サ
ーバ
SunSparc
Solaris2.6
CGI 制御
プログラム
CD-ROM
制御
全文検索
WWWサーバ
目録DB
CD-ROM 200枚収納
CD-ROM
チェンジ
ャー
大坂三郷文書とゾンバルト文庫データベース
化における主な特徴(H15開発)
n
n
n
JPEGからDjVuファイルへの変換
n 拡大・縮小表示や文字の可読性が保持されるため、
印刷にも適している。
n 高圧縮(700KBの2,300×2,000dpiのJPEGがDjVuで
は、約400KBに)。一般的には、PDF・JPEGの1/5∼
1/10のファイルサイズ
n オープンソース
(無料)
DjVuLibre http://djvu.sourceforge.net/index.html
n Web上でのDjVuファイルの一括変換
600MBのJPEGファイルを15分ぐらいで変換
ページ数の代わりに現在の画像のフレーム数を表示し、
指定のページにもジャンプできる。(ゾンバルト文庫)
一覧画面に該当の文書の丁数分のサムネイルを表示
する。(大坂三郷文書)
公開内容・方法の検討
n
古文献データベース作成委員会の設置
n 電子化の計画・内容などの検討
n 古文書等に記載された内容の検討
n 文、経済学部教員、学情教員、職員
n
WWWによる利用約款の表示
利用目的、所属、氏名、E-Mailアドレスの
利用者による宣言、利用情報記録機能
n
今後の課題ー終わりにー
n
システムのバックアップとセキュリティ
n
n
n
データのバックアップと機器更新に伴うシステム移行
OSの脆弱性によるセキュリティ対策(パッチの更新)
画像フォーマットの問題(標準フォーマットの行方)
企業買収と画像フォーマット
DjVu,MrSIDのLizardTech社を日本企業のセラーテ
ムテクノロジー社が2003.6.20に買収した。 n VFZ,JPEG2000,MrSID,DjVu,LuraDocument,Gigaview
MADO,PDFなど−特徴に合わせてどのフォーマットを
採用するか?
n
安定した維持管理体制の確立
n 予算削減の問題
n
参考文献
柴山 守ほか “「日本経済史資料」のカラーマイクロ化と WWWによる画像検索システム”
(学術情報総合センター紀要 Vol.1, pp.32-37,2000)
n 柴山 守ほか “近世資料アーカイブズのためのバーチャル 図書館”
(「人文科学とコンピュータシンポジウム」, pp.109-116 平成13年12月)
n 柴山 守ほか “近世資料データベースとZ39.50標準による 統合検索” (学術情報総合センター紀要 Vol.3, pp.41-49,2002)
n 大阪市立大学学術
j情報総合センター電子図書館パンフレット
n