ホワイトペーパー: PDFlib 製品群による PDF/A

ホワ イ ト ペーパー :
PDFlib 製品群に よ る PDF/A
ISO 19005 標準規格で記述 さ れている PDF/A 形式群は、長期間にわた っ て安全にアー
カ イ ブ し た り 、 企業や官庁の環境で確実なデー タ 交換に使用 し た り する こ と がで き
る よ う な、 PDF の一貫 し た堅牢なサブ セ ッ ト を提供する こ と を目指 し ています。 こ
のホワ イ ト ペーパーでは、 長期間の文書アー カ イ ブにたえ る PDF/A 出力を作成する
ための、 PDFlib の諸機能を説明 し ます。
PDF/A-1a と PDF/A-1b PDF/A-1 は、 正式には国際標準規格 ISO 19005-1 と し て、
電子文書の確実な長期保存を目的 と し てい ます。 こ の規格は、 PDF 1.4 をベース と し
て、 色やフ ォ ン ト ・ 注釈等の要素の使用に関 し てい く ら かの制限事項を設けた も の
です。 PDF/A-1 には次の 2 種類があ り 、 ど ち ら も PDFlib で作成 ・ 処理する こ と がで
き ます。
> ISO 19005-1 レベル B 準拠 (PDF/A-1b) は、文書の見た目が長期間を経て も 維持 さ
れ る こ と を保証す る も のです。 つま り PDF/A-1b は、 文書がいつか将来処理 さ れ
た時に、 同 じ 見え方をす る こ と を保証 し ます。
> ISO 19005-1 レベル A 準拠 (PDF/A-1a) は、 レベル B をベース と し つつ、 「 タ グ付
き PDF」 の厳格な要件を兼ねそなえ た も のです。 こ れは、 文書の論理構造 と 自然
な読み順を保持す る ために、 構造情報 と 、 正 し いテ キ ス ト セマ ン テ ィ ク ス を必要
と し ます。 つま り PDF/A-1a は、 文書が将来利用 さ れ る 時に同 じ 見え方をする こ
と を保証す る だけでな く 、 その内容 (セマ ン テ ィ ク ス) が確実に解釈 さ れ る こ と 、
そ し て障害を も つ利用者に と っ て ア ク セシブルであ る こ と を も 保証 し ます。
以下、 PDF/A と (準拠レベルを付けずに) 言っ た と き は、 両方の準拠レベルを指す
も の と し ます。 すべての PDFlib 製品の PDF/A 実装は、 ISO 19005-1 (2005 年) と 技
術正誤表 1 (2007 年) に基づいてい ます。
PDF/A の必須事項 と 制限事項 PDF/A では、 PDF のい く つかの機能を必須事項 と
し 、 ま たい く つかの特性を禁則事項に指定 し てい ま す。 た と えば、 テ キ ス ト の正確
な再現を保証す る ため、 文書内で使っ てい る フ ォ ン ト はすべて埋め込 ま な ければな
り ま せん し 、 色の正確な再現を保証す る ため、 色はすべてデバ イ ス非依存な形で指
定 し なければな り ません。 メ タ デー タ を XML 形式で埋め込む必要があ り ます し 、 暗
号化は使用 し てはな り ません。
し か し PDF/A では、 こ の よ う な単純明快な必要事項だけでな く 、 も っ と 目に見え
に く い部分の さ ま ざ ま な PDFの機能があわせて必須 と さ れていた り (フ ォ ン ト のデー
タ 構造内に特定の項目が必須等)、 あ る 種の好ま し か ら ざ る 構造が禁止 さ れていた り
し ます (TrueType フ ォ ン ト と エン コ ーデ ィ ン グの組み合わせ方等)。 こ う し た多 く の
要件 を 実装 し 試験 し て は じ め て、 ソ フ ト ウ ェ ア の開発者は、 規格に完全準拠 し た
PDF/A 製品を作 り 上げ る こ と がで き ます。 PDF/A と は、 単な る 「フ ォ ン ト を埋め込
んだ PDF」 をは る かに超え た存在なのです。
PDFlib 製品ス イ ー ト におけ る PDF/A 対応 PDFlib は、 ア プ リ ケーシ ョ ン開発者に
対 し て、PDF/A に関連 し た次の よ う な操作を可能にする ツールキ ッ ト を提供 し ます。
> PDF/A を ス ク ラ ッ チか ら 作成 (デー タ ベース内のテ キ ス ト を流 し 込む等)
> ラ ス タ 画像 (ス キ ャ ン等) を PDF/A に変換
> 既存の PDF/A 文書を処理 (PDF 文書の連結 ・ 分割等)
> 構造情報 ( タ グ付 き PDF) を持たせた PDF/A-1a を作成
PDFlib GmbH
2008 - 05
www.pdflib.com
1
こ れ ら の操作はすべて、 シ ンプルな PDFlib 関数呼び出 し で実装で き ます。 さ ま ざ ま
なプ ロ グ ラ ミ ン グ言語や開発環境に対す る サ ンプル コ ー ド が、 PDFlib のデ ィ ス ト リ
ビ ュ ーシ ョ ン と と も に提供 さ れてい ます。 PDF/A は、 グ ラ フ ィ ッ ク アー ト 業界のた
めの標準規格であ る PDF/X (ISO 15930) と の重な り がかな り 大き い こ と か ら 、PDFlib
におけ る PDF/A への対応にあ た っ ては、何年に も わた っ て さ ま ざ ま な種類の PDF/X
に対応 し つづけて き た当社の蓄積が活か さ れてい ます。
PDF/A 準拠の出力の作成 PDFlib に よ る PDF/A 準拠の出力の作成は、 次の手段で
実現 さ れます。
> PDFlib は、PDF バージ ョ ン番号や必須 XMP 準拠項目等、PDF/A のためのい く つか
の形式設定を自動的に遂行 し ます。
> PDFlib の ク ラ イ ア ン ト プ ロ グ ラ ムでは、 特定の関数呼び出 し と オプシ ョ ン (フ ォ
ン ト 埋め込み等の) を明示的に使用す る 必要があ り ます。
> PDFlib の ク ラ イ ア ン ト プ ロ グ ラ ムでは、特定の関数呼び出 し と オプシ ョ ン設定(暗
号化等) の使用を避け る 必要があ り ます。
PDFlib の ク ラ イ ア ン ト プ ロ グ ラ ムが こ れ ら の規則に従 う な ら ば、 有効な PDF/A 出力
が保証 さ れます。 PDFlib が PDF/A 作成規則に対す る 違反を検出 し た と き には、 例外
が発生す る ので、アプ リ ケーシ ョ ン側で処理す る 必要があ り ます。エ ラ ー時には PDF
出力は一切作成 さ れ ま せんので、 エ ラ ーが起 き た と き に非準拠の出力が作成 さ れ る
おそれは全 く あ り ません。 具体的な必須 ・ 禁則操作については PDFlib の説明書で説
明 し てい ます。
デバ イ ス非依存な色指定 一貫 し た色再現を維持す る ために、 PDF/A ではデバ イ ス
非依存な色の使用が必須で、 通常 こ れは ICC プ ロ フ ァ イ ルか CIE Lab 色指定で実現
さ れ ま す。 出力 イ ン テ ン ト を設定 し て文書の色特性を記述す る こ と も で き ま す。 こ
う し た概念はグ ラ フ ィ ッ ク アー ト 業界では常識ですが、 業務系の PDF 開発者は必ず
し も 、カ ラ ーマネジ メ ン ト の諸概念に通暁 し てい る と はかぎ り ません。そ こ で PDFlib
は、 入力デー タ の出所にかかわ ら ず、 デバ イ ス非依存な出力の作成を容易に し ます。
> PDF/A 出力を、出力 イ ン テ ン ト 内の ICC プ ロ フ ァ イ ルあ り で も な し で も 作成で き
ます。
> よ く あ る 場合の黒のテ キ ス ト に対 し ては、PDFlib は、出力 イ ン テ ン ト に対す る ICC
プ ロ フ ァ イ ル が 指 定 さ れ て い る か ど う か に 応 じ て、 適切 な 色空間 (Lab か
DeviceGray か) を自動的に選択 し ます。
> 外部 ICC プ ロ フ ァ イ ルや、 画像に埋め込まれたプ ロ フ ァ イ ルは、 精密な色制御を
可能に し ます。
> 代表的な運用類型のためのICCプ ロ フ ァ イ ルが、PDFlibのデ ィ ス ト リ ビ ュ ーシ ョ ン
と と も に提供 さ れてい る ので、有効な PDF/A 出力を迅速に実現する こ と がで き ま
す。
ラ ス タ 画像 (TIFF ・ JPEG 等) は、 文書作成の中で不可欠な役割を担い ます。 ス キ ャ
ン し た紙文書や、 デジ タ ルカ メ ラ の写真は、 文書作成 ワ ー ク フ ロ ーにおけ る 代表的
な ラ ス タ 画像です。 最近の ワ ー ク フ ロ ーでは、 ラ ス タ 画像デー タ はすでにデバ イ ス
非依存にな っ てい る か も し れないので (その手段 と し ては ICC カ ラ ープ ロ フ ァ イ ル
が埋め込まれてい る のが普通)、 その場合は PDF/A 互換ですが、 レ ガシ画像デー タ
はたいていはデバ イ ス依存で、 た と えば ICC プ ロ フ ァ イ ルのない白黒や RGB の ス
キ ャ ンであ っ た り し ます。 PDFlib は こ の ど ち ら の場合に も 対応 し ます。
> ラ ス タ 画像に埋め込まれた ICC プ ロ フ ァ イ ルは尊重 さ れます。
> 画像に外部 ICC プ ロ フ ァ イ ルを適用する こ と も で き ます。
> 出所の不明な レ ガシデー タ のための代替策 と し て、 PDFlib は、 多 く のハー ド ウ ェ
ア ・ ソ フ ト ウ ェ ア環境にマ ッ チす る sRGB プ ロ フ ァ イ ルを内蔵 し てい ます。
> 出力 イ ン テ ン ト に対 し てICCプ ロ フ ァ イ ルを指定すれば、画像にICCプ ロ フ ァ イ ル
を適用 し な く て も 、 デバ イ ス依存な画像デー タ が使え る よ う にな り ます。
PDFlib の説明書では、 代表的な運用類型におけ る PDF/A カ ラ ー戦略を説明 し てい ま
す。
2
www.pdflib.com
2008 - 05 PDFlib GmbH
XMP ら く ら く 作成 PDF/A では、 文書に関す る 情報を、 XMP メ タ デー タ を用いて
PDF 自体の中に記録 し てお く こ と が義務づけ ら れてい ます。 XMP と は、 標準やカ ス
タ ム のデー タ を記録す る ための強力かつ柔軟な フ レ ーム ワ ー ク を提供す る も のです
(XMP に関す る 別立ての当社ホ ワ イ ト ペーパー も ご ら ん く だ さ い)。すでに XMP メ タ
デー タ を ワ ー ク フ ロ ーで使っ てい る 人な ら 、 XMP ス ト リ ーム を ま る ご と 自分で作っ
て し ま っ て、 それを PDFlib で PDF/A 出力に入れ込ませ る と い う 手 も あ り ます。 し か
し XMP にな じ みのない開発者な ら 、 こ んな奥の深い分野に首を突っ込む必要はあ り
ません。 PDFlib は、 PDF/A と し て必要な XMP 出力を作成 し ます し 、 規格の義務づけ
る と お り に、 ク ラ シ ッ ク な文書情報フ ィ ール ド を、 それぞれ対応す る XMP 構文へ自
動的にマ ッ プ し ます。 こ う し た結果、 開発者が XMP の威力を徹底活用 し たい と 思え
ば存分にそれが可能な一方で、 メ タ デー タ 要件が単純な場合であれば PDFlib の自動
XMP 生成で事足 り る よ う にな っ てい る のです。
XMP 拡張スキーマ XMP は本質的に拡張可能です。 すなわち、 会社や業界独自の メ
タ デー タ 要請は、 XMP 拡張ス キーマ を構築 し て満たす こ と がで き ます。 PDF/A は こ
の概念に対応 し てい ま すが、 ただ し 将来の取得の便宜を図 る ため、 その ス キーマに
関す る 記述を機械読み取 り 可能な形で、 特定の規則に従っ て文書内に埋め込む こ と
を義務づけてい ます。 PDFlib 製品群は、 PDF/A のための XMP 拡張ス キーマに対応 し
てい ます(実際、PDFlib 7.0.3 は拡張ス キーマ対応を そなえた初の製品で し た)。PDFlib
は、 ユーザーが与え る XMP メ タ デー タ を、 拡張ス キーマ も 含めて検証 し て、 生成出
力が PDF/A 完全準拠にな る こ と を保証 し てい ます。
www.pdflib.com では、PDF/A におけ る XMP に関す る も っ と 詳 し い説明や、XMP 拡
張ス キーマのオン ラ イ ンバ リ デー タ が得 ら れます。
既存の PDF/A 文書 を処理 既存の PDF/A 準拠の文書か ら ページ を取 り 込む際には、
従 う べ き 規則が増え ます。 た と えば Adobe Acrobat では、 2 つの PDF/A 準拠の文書
を連結す る 際、 い と も 簡単に PDF/A 準拠でな く な っ た出力文書を作 り 出せて し ま い
ます (警告 も 一切出ません)。 既存の PDF/A 文書を扱 う 際には、 PDFlib+PDI はすべ
ての入力 ・ 出力文書の PDF/A 諸特性を注意深 く 調べて、 出力 も 確実に PDF/A 準拠
に し てい ま す。 さ ら に細か く 制御す る ため、 取 り 込み文書の出力 イ ン テ ン ト を出力
PDF へ コ ピー し て、 既存文書の PDF/A の色特性を引 き 継ぐ こ と も 可能です。
タ グ付 き PDF を持たせた PDF/A-1a を作成 PDF/A-1a は、 PDF/A-1b に タ グ付き
PDF を加え た も の と 考え る こ と がで き ます。 こ れは文書に対す る 構造情報を必須 と
し 、 ま た、 フ ォ ン ト に関 し て特定の条件を課 し て、 テ キ ス ト を適切に解釈で き る よ
う に し てい ます。 こ う し た結果、 PDF/A-1a 文書は身体障碍を持っ た利用者に と っ て
完全にア ク セシブルにな っ てい ます。 PDF/A-1a 文書は、 見た目だけでな く 中身の意
味を も 保持 し てい ます。
PDFlib の PDF/A-1a に対す る 対応は、 タ グ付 き PDF を作 り 出すための機能をベー
ス に し てい ま す。 そ こ には、 各内容ア イ テ ム を、 文書の構造ツ リ ー内のそれぞれ特
定の場所に位置付け る こ と がで き る 機能があ り ま す し 、 文書構造 と 関連 し ない内容
ア イ テ ム (ヘ ッ ダ ・ フ ッ タ や ノ ンブル等) については、 アーテ ィ フ ァ ク ト と し て、 す
なわちその文書の再利用時 (文書が ソ フ ト ウ ェ アで読み上げ ら れ る 時や、 何か他の
形式へ変換 さ れ る 時等) には無視 さ れ る も の と し て タ グ付け さ れ る 機能 も あ り ます。
代替テ キ ス ト を画像に付け る こ と がで き て、 そのテ キ ス ト は Acrobat に よ っ て、 目の
不自由な利用者のために読み上げ ら れます。
ただ し 、 タ グ付 き PDF を作 る ためには、 その文書の論理的な構造を詳 し く わか っ
てい る 必要があ り ます。 PDFlib は PDF に関連す る 詳 し い こ と は面倒を見ますが、 文
書の内容か ら その構造を推測す る こ と はで き ません。
タ グ付 き PDF への対応は、 PDFlib 6 か ら 導入 さ れてい ます。 PDFlib 7 では、 文書
の構造ツ リ ーに注釈を入れ込んで、 リ ン ク 等の イ ン タ ラ ク テ ィ ブ要素のア ク セシ ビ
リ テ ィ を向上 さ せ る こ と ので き る 機能が追加 さ れてい ます。
すでに タ グ付 き PDF に対応 し ていた こ と をベース と し て、 PDFlib 7 は、 PDF/A1a に準拠 し た出力を作 り 出す こ と がで き ます。 だか ら PDFlib は、 こ の高度な PDF/A
レベルに対応 し た初のツールにな っ たのです。
PDFlib GmbH
2008 - 05
www.pdflib.com
3
PDF/A を検証 標準規格に基づいた ワ ー ク フ ロ ーを実装す る 際には、 その出力結果
を規格にて ら し て検証す る ための ツールを投入す る こ と が得策です。 PDF/A 標準規
格についてはいろいろ な ソ フ ト ウ ェ ア ツールが入手可能で、 所与の PDF 文書が ISO
標準に準拠 し てい る か ど う かを検査す る こ と がで き ます。
PDFlib が作 り 出す PDF/A は、 Adobe Acrobat 8 のプ リ フ ラ イ ト ツールに実装 さ れ
てい る 検証規則に完全に準拠 し てい ます。 なお、 Acrobat 7 は PDF/A に関す る ISO 標
準規格の最終 リ リ ース よ り も 以前に発売 さ れたため、 その PDF/A 対応はい く つかの
点で PDF/A 標準規格を逸脱 し てお り 、 若干問題があ り ます。 ですので Acrobat 7 は、
PDF/A の検証には用い る べ き ではあ り ません。
PDFlib GmbH は、PDF/A 検証ツールの諸ベン ダー と ア ク テ ィ ブに協働 し て、PDF/A
標準規格に関す る 理解 と 解釈を確実に共有 し てい ます。
現時点で PDFlib GmbH は、 PDF/A 文書を検証す る ための製品や、 任意の PDF 文
書を PDF/A へ変換す る ための製品は提供 し てい ません。
PDFlib PLOP に よ る PDF/A 準拠文書の処理 PDFlib PLOP ・ PLOP DS 製品は、 い く
つかの PDF 処理機能を提供 し てい ますが、それ ら はすべて PDF/A 対応にな っ てい ま
す。 具体的には、 PDF/A 入力フ ァ イ ルを処理す る と 、 その処理が標準規格に準拠 し
た形で完遂で き た な ら ばPDF準拠の出力が生成 さ れ、そ う でなければエ ラ ー メ ッ セー
ジが出ます。 い く つか例を挙げます。
> PDF/A 文書を暗号化 し よ う と す る と 、 暗号化は PDF/A では許 さ れていないので、
エ ラ ー メ ッ セージが出ます。 PDF/A 文書を PLOP で暗号化する ためには、 明示的
に PDF/A 状態を代償にする 必要があ り ます。
> PLOP DS を使っ て PDF/A 文書に電子署名を適用す る と 、PDF/A 標準規格に準拠 し
た形で署名フ ィ ール ド が作成 さ れます。
> PLOP を使っ て、既存の PDF/A 文書に XMP メ タ デー タ を挿 し 込む こ と も で き ます。
PLOP 3.1 は、 PDF/A のための XMP 拡張ス キーマに対応 し てい る ので、 既存の文
書の後処理工程に使 う こ と も で き ます し 、 あ る いは文書をは じ めに作成す る ソ フ
ト が XMP 拡張ス キーマに対応 し ていない場合であ っ て も 、 こ れを使っ て XMP 拡
張ス キーマ を徹底活用す る こ と がで き ます。
PDF/A 技術セ ン タ ー PDFlib GmbH は PDF/A 技術セ ン タ ーの創立 メ ンバーの一員
です。 こ れは、 業界におけ る PDF/A の認知向上 と 、 ベン ダー間の互換性の確保を目
指す組織です。 当社では、 PDF/A の諸議題に関す る 技術 ノ ー ト を発行 し てい る 技術
作業部会に ア ク テ ィ ブに関わ り つつ、 PDF/A の た めの テ ス ト ス イ ー ト の作業 も 行
な っ てい ます。 詳 し く は www.pdfa.org を ご ら ん く だ さ い。
PDFlib GmbH
Franziska-Bilek-Weg 9
80339 München, Germany
電話 +49 • 89 • 452 33 84-0
[email protected]
www.pdflib.com
4
www.pdflib.com
2008 - 05 PDFlib GmbH