ARIB STD-B62 デジタル放送における マルチメディア符号化方式(第2世代) MULTIMEDIA CODING SPECIFICATION FOR DIGITAL BROADCASTING(2’ND GENERATION) 標 準 規 格 ARIB STANDARD ARIB STD-B62 1.0版 (第一分冊) 平成26年 7月31日 策 定 一般社団法人 電 波 産 業 会 Association of Radio Industries and Businesses ARIB STD-B62 まえがき 一般社団法人電波産業会は、無線機器製造者、電気通信事業者、放送機器製造者、放送事業者及 び利用者の参加を得て、各種の電波利用システムに関する無線設備の標準的な仕様等の基本的な要 件を「標準規格」として策定している。 「標準規格」は、周波数の有効利用及び他の利用者との混信の回避を図る目的から定められる国 の技術基準と、併せて無線設備、放送設備の適性品質、互換性の確保等、無線機器製造者、電気通 信事業者、放送機器製造者、放送事業者及び利用者の利便を図る目的から策定される民間の任意基 準を取りまとめて策定される民間の規格である。 本標準規格は、デジタル放送におけるマルチメディア符号化方式(第 2 世代)について策定され たもので、策定段階における公正性及び透明性を確保するため、内外無差別に広く無線機器製造者、 電気通信事業者、放送機器製造者、放送事業者及び利用者の利害関係者の参加を得た当会の規格会 議の総意により策定されたものである。 本標準規格が、無線機器製造者、電気通信事業者、放送機器製造者、放送事業者及び利用者に積 極的に活用されることを希望する。 注意: 本標準規格では、本標準規格に係る必須の工業所有権に関して特別の記述は行われていないが、 当該必須の工業所有権の権利所有者は、「本標準規格に係る工業所有権である別表1及び別表 2 に 掲げる権利は、別表1及び別表 2 に掲げる者の保有するところのものであるが、本標準規格を使用 する者に対し、別表1の場合には一切の権利主張をせず、無条件で当該別表 1 に掲げる権利の実施 を許諾し、別表 2 の場合には適切な条件の下に、非排他的かつ無差別に当該別表 2 に掲げる権利の 実施を許諾する。ただし、本標準規格を使用する者が本標準規格で規定する内容の全部又は一部が 対象となる必須の工業所有権を所有し、かつ、その権利を主張した場合、その者についてはこの限 りではない。」旨表明している。 また、他に関係する工業所有権が記載されていると考えられる一般社団法人 IPTV フォーラムの 技術仕様書の関係書類等も参照されたい。 ARIB STD-B62 別表 1 (第一号選択) (なし) 別表 2 (第二号選択) 特許出願人 発明の名称 出願番号等 ソニー株式会社 ARIB STD-B62 1.0 版について包括確認書を提出*1 シャープ株式会社 ARIB STD-B62 1.0 版について包括確認書を提出*1 *1:ARIB STD-B62 1.0 版について有効(平成 26 年 7 月 24 日受付) 備考 ARIB STD-B62 総 合 目 次 まえがき 第一編 データ符号化方式 第1部 第一分冊 マルチメディア符号化方式の想定する レファレンスモデル 第二編 第2部 モノメディア符号化 第3部 字幕・文字スーパーの符号化 マルチメディア符号化方式言語仕様 第二分冊 ARIB STD-B62 第一編 データ符号化方式 第一編 ARIB STD-B62 第1部 第一編 マルチメディア符号化方式の想定する レファレンスモデル 第1部 ARIB STD-B62 第一編 第1部 目次 第 1 章 一般事項............................................................................................................................. 3 1.1 目的 ...................................................................................................................................... 3 1.2 適用範囲 ............................................................................................................................... 3 1.3 参照文書 ............................................................................................................................... 3 1.3.1 準拠文書 ........................................................................................................................ 3 1.3.2 関連文書 ........................................................................................................................ 3 1.4 用語 ...................................................................................................................................... 3 1.4.1 定義................................................................................................................................ 3 1.4.2 略語................................................................................................................................ 4 第 2 章 システム............................................................................................................................. 5 第 3 章 プロトコル ......................................................................................................................... 7 第 4 章 マルチメディアアプリケーションのアプリケーションモデル .......................................... 9 第 5 章 受信機 ..............................................................................................................................10 5.1 受信機能・通信機能 ........................................................................................................... 10 5.2 提示機能 ............................................................................................................................. 11 5.3 デコード処理と表示 ........................................................................................................... 13 第 6 章 提示処理........................................................................................................................... 15 6.1 座標系と合成 ...................................................................................................................... 15 6.1.1 各プレーンの構成 ........................................................................................................ 15 6.1.2 プレーンとレイアウト設定 .......................................................................................... 15 6.2 カラリメトリ ...................................................................................................................... 17 6.2.1 色空間の整合 ............................................................................................................... 17 6.2.2 ITU-R 勧告 BT.709 の色空間から ITU-R 勧告 BT.2020 の色空間への変換 ................ 17 6.3 プレーン間合成 .................................................................................................................. 19 -1- ARIB STD-B62 第一編 第1部 <余 白> -2- ARIB STD-B62 第1章 1.1 第一編 第1部 一般事項 目的 本標準規格は、日本の標準方式として規定される高度広帯域衛星デジタル放送により行われるマ ルチメディア放送に関し、レファレンスモデルについて定める。 1.2 適用範囲 本標準規格は、高度広帯域衛星デジタル放送により行われるマルチメディア放送のうち、レファ レンスモデルについて適用する。 1.3 1.3.1 参照文書 準拠文書 以下の文書、勧告のうち、特定の版が指定されていない準拠文書はその最新版を用いる。特定の 版が指定されているものについては指定されている版を用いることとするが、本標準規格の使用者 は最新版の準拠文書の適用性について検討を行うことが望ましい。 [1] IPTVFJ STD-0010 1.3.2 「放送通信連携システム仕様」 関連文書 [1] ARIB STD-B10 「デジタル放送に使用する番組配列情報」 [2] ARIB STD-B24 「デジタル放送におけるデータ放送符号化方式と伝送方式」 [3] ARIB STD-B32 「デジタル放送における映像符号化、音声符号化及び多重化方式」 [4] ARIB STD-B60 「デジタル放送における MMT によるメディアトランスポート方式」 1.4 1.4.1 用語 定義 本標準規格において、以下の用語を定義する。 用語 論理座標 定義 提示処理における受信機デコーダモデル上の論理的な座標系。プレーンご とに存在する。 表示座標 ディスプレイに表示する際の座標系。 レファレンスモデル マルチメディア放送符号化方式と伝送方式の規定において、システム、プ ロトコル、受信機、提示処理等に関して標準として参照するモデル。 -3- ARIB STD-B62 第一編 第1部 αブレンディング α値によって透過度が制御される画像のミキシング。 カラリメトリ 色再現に関する規定。 プレーン モノメディアやマルチメディアを表示するための表示画面。 モノメディア 映像、音声、文字、静止画など単独の表現メディア。 字幕 テレビジョン放送における映像内容と関連した情報を提供する文字情報 によるサービス。映像に重ねてスーパーすることがある。 文字スーパー 主たる映像、音声、データと非同期な字幕サービス。速報ニュース、編成 ことわり、警報、時報など。 リアルタイム提示要素 復号再生時に時間管理を要するモノメディア。映像、音声、字幕、文字ス ーパーが該当する。 1.4.2 略語 AAC Advanced Audio Coding AIT Application Information Table ALS Audio Lossless Coding HEVC High Efficiency Video Coding HTTP Hyper Text Transfer Protocol MMT MPEG Media Transport MPEG-DASH MPEG Dynamic Adaptive Streaming over HTTP NTP Network Time Protocol RTP Real-time Transport Protocol TMCC Transmission and Multiplexing Configuration and Control TTML Timed Text Markup Language TTS Time stamped TS UHDTV Ultra High Definition TV -4- ARIB STD-B62 第2章 第一編 第1部 システム マルチメディア放送サービスを行うためには、送信から受信までのいくつかのインターフェース を規定する必要がある。また、伝送されてくるデータを受信し送信側の意図通りに視聴者がサービ スを享受するためには、受信機の規定も必要となる。以上の観点から、本章では高度広帯域衛星デ ジタル放送により行われるマルチメディア放送に関するシステム全体のレファレンスモデルを規定 する。 本標準規格では、データ伝送プロトコルとして MPEG-2 TS を用いるものと MMT を用いるもの の 2 種類を規定する。高度広帯域衛星デジタル放送におけるマルチメディア放送サービスを実現す るシステムについて、図 2-1 註) にその構成を示す。 図中の「配信ネットワーク」は、多重化された信号を MMT によって配信する場合に利用さ れる。破線の「通信ネットワーク」は、受信機側からの要求により映像、音声、静止画等の モノメディアの取得や字幕データの取得、マルチメディアアプリケーションの取得やサーバ ーでの処理依頼を表すものである。 図 2-1 図 2-1 システムの構成 におけるシステムの構成要素は、以下の規定による。 -5- ARIB STD-B62 第1部 第一編 ① モノメディア符号化方式 マルチメディアサービスで用いられる映像、音声、文字、図形等の符号化方式を規定する。 ② 字幕・文字スーパー符号化方式 字幕と文字スーパーに関する符号化方式を規定する。 ③ マルチメディア符号化方式 マルチメディアアプリケーションを記述するための符号化方式を規定する。IPTV フォーラム で規定されている Hybridcast 技術仕様との互換性を留意したものとして、本標準規格第二編 にて規定される。 ④ データ伝送方式 マルチメディアアプリケーションやその制御信号を伝送するための伝送方式を規定する。 ⑤ 字幕・文字スーパー伝送方式 字幕・文字スーパーを伝送するための伝送方式を規定する。 上記構成要素は、表 2-1 に示す標準規格によって規定される。 表 2-1 本システムの構成要素を規定する標準規格 構成要素 MPEG-2 TS 方式の場合 MMT 方式の場合 ① モノメディア符号化方式 STD-B62 第一編 第2部 ② 字幕・文字スーパー符号化方式 STD-B62 第一編 第3部 STD-B62 ③ マルチメディア符号化方式 第二編 ④ アプリケーション伝送方式 STD-B24 第三編(予定) STD-B60 第 10 章 ⑤ 字幕・文字スーパー伝送方式 STD-B24 第三編(予定) STD-B60 第9章 -6- ARIB STD-B62 第3章 第一編 第1部 プロトコル 本標準規格によって規定されるマルチメディア放送システムでは、サービスされる映像・音声・ 各種データは STD-B32、STD-B24、STD-B10 によって規定される MPEG-2 TS 方式または STD-B60 によって規定される MMT 方式によって多重伝送される。図 3-1 、図 3-2 にそれぞれ のプロトコルスタックを示す。また、MPEG-2 TS、MMT 両方式に共通な通信関連のプロトコルス タックを図 3-3 に示す。 図 3-1 MPEG-2 TS 方式のプロトコルスタック 図 3-2 MMT 方式のプロトコルスタック -7- ARIB STD-B62 第一編 図 3-3 図 3-1 から図 3-3 第1部 MPEG-2 TS/MMT 共通の通信プロトコルスタック の構成要素のうち、アスタリスクがついているものが本標準規格によって 規定される部分である。その他の部分については、他の ARIB 標準規格による規定または典型的な 方式を用いた場合の例示である。 通信で用いるプロトコルについては、図に含まれるものに限定するものではない。受信機の実装 によっては他のプロトコルを利用することも可能である。 -8- ARIB STD-B62 第4章 第一編 第1部 マルチメディアアプリケーションのアプリケーションモデル IPTV フォーラムで策定された、IPTVFJ STD-0010「放送通信連携システム仕様」で定められる アプリケーションモデルを適用する。 -9- ARIB STD-B62 第一編 第1部 第5章 受信機 さまざまな実装による受信機においてもマルチメディアサービスを受信、提示を可能とするため、 受信機の基本的な機能について規定する。マルチメディアサービスの受信、提示が可能な受信機は、 通常の TV 番組の視聴機能に加えて、マルチメディア放送サービスの受信、提示、蓄積、通信など の機能を付加する。これによって視聴者がマルチメディアサービスを享受することが可能になる。 また、本標準規格の規定に基づくマルチメディアサービスの受信、提示が可能な受信機は、IPTV フォーラムで策定された Hybridcast 技術仕様に対応する受信機の機能との最大限の互換性確保を 想定する。 5.1 受信機能・通信機能 本標準規格に規定するマルチメディアサービスの受信、提示が可能な受信機は、第 3 章 で規定 する 2 種のプロトコルスタックのうち、1 つ以上のプロトコルスタックに基づく放送受信機能、通 信機能を有する必要がある。MPEG-2 TS 方式に対応した受信機の構成例を図 5-1 式に対応した受信機の構成例を図 5-2 に示す。図中のプロトコル名は、主としてそのプロトコル を用いてデータの取得、伝送を行うことを想定していることを示す。 図 5-1 に、MMT 方 MPEG-2 TS 方式に対応した受信機の構成例 -10- ARIB STD-B62 図 5-2 第一編 第1部 MMT 方式に対応した受信機の構成例 放送局より送出された放送信号は、TS デコーダまたは MMT デコーダに入力される。MMT 方式 対応受信機では、MMT デコーダで処理される信号には通信路によって伝送される放送信号または その一部が含まれる。TS デコーダ、MMT デコーダは受信した信号中の制御信号によってリアルタ イム提示要素を映像、音声、字幕、文字スーパーのデコーダにデータを引き渡し、それぞれの復号 動作を行う。 マルチメディアアプリケーションやその構成要素であるファイルは、TS デコーダ、MMT デコー ダによってファイルとして再生される。キャッシュ(一時ファイルシステム)に蓄積される。マルチ メディアアプリケーションを実行するブラウザは、放送信号中または HTTP を使って通信によって 取得されるアプリケーション制御情報の指示に従い、キャッシュ(一時ファイルシステム)または通 信によってサーバーからマルチメディアアプリケーションやその構成要素のファイルを取得して提 示を行う。 汎用データは、映像音声字幕以外のデータの提示を行うプレーヤーで利用するデータもしくはl アプリケーションに対するデータのストリーミングに用いることができる。 5.2 提示機能 マルチメディアサービスを受信機上で意図通り動作させ、表示を行うためには、受信機が最低限 装備しなくてはならない表示・再生機能を規定する必要がある。このため、受信機が備える論理的 なプレーン構造を図 5-3 に示す。 -11- ARIB STD-B62 第一編 第1部 図 5-3 受信機の論理プレーン構造 各プレーンは下記の表示を行う。 (1) 文字スーパープレーン 文字スーパーの表示を行うプレーンである。表示系の最前面に位置し、図 5-1 、図 5-2 の文 字スーパーデコーダの出力が描画される。 (2) 字幕プレーン 字幕の表示を行うプレーンである。文字スーパープレーンの背後かつマルチメディアプレーンの 前面に位置し、図 5-1 (3) 、図 5-2 の字幕デコーダの出力が描画される。 マルチメディアプレーン 放送映像などのモノメディア単体またはマルチメディアアプリケーションの合成表示が行われ るプレーンである。本プレーンにおける図形や映像の重ね合わせは本標準規格第二編で規定され るマルチメディア符号化方式によって符号化されたマルチメディアアプリケーションによって 制御される。本プレーンは字幕プレーンの背後かつ背景プレーンの前面に位置する。受信機が備 える、図 5-1 、図 5-2 の映像デコーダの数に応じて本プレーンは複数備えることができるが、 -12- ARIB STD-B62 マルチメディアアプリケーションを実行する処理部である図 5-1 、図 5-2 第一編 第1部 のブラウザの出力 は最前面のマルチメディアプレーンに対してのみ行われる。 背景プレーン (4) 背景色を表示するプレーンである。最背面に位置し、その手前に位置するプレーンが全て透明な いしは表示が行われていない部分に対して、指定された色で塗りつぶされた本プレーンが表示さ れる。 5.3 デコード処理と表示 受信機における復号と提示処理について、データの流れとその出力の関係を図 5-4 図 5-4 データの流れからみた受信機デコーダモデル -13- に示す。 ARIB STD-B62 (1) 第一編 第1部 伝送データ復号処理 受信機へ伝送されてきたデータは、トランスポート処理によって伝送データ復号処理が行われる。 これは、ストリーム系データ(UHDTV や HDTV の映像、音声、字幕等)やファイル系データ(静 止画や文字、図形等)を受信した信号より分離し、それぞれを復号するデコーダに引き渡す。放 送で伝送されるもの(MMT 方式に対応する受信機の場合は通信によって送られるものを含む)、 通信で伝送されるもの(主としてプル型で受信機が取得を始めるもので、UHDTV や HDTV の映 像、音声などのストリームも含む)それぞれのプロトコルスタックに応じた伝送データの復号処 理が行われる。 (2) モノメディア復号処理 映像、音声、静止画等のモノメディアデータはトランスポート処理よりそれぞれのモノメディア デコーダへ引き渡され復号される。マルチメディアプレーンへ出力するモノメディアデコーダは、 プレーンへの出力の際に必要に応じて色域変換を行い、各々のモノメディアの色空間を整合させ る。 (3) 提示処理 各プレーンに出力されたモノメディア復号データは、それぞれの大きさ、位置などの制御を受け、 合成される。合成に先立って、提示される要素の色空間を整合させる必要があるが、マルチメデ ィアプレーンへ出力されるデータはプレーンへの出力段階で整合されている。一方、字幕、文字 スーパーの両者は同一の色空間を用いるので、字幕プレーン、文字スーパープレーンを合成後に 色域変換を行い、マルチメディアプレーンと色空間を整合させる。 MMT 方式対応の受信機の場合、MMT の伝送データ中のレイアウト制御テーブル(Layout Configuration Table)によって指定された色による塗りつぶしが背景プレーンに描画され、合成 される。 -14- ARIB STD-B62 第6章 第一編 第1部 提示処理 本章では、提示処理に関するモデルを規定する。 6.1 6.1.1 座標系と合成 各プレーンの構成 モノメディアデコーダが出力を行う論理プレーンである文字スーパープレーン、字幕プレーン、 マルチメディアプレーン、背景プレーンは、表 6-1 に示す論理プレーン構造を持つ。 表 6-1 各プレーンの構造 プレーン 文字スーパープレーン 規定範囲 7680×4320 RGB 各 8 ビット*1 256 段階のαブレンディング 字幕プレーン 7680×4320 RGB 各 8 ビット*1 256 段階のαブレンディング マルチメディアプレーン 7680×4320 RGB 各 10/8 ビット*2 プレーン内のグラフィクス要素は 256 段階のαブレンデ ィング可能 背景プレーン *1 7680×4320 RGB 各 8 ビット*1 ITU-R 勧告 BT.2020 が規定する色空間を RGB 各 8 ビットで表わしたもの。10 ビット のうち上位 8 ビットを用いる。 *2 ITU-R 勧告 BT.2020 が規定する色空間をそのまま用いて出力されるモノメディアデコ ーダに対してはそのままで扱い、それと異なる場合には同じ色空間を RGB 各 8 ビット (10 ビットのうち上位 8 ビットを用いる)で表す。 各プレーンの座標値は、それぞれのプレーンにおけるプレーン内の論理座標値である。左上角を (0, 0)とし、右下角を(7679, 4319)とする。また、モノメディア信号中で解像度が指定された場合、 その解像度を上記座標に変換してプレーン内の描画を行う。例えば、3840×2160 の解像度が指定 された場合、右下角に相当する(3839, 2159)は(7679, 4319)に変換する。 6.1.2 プレーンとレイアウト設定 MMT 方式に対応する受信機の場合、MMT の伝送データ中のレイアウト設定テーブル(Layout Configuration Table)に対しては、各プレーンは以下の動作を行う。 -15- ARIB STD-B62 (1) 第一編 第1部 マルチメディアプレーン レイアウト設定テーブルによってマルチメディアアプリケーションまたは映像のアセットが 領域に指定された場合、指定されたアセットを提示するマルチメディアプレーンを指定された 領域に合致するよう大きさと位置を変更する。この場合のプレーン内の座標系は変わらない。 マルチメディアアプリケーションの実行中に放送映像のアセットが指定領域内のアセットと して指定された場合には、マルチメディアアプリケーションの実行と当該プレーンに対するマ ルチメディアアプリケーションの提示は継続される。また、マルチメディアアプリケーション のアセットが指定された場合、マルチメディアアプリケーションから参照されている他のアセ ットを含めてマルチメディアアプリケーションの指示通りに指定された領域への縮小表示を 行う。この例を図 6-1 に示す。(a)のレイアウト設定が指定されていないときには物理座標とマ ルチメディアプレーンのプレーン内座標は一致しているが、(b)のレイアウト設定テーブルによ って右側と下側 1/4 を除いた領域が指定され、その領域にマルチメディアアプリケーションの アセットが指定された場合にはプレーン内座標の右下角(7679, 4319)は物理座標の(5759, 3239)に変換され、縦横ともに 3/4 の大きさに縮小された状態でマルチメディアアプリケーショ ンが提示される。 Ph:(0,0) Pl: (0,0) Ph:(0,0) Pl: (0,0) Ph: 物理座標 Pl: プレーン内座標 マルチメディア マルチメディア アプリケーション アプリケーション Ph: (7679, 4319) Pl: (7679, 4319) Ph: (7679, 4319) Ph: (5759,3239) Pl: (7679, 4319) (b) 右、下各 1/4 の領域を除い た領域にマルチメディア アプリケーションが指定 された場合 (a) レイアウト設定が 指定されない場合 図 6-1 (2) MMT のレイアウト設定テーブルによるマルチメディアプレーンの動作例 文字スーパー、字幕プレーン 文字スーパー、字幕の両プレーンは、レイアウト設定テーブルによる領域指定が行われた場合、 プレーンの大きさ、位置は変わらないが、描画は指定された領域でクリッピングされる。この 例を図 6-2 に示す。(a)のレイアウト設定が指定されていないときには画面の下側に 3 行の字幕 が表示されているが、(b)のレイアウト設定テーブルによって下側 1/4 に字幕の領域が指定され、 -16- ARIB STD-B62 第一編 第1部 その領域に字幕のアセットが指定された場合には、字幕プレーンの論理座標の上 3/4 である (0,0)から(7679, 3239)の領域はプレーン内で描画されず、結果として字幕は最下行だけが提示 される。 Ph: 物理座標 Pl: プレーン内座標 Ph:(0,0) Pl: (0,0) Pl:(0,3239) あいうえお かきくけこ さしすせそ Ph:(0,0) さしすせそ Ph: (7679, 4319) Pl: (7679, 4319) Ph: (7679, 4319) Pl: (7679, 4319) (a) レイアウト設定が 指定されない場合 図 6-2 (b) 下 1/4 の領域に字幕が指定 された場合 MMT のレイアウト設定テーブルによる字幕プレーンの動作例 カラリメトリ 6.2 6.2.1 色空間の整合 UHDTV 映像は ITU-R 勧告 BT.2020 で規定される色空間を用いる。一方、マルチメディアアプ リケーションは ITU-R 勧告 BT.709 に規定される色空間を用いる HDTV 映像を同時に提示する場 合がある。また、グラフィクスも同時に用いる場合がある。このため、各種提示要素の合成のため に色域を合せる必要がある。 6.2.2 ITU-R 勧告 BT.709 の色空間から ITU-R 勧告 BT.2020 の色空間への変換 図 6-3 に ITU-R 勧告 BT.709 の色域から ITU-R 勧告 BT.2020 の色域へ変換する場合の変換の過 程を示す。このうち、DQ、M1 および M3、Q の段階は、Y’C’BC’R と R’G’B’の間の変換であり、受 信機の実装に応じて用いる。 E′RE′GE′B E′YE′CBE′CR D′YD′CBD′CR DQ 709 EREGEB E′RE′GE′B 2020 2020 M2 M1 709 図 6-3 EREGEB 709 709 E′YE′CBE′CR M3 D′YD′CBD′CR Q 2020 ITU-R 勧告 BT.709 の色空間から ITU-R 勧告 BT.2020 の色空間への変換過程 -17- 2020 ARIB STD-B62 第一編 第1部 各段階の変換式を図 6-4 に示す。 DQ ECR (勧告 BT.709)への逆量子化(N ビット) DCR (勧告 BT.709)から EY ECB DY DCB EY DY / 2 N 8 16 219 DCB / 2 N 8 128 224 ECB DCR / 2 N 8 128 224 ECR M1 E CR (勧告 BT.709)から E R EG E B (勧告 BT.709)への変換 EY E CB 0 1.5747 EY ER 1 EG 1 0.1873 0.4682 ECB EB 1 1.8556 0 ECR E R EG E B (勧告 BT.709)から E R EG E B (勧告 BT.709)への EOTF E / 4.5 ( E 0.08145) E E 0.0993 1/0.45 (0.08145 E) 1.0993 M2 EREGEB (勧告 BT.709)から EREGEB (勧告 BT.2020)への変換 1 ER 0.6370 0.1446 0.1689 0.4124 0.3576 0.1805 ER 0.2627 0.6780 0.0593 0.2126 0.7152 0.0722 EG EG EB 0 0.0281 1.0610 0.0193 0.1192 0.9505 EB 709 2020 1.7167 0.3557 0.2534 0.4124 0.3576 0.1805 ER 0.0158 0.2126 0.7152 0.0722 EG 0.6667 1.6165 0.0176 0.0428 0.9421 0.0193 0.1192 0.9505 EB 709 0.6274 0.3293 0.0433 ER 0.0691 0.9195 0.0114 EG 0.0164 0.0880 0.8956 EB 709 -18- ARIB STD-B62 第一編 第1部 ER EG EB (勧告 BT.2020)から E R EG E B (勧告 BT.2020)への OETF(ガンマ補正) 4.5E , E 0.0181 E 0.45 1.0993E 0.0993, 0.0181 E M3 ECR (勧告 BT.2020)への変換 E R EG E B (勧告 BT.2020)から EY ECB 0.6780 0.0593 ER EY 0.2627 ECB 0.1396 0.3604 0.5000 EG ECR 0.5000 0.4598 0.0402 EB Q DCR (勧告 BT.2020)への量子化(N ビット) ECR (勧告 BT.2020)から DY DCB EY ECB DY INT 219 EY 16 2 N 8 INT 224 ECB 128 2 N 8 DCB INT 224 ECR 128 2N 8 DCR 図 6-4 6.3 ITU-R 勧告 BT.709 の色空間から ITU-R 勧告 BT.2020 の色空間への変換 プレーン間合成 6.1.1 節で規定する通り、背景プレーンを除く各プレーン間では 256 段階のαブレンディングが 可能である。ただし、受信機はマルチメディアプレーンに配置される映像(動画像)に対してはαブ レンディングを行わなくてよい。 -19- ARIB STD-B62 第一編 第1部 <余 白> -20- ARIB STD-B62 第2部 モノメディア符号化 第一編 第2部 ARIB STD-B62 第一編 第2部 目次 第 1 章 一般事項........................................................................................................................... 23 1.1 目的 .................................................................................................................................... 23 1.2 適用範囲 .............................................................................................................................23 1.3 参照文書 .............................................................................................................................23 1.3.1 準拠文書 ...................................................................................................................... 23 1.4 用語 .................................................................................................................................... 24 1.4.1 定義..............................................................................................................................24 1.4.2 略語..............................................................................................................................24 第 2 章 映像符号化 ....................................................................................................................... 25 2.1 MPEG-2 VIDEO................................................................................................................. 25 2.2 H.264|MPEG-4 AVC ......................................................................................................... 25 2.3 H.265|HEVC ..................................................................................................................... 25 第 3 章 静止画及び図形符号化 ..................................................................................................... 26 3.1 JPEG .................................................................................................................................. 26 3.2 PNG .................................................................................................................................... 26 3.3 MNG ................................................................................................................................... 26 3.3.1 MNG の制限事項 ......................................................................................................... 26 3.3.2 使用可能なチャンク .................................................................................................... 26 3.3.2.1 MHDR ................................................................................................................... 26 3.3.2.2 MEND ................................................................................................................... 27 3.3.2.3 PLTE Global palette ............................................................................................. 27 3.3.2.4 tRNS Global transparency ................................................................................... 27 3.3.2.5 IHDR, PNG chunks, IEND .................................................................................. 27 3.3.2.6 TERM .................................................................................................................... 27 3.3.2.7 FRAM .................................................................................................................... 28 3.3.2.8 DEFI ...................................................................................................................... 28 3.4 GIF ..................................................................................................................................... 29 3.5 SVG .................................................................................................................................... 29 第 4 章 音声符号化 ....................................................................................................................... 30 4.1 MPEG-2 AAC ..................................................................................................................... 30 4.2 MPEG-4 AAC ..................................................................................................................... 30 4.3 MPEG-4 ALS ...................................................................................................................... 30 4.4 PCM (AIFF-C) .................................................................................................................... 30 -21- ARIB STD-B62 第一編 第2部 4.5 MP3 .................................................................................................................................... 30 第 5 章 文字符号化 ....................................................................................................................... 31 5.1 文字符号体系 ...................................................................................................................... 31 5.2 レパートリ ......................................................................................................................... 31 5.3 制御機能の符号化............................................................................................................... 31 5.4 符号化................................................................................................................................. 31 5.5 外字の符号化 ...................................................................................................................... 31 解説 1 UCS の非サロゲート運用 .................................................................................................. 52 -22- ARIB STD-B62 第1章 1.1 第一編 第2部 一般事項 目的 本標準規格は、日本の標準方式として規定されるデジタル放送における第 2 世代マルチメディア 符号化方式に関し、モノメディアの符号化について定める。 1.2 適用範囲 本標準規格は、高度広帯域衛星デジタル放送で用いられるマルチメディア符号化方式のうち、モ ノメディアの符号化について適用する。 1.3 1.3.1 参照文書 準拠文書 以下の文書、勧告のうち、特定の版が指定されていない準拠文書はその最新版を用いる。特定の 版が指定されているものについては指定されている版を用いることとするが、本標準規格の使用者 は最新版の準拠文書の適用性について検討を行うことが望ましい。 [1] ARIB STD-B32「デジタル放送における映像符号化、音声符号化及び多重化方式」第 1 部、 第2部 [2] ISO/IEC 11172-3:1993 “Information technology -- Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio” [3] ISO/IEC 10646:2012 “Information technology -- Universal Coded Character Set (UCS)” [4] JIS X0201:1997「7 ビット及び 8 ビットの情報交換用符号化文字集合」 [5] JIS X0213:2000「7 ビット及び 8 ビットの 2 バイト情報交換用符号化拡張漢字集合」 [6] JIS X0213:2000/Amendment 1:2004「7 ビット及び 8 ビットの 2 バイト情報交換用符号化拡 張漢字集合(追補 1)」1 [7] “Scalable Vector Graphics (SVG) 1.1 (Second Edition)”, W3C Recommendation, 16 August 2011 [8] “WOFF File Format 1.0”, W3C Recommendation, 13 December 2012 [9] ISO/IEC 10918-1:1994 | Recommendation ITU-T T.81, “Information technology -- Digital compression and coding of continuous-tone still images: Requirements and guidelines” [10] Portable Network Graphics (PNG) specification (Second Edition), W3C Recommendation, 10 November 2003 [11] “GRAPHICS INTERCHANGE FORMAT Version 89a”, CompuServe Inc. 1 [6] を適用した[5] を JIS X0213:2004 と総称する。 -23- ARIB STD-B62 第一編 第2部 [12] MNG (Multiple-image Network Graphics) Format Version 1.0, W3C Memo, 31 January 2001 [13] DAVIC 1.4.1 Specification Part 9, “Information Representation”, Annex B, “Coding of Linear Audio” 1.4 用語 定義 1.4.1 本標準規格において、以下の用語を定義する。 用語 モノメディア 定義 動画、静止画、図形、音声、文字など単独の表現メディア。他のメディアを参 照することなく、自己のデータのみで提示可能な表現メディア。 チャンク PNG 符号化、MNG 符号化においてデータの塊を表す構造の総称。 付加音 電子音等による音楽再生を行う表現メディア。再生される音楽データは受信機 に内蔵又は他の装置によって与えられる。 1.4.2 略語 AAC Advanced Audio Coding AIFF Audio Interchanger File Format ALS Audio Lossless Coding AVC Advanced Video Coding GIF Graphics Interchange Format HEVC High Efficiency Video Coding ISO International Organization for Standardization ITU International Telecommunication Union JIS Japan Industrial Standard JPEG Joint Photographic Experts Group MNG Multiple image Network Graphics MPEG Motion Picture Experts Group PCM Pulse Code Modulation PNG Portable Network Graphics W3C World Wide Web Consortium UCS Universal multiple-octet coded Character Set WOFF Web Open Font Format -24- ARIB STD-B62 第2章 2.1 第一編 第2部 映像符号化 MPEG-2 VIDEO MPEG-2 による映像符号化は、STD-B32 第 1 部 5.1.1 節に規定される方式を用いる。低解像度 を用いる場合には STD-B32 第 1 部 5.2.1 節に規定される方式を用いる。 2.2 H.264|MPEG-4 AVC H.264|MPEG-4 AVC による映像符号化は、STD-B32 第 1 部 5.1.2 節に規定される方式を用い る。低解像度を用いる場合には STD-B32 第 1 部 5.2.2 節に規定される方式を用いる。 2.3 H.265|HEVC H.265|HEVC による映像符号化は、STD-B32 第 1 部 5.1.3 節に規定される方式を用いる。 -25- ARIB STD-B62 第一編 第2部 第3章 3.1 静止画及び図形符号化 JPEG JPEG によるビットマップ符号化は、ISO/IEC10918-1:1994 に示される方式を用いる。 3.2 PNG PNG(Portable Network Graphics)によるビットマップ符号化は、W3C の規格「Portable Network Graphics(PNG) Specification (Second Edition) W3C Recommendation 10 November 2003」を用いる。 3.3 MNG MNG(Multiple-image Network Graphics)によるアニメーショングラフィックスのファイルフォ ーマットは、MNG Format Version 1.0(Released 31 January 2001)に基づいた仕様を用いる。 MNG の制限事項 3.3.1 MNG の運用においては、以下の規定に従うこと。 MNG ファイルに複数の PNG 画像が含まれ、それを順次表示する方式のみ可能とする。 オブジェクトは Object_id=0 のオブジェクトのみ使用可能とする。 フレーム書き換え規則は、以下の 3 つを可能とする。 (1) 前フレームの Framing_mode を使用する。(Framing_mode=0) (2) 1 フレーム時間毎に 1 枚ずつ PNG 画像を単純に上書きする。(Framing_mode=1) (3) 1 フレーム時間毎に、背景を透明色で消去してから 1 枚ずつ PNG 画像を表示する。 (Framing_mode=3) アニメーションの繰り返し処理は、以下の 2 つのみを可能とする。 (1) 最後に表示した PNG 画像を表示し続ける。(デフォルト) (2) ファイルの先頭から全体を指定回数繰り返す。(Termination_action=3) 3.3.2 使用可能なチャンク 本節では使用可能なチャンクを定義し、各フィールドの値が制限される場合は、制限事項を併せ て示す。 3.3.2.1 MHDR 先頭に1つだけ必ず存在する。フィールドは 28 バイト固定とする。 -26- ARIB STD-B62 フィールド バイト数 意味 第一編 制限 Frame_width 4 フレーム幅 Frame_height 4 フレーム高 Ticks_per_second 4 フレーム間時間の単位時間 0 以外 Nominal_layer_count 4 レイヤー数 0 に固定 Nominal_frame_count 4 フレーム数 0 に固定 Nominal_play_time 4 再生時間 0 に固定 Simplicity_profile 4 ファイルのプロファイル情報 0 に固定 3.3.2.2 第2部 MEND 最後に1つだけ必ず存在する。フィールドは持たない。 3.3.2.3 PLTE Global palette 省略可能。最初の IHDR チャンクの出現前に1つのみ存在可能とする。MNG に含まれる、空の PLTE チャンクを持つインデックスカラーの PNG 画像は本 PLTE チャンクを参照する。省略する 場合には、MNG 中に含まれるインデックスカラーの PNG 画像は、全て個別の PLTE チャンクを 持つこと。 3.3.2.4 tRNS Global transparency 省略可能。Global PLTE チャンクが存在する場合にのみ最初の IHDR チャンクの出現前に1つ のみ存在可能とする。MNG に含まれる、Global PLTE チャンクを参照するインデックスカラーの PNG 画像は各色のアルファ値として本 tRNS チャンクを参照する。 3.3.2.5 IHDR, PNG chunks, IEND 3.2 節で規定される PNG 画像と同じものとする。 3.3.2.6 TERM 省略可能。存在する場合は MHDR チャンクの直後に1つだけ存在する。フィールドは 10バイ ト固定とする。TERM チャンクが省略された場合は、ファイル終了後、最後に表示した PNG 画像 を表示し続けること。 -27- ARIB STD-B62 第一編 第2部 フィールド バイト数 意味 制限 Termination_action 1 繰り返し処理の指定 3 に固定 Action_after_iterations 1 繰り返し処理後のアクション 0 に固定 Delay 4 繰り返し開始までの遅延時間 0 に固定 Iteration_max 4 繰り返し回数 3.3.2.7 FRAM 複数存在可能。フィールドは 1 バイト又は 10 バイト固定とする。 フィールド バイト数 意味 制限 1 フレーム書き換えモード指定 0, 1, 3 のいずれかに制限 1 フレーム名 0 に固定 1 フレーム間時間変更フラグ 2 に固定 1 タイムアウト値変更フラグ 0 に固定 1 クリップ値変更フラグ 0 に固定 Change_sync_id_list 1 Sync id 変更フラグ 0 に固定 Interframe_delay 4 フレーム間時間 Framing_mode 以下のフィールドは省略可能 Subframe_name , Separator Change_interframe_ Delay Change_timeout_ and_termination Change_layer_clipping _boundaries 3.3.2.8 DEFI 複数存在可能。後に続く PNG 画像の表示位置を設定する。フィールドは 12 バイト固定とする。 フィールド バイト数 意味 制限 Object_id 2 オブジェクトの ID 0 に固定 Do_not_show 1 オブジェクト非表示フラグ 0 に固定 Concrete_flag 1 オブジェクト属性フラグ 0 に固定 X_location 4 オブジェクトの X 座標 Y_location 4 オブジェクトの Y 座標 -28- ARIB STD-B62 3.4 第一編 第2部 GIF GIF(Graphics Interchange Format)によるグラフィックスファイルフォーマットは、米国 Compuserve Inc.が規定する GRAPHICS INTERCHANGE FORMAT 3.5 Version 89a を用いる。 SVG SVG(Scalable Vector Graphics)による図形符号化は、W3C の規格「Scalable Vector Graphics (SVG) 1.1 (Second Edition) W3C Recommendation 16 August 2011」を用いる。 -29- ARIB STD-B62 第一編 第2部 第4章 4.1 音声符号化 MPEG-2 AAC MPEG-2 AAC による音声符号化方式は、STD-B32 第 2 部 第 5 章に規定される AAC 方式 LC プロファイルを用いる。 4.2 MPEG-4 AAC MPEG-4 AAC による音声符号化方式は、STD-B32 第 2 部 第 6 章に規定される方式を用いる。 4.3 MPEG-4 ALS MPEG-4 ALS による音声符号化方式は、STD-B32 第 2 部 第 7 章に規定される方式を用いる。 4.4 PCM (AIFF-C) PCM を用いた音声符号化ファイルフォーマットは、DAVIC 1.4 Specification Part 9 Annex B に 示される AIFF-C(Audio Interchange File Format)を用いるものとし、表 4-1 で示す条件で符号化 するものとする。 表 4-1 PCM 符号化パラメータの制約条件 PCM 符号化の条件 テレビジョン音声のサンプリング周波数 48kHz 4.5 サンプリング周波数 ビット長 48kHz, 24kHz, 12kHz 8bit 又は 16 bit MP3 MP3 ファイルフォーマットでは、音声符号化方式として ISO/IEC11172-3 に規定される MPEG-1 Audio Layer-3 及び ISO/IEC13818-3 に規定される MPEG-2BC を用いるものとし、表 4-2 で示す 条件で符号化するものとする。 表 4-2 MP3 ファイルにおける符号化パラメータの制約条件 MP3 符号化の条件 符号化方式 サンプリング周波数 MPEG-1 Audio Layer-3 48kHz MPEG-2BC 24kHz -30- ARIB STD-B62 第5章 5.1 第一編 第2部 文字符号化 文字符号体系 ISO/IEC 10646:2012 を用いる。 5.2 レパートリ ISO/IEC 10646:2012 で規定される文字レパートリのサブセットとして、以下の規格及び表 5-2 で規定されるレパートリを用いる。 JIS X0201:1997 JIS X0213:20042 ISO/IEC 10646:2012 の LATIN-1 SUPPLEMENT 表 5-2 に示される文字・記号 5.3 制御機能の符号化 制御符号は表 5-1 に示すものを用いる。 表 5-1 5.4 制御符号 符号値 制御符号名称 意味 U+0009 CHARACTER TABULATION タブ U+000A LINE FEED (LF) 行送り U+000D CARRIAGE RETURN (CR) 行頭復帰 符号化 文字の符号化は、ISO/IEC 10646:2012 9.1 節にて規定される UTF-8 を用いる。また、UTF-8 を 表すシグネチャ<EF BB BF>は用いない。 JIS X0201:1997 で規定する片仮名図形文字と ISO/IEC 10646:2012 との対応関係は、JIS X0213:2004 附属書 5 表 1 に従う。また、JIS X0201:1997 の 0x7E(Overline)は、ISO/IEC 10646:2012 の U+007E(Tilda)とする。JIS X0213:2004 の数字、ラテン文字、特殊文字と ISO/IEC 10646:2012 の対応関係は、JIS X0213:2004 附属書 5 表 2 に従う。 5.5 外字の符号化 外字の符号化は以下に規定される方式を用いる。 2 この規格中に JIS X0208:1997 が含まれる。 -31- ARIB STD-B62 第2部 Scalable Vector Graphics (SVG) 1.1 (Second Edition), W3C Recommendation 16 August 2011, 第一編 第 20 章 “Fonts” WOFF File Format 1.0, W3C Recommendation, 13 December 2012 -32- ARIB STD-B62 表 5-2 追加する記号・文字 -33- 第一編 第2部 ARIB STD-B62 第一編 第2部 -34- ARIB STD-B62 -35- 第一編 第2部 ARIB STD-B62 第一編 第2部 -36- ARIB STD-B62 -37- 第一編 第2部 ARIB STD-B62 第一編 第2部 -38- ARIB STD-B62 -39- 第一編 第2部 ARIB STD-B62 第一編 第2部 -40- ARIB STD-B62 -41- 第一編 第2部 ARIB STD-B62 第一編 第2部 -42- ARIB STD-B62 -43- 第一編 第2部 ARIB STD-B62 第一編 第2部 -44- ARIB STD-B62 -45- 第一編 第2部 ARIB STD-B62 第一編 第2部 -46- ARIB STD-B62 -47- 第一編 第2部 ARIB STD-B62 第一編 第2部 -48- ARIB STD-B62 -49- 第一編 第2部 ARIB STD-B62 第一編 第2部 -50- ARIB STD-B62 -51- 第一編 第2部 ARIB STD-B62 第一編 第2部 解説1 UCS の非サロゲート運用 第 5 章で規定する文字符号化方式において、5.2 節で規定するレパートリのうち、一部は UCS の 基本多言語面(BMP)以外の面である追加多言語面(SMP)、追加漢字面(SIP)に配置されている。SMP、 SIP に配置された文字は、UCS-4 又はサロゲート(UTF-16)を用いなければ利用できない。従って、 UCS-2 で表現できる範囲に限って文字を利用することが可能な処理系では、これらの文字の利用が 困難である。こうした処理系を前提に 5.2 節で規定するレパートリを利用する場合、SMP、SIP に 配置された文字を表 D1-1、表 D1-2 に従って BMP 内の私用領域(PUA)に再配置した文字符号系と して利用する。ただし、この再配置は UCS を正しく実装する他の処理系とは互換性を有しないた め、その利用には注意を要する。 表 D1-1 JIS X0213:2004 の文字で SMP、SIP に配置された文字の PUA への再配置 面区点 符号値 面区点 符号値 面区点 符号値 面区点 符号値 1-14-2 U+E760 2-3-18 U+E785 2-8-32 U+E7AB 2-14-87 U+E7D1 1-15-34 U+E761 2-3-24 U+E786 2-8-37 U+E7AC 2-14-88 U+E7D2 1-15-44 U+E762 2-3-31 U+E787 2-8-40 U+E7AD 2-15-10 U+E7D3 1-15-64 U+E763 2-3-33 U+E788 2-8-42 U+E7AE 2-15-31 U+E7D4 1-15-91 U+E764 2-3-42 U+E789 2-8-43 U+E7AF 2-15-32 U+E7D5 1-47-52 U+E7F4 2-3-50 U+E78A 2-8-59 U+E7B0 2-15-34 U+E7D6 1-47-67 U+E765 2-3-51 U+E78B 2-8-70 U+E7B1 2-15-35 U+E7D7 1-47-78 U+E766 2-3-57 U+E78C 2-8-76 U+E7B2 2-15-46 U+E7D8 1-85-26 U+E767 2-3-60 U+E78D 2-12-2 U+E7B3 2-15-57 U+E7D9 1-85-82 U+E768 2-3-87 U+E78E 2-12-11 U+E7B4 2-15-65 U+E7DA 1-86-9 U+E769 2-4-10 U+E78F 2-12-16 U+E7B5 2-15-73 U+E7DB 1-86-18 U+E76A 2-4-17 U+E790 2-12-48 U+E7B6 2-15-74 U+E7DC 1-86-64 U+E76B 2-4-18 U+E791 2-12-69 U+E7B7 2-15-80 U+E7DD 1-87-76 U+E76C 2-4-26 U+E792 2-12-77 U+E7B8 2-15-85 U+E7DE 1-88-94 U+E76D 2-4-29 U+E793 2-12-82 U+E7B9 2-78-3 U+E7DF 1-89-9 U+E76E 2-4-57 U+E794 2-13-4 U+E7BA 2-78-20 U+E7E0 1-89-39 U+E76F 2-4-60 U+E795 2-13-9 U+E7BB 2-78-41 U+E7E1 1-89-52 U+E770 2-4-62 U+E796 2-13-10 U+E7BC 2-78-60 U+E7E2 1-89-78 U+E771 2-4-67 U+E797 2-13-18 U+E7BD 2-78-62 U+E7E3 1-90-61 U+E772 2-4-74 U+E798 2-13-20 U+E7BE 2-78-63 U+E7E4 1-91-19 U+E773 2-4-75 U+E799 2-13-21 U+E7BF 2-78-64 U+E7E5 -52- ARIB STD-B62 第一編 第2部 1-91-41 U+E774 2-4-82 U+E79A 2-13-25 U+E7C0 2-79-18 U+E7E6 1-91-76 U+E775 2-4-84 U+E79B 2-13-54 U+E7C1 2-79-39 U+E7E7 1-92-41 U+E776 2-4-85 U+E79C 2-13-93 U+E7C2 2-79-45 U+E7E8 1-92-49 U+E777 2-5-5 U+E79D 2-14-3 U+E7C3 2-79-65 U+E7E9 1-94-70 U+E778 2-5-18 U+E79E 2-14-4 U+E7C4 2-79-68 U+E7EA 2-1-1 U+E779 2-5-30 U+E79F 2-14-26 U+E7C5 2-80-2 U+E7EB 2-1-11 U+E77A 2-5-36 U+E7A0 2-14-28 U+E7C6 2-80-19 U+E7EC 2-1-14 U+E77B 2-5-39 U+E7A1 2-14-29 U+E7C7 2-80-25 U+E7ED 2-1-22 U+E77C 2-5-53 U+E7A2 2-14-34 U+E7C8 2-80-51 U+E7EE 2-1-38 U+E77D 2-5-54 U+E7A3 2-14-35 U+E7C9 2-80-91 U+E7EF 2-1-80 U+E77E 2-5-94 U+E7A4 2-14-36 U+E7CA 2-81-14 U+E7F0 2-1-87 U+E77F 2-8-16 U+E7A5 2-14-39 U+E7CB 2-81-16 U+E7F1 2-1-89 U+E780 2-8-23 U+E7A6 2-14-41 U+E7CC 2-81-21 U+E7F2 2-3-2 U+E781 2-8-24 U+E7A7 2-14-53 U+E7CD 2-81-36 U+E7F3 2-3-5 U+E782 2-8-26 U+E7A8 2-14-54 U+E7CE 2-3-7 U+E783 2-8-27 U+E7A9 2-14-55 U+E7CF 2-3-17 U+E784 2-8-31 U+E7AA 2-14-59 U+E7D0 表 D1-2 追加する記号・文字で SMP、SIP に配置された文字の PUA への再配置 正規符号値 STD-B24 句点 PUA 符号値 正規符号値 STD-B24 句点 PUA 符号値 U+20158 85-02 U+E081 U+1F109 92-40 U+E29E U+233CC 85-53 U+E08A U+1F10A 92-41 U+E29F U+233FE 85-54 U+E08B U+1F12D 92-55 U+E2A4 U+235C4 85-56 U+E08C U+1F12C 92-86 U+E3A7 U+242EE 85-68 U+E08E U+1F12B 92-87 U+E3A8 U+1F17F 90-16 U+E0D8 U+1F190 92-89 U+E2C4 U+1F18A 90-17 U+E0D9 U+1F226 92-90 U+E2C5 U+1F14A 90-48 U+E0F8 U+1F240 93-17 U+E2CD U+1F14C 90-49 U+E0F9 U+1F241 93-18 U+E2CE U+1F13F 90-50 U+E0FA U+1F242 93-19 U+E2CF U+1F146 90-51 U+E0FB U+1F243 93-20 U+E2D0 U+1F14B 90-52 U+E0FC U+1F244 93-21 U+E2D1 -53- ARIB STD-B62 第一編 第2部 U+1F210 90-53 U+E0FD U+1F245 93-22 U+E2D2 U+1F211 90-54 U+E0FE U+1F246 93-23 U+E2D3 U+1F212 90-55 U+E0FF U+1F247 93-24 U+E2D4 U+1F213 90-56 U+E180 U+1F248 93-25 U+E2D5 U+1F142 90-57 U+E181 U+1F12A 93-26 U+E2D6 U+1F215 90-59 U+E183 U+1F227 93-27 U+E2D7 U+1F216 90-60 U+E184 U+1F228 93-28 U+E2D8 U+1F14D 90-61 U+E185 U+1F229 93-29 U+E2D9 U+1F131 90-62 U+E186 U+1F214 93-30 U+E2DA U+1F13D 90-63 U+E187 U+1F224 93-31 U+E2DB U+1F217 90-66 U+E18A U+1F22B 93-32 U+E2DC U+1F218 90-67 U+E18B U+1F22C 93-33 U+E2DD U+1F219 90-68 U+E18C U+1F22D 93-34 U+E2DE U+1F21A 90-69 U+E18D U+1F22E 93-35 U+E2DF U+1F21B 90-70 U+E18E U+1F22F 93-36 U+E2E0 U+1F21C 90-72 U+E190 U+1F230 93-37 U+E2E1 U+1F21D 90-73 U+E191 U+1F231 93-38 U+E2E2 U+1F21E 90-74 U+E192 U+1F110 94-33 U+E383 U+1F21F 90-75 U+E193 U+1F117 94-34 U+E384 U+1F220 90-76 U+E194 U+1F112 94-35 U+E385 U+1F221 90-77 U+E195 U+1F113 94-36 U+E386 U+1F222 90-78 U+E196 U+1F114 94-37 U+E387 U+1F223 90-79 U+E197 U+1F115 94-38 U+E388 U+1F224 90-80 U+E198 U+1F116 94-39 U+E389 U+1F225 90-81 U+E199 U+1F117 94-40 U+E38A U+1F14E 90-82 U+E19A U+1F118 94-41 U+E38B U+1F200 90-84 U+E19C U+1F119 94-42 U+E38C U+1F15F 91-33 U+E1C7 U+1F11A 94-43 U+E38D U+1F18B 91-34 U+E1C8 U+1F11B 94-44 U+E38E U+1F18D 91-35 U+E1C9 U+1F11C 94-45 U+E38F U+1F18C 91-36 U+E1CA U+1F11D 94-46 U+E390 U+1F179 91-37 U+E1CB U+1F11E 94-47 U+E391 U+1F17B 91-42 U+E1D0 U+1F11F 94-48 U+E392 -54- ARIB STD-B62 第一編 第2部 U+1F17C 91-48 U+E1D6 U+1F120 94-49 U+E393 U+1F100 92-16 U+E28F U+1F121 94-50 U+E394 U+1F101 92-32 U+E296 U+1F122 94-51 U+E395 U+1F102 92-33 U+E297 U+1F123 94-52 U+E396 U+1F103 92-34 U+E298 U+1F124 94-53 U+E397 U+1F104 92-35 U+E299 U+1F125 94-54 U+E398 U+1F105 92-36 U+E29A U+1F126 94-55 U+E399 U+1F106 92-37 U+E29B U+1F127 94-56 U+E39A U+1F107 92-38 U+E29C U+1F128 94-57 U+E39B U+1F108 92-39 U+E29D U+1F129 94-58 U+E39C -55- ARIB STD-B62 第一編 第2部 <余 白> -56- ARIB STD-B62 第3部 字幕・文字スーパーの符号化 第一編 第3部 ARIB STD-B62 第一編 第3部 目次 第 1 章 一般事項........................................................................................................................... 59 1.1 目的 .................................................................................................................................... 59 1.2 適用範囲 .............................................................................................................................59 1.3 参照文書 .............................................................................................................................59 1.3.1 準拠文書 ...................................................................................................................... 59 1.3.2 関連文書 ...................................................................................................................... 59 1.4 用語 .................................................................................................................................... 59 1.4.1 略語..............................................................................................................................59 第 2 章 字幕・文字スーパーの提示機能 ....................................................................................... 61 2.1 字幕・文字スーパーの種別 ................................................................................................ 61 2.2 字幕提示機能の概要 ........................................................................................................... 61 第 3 章 字幕・文字スーパーの記述言語 ....................................................................................... 63 3.1 文字符号化 ......................................................................................................................... 63 3.1.1 文字符号化方式............................................................................................................ 63 3.1.2 字種..............................................................................................................................63 3.2 名前空間 .............................................................................................................................63 3.3 ARIB-TTML の文書構造 .................................................................................................... 64 3.3.1 ARIB-TTML のプロファイル ....................................................................................... 64 3.3.2 拡張要素 ...................................................................................................................... 65 3.3.2.1 arib-tt:font-face 要素 ............................................................................................. 65 3.3.2.2 arib-tt:keyframes 要素 .......................................................................................... 66 3.3.2.3 arib-tt:audio 要素 .................................................................................................. 68 3.3.3 拡張属性 ...................................................................................................................... 69 3.3.3.1 arib-tt:animation .................................................................................................. 69 3.3.3.2 arib-tt:border ........................................................................................................70 3.3.3.3 arib-tt:letter-spacing ............................................................................................ 71 3.3.3.4 arib-tt:marquee ..................................................................................................... 71 3.3.3.5 arib-tt:ruby ........................................................................................................... 72 3.3.3.6 arib-tt:text-shadow ............................................................................................... 73 3.4 ARIB-TTML 文書からのリソース参照 ............................................................................... 73 3.4.1 放送で伝送するリソースの参照 .................................................................................. 73 3.4.2 受信機内蔵音の参照 .................................................................................................... 74 3.5 フォント .............................................................................................................................74 -57- ARIB STD-B62 第一編 第3部 3.5.1 font-family ................................................................................................................... 74 3.5.2 外字を含む非組込フォントの指定 ............................................................................... 74 3.5.3 font-size ....................................................................................................................... 75 3.5.4 font-weight .................................................................................................................. 75 3.5.5 color .............................................................................................................................. 75 3.6 音声の再生 ......................................................................................................................... 75 3.6.1 付加音 .......................................................................................................................... 76 3.6.2 受信機内蔵音 ............................................................................................................... 76 3.7 図形の表示 ......................................................................................................................... 76 3.7.1 ARIB-TTML 文書中に定義された図形の表示.............................................................. 76 3.7.2 ARIB-TTML 文書外の図形の表示 ............................................................................... 77 3.8 画面の消去 ......................................................................................................................... 78 3.9 ARIB-TTML 文書のデフォルト値 ...................................................................................... 78 第 4 章 初期化動作 ....................................................................................................................... 79 第 5 章 字幕・文字スーパーの伝送 .............................................................................................. 80 5.1 MMT を用いた字幕・文字スーパーの伝送......................................................................... 80 5.2 MPEG-2 TS を用いた字幕・文字スーパーの伝送 .............................................................. 80 解説 1 ライブモードにおける、複数 TTML 文書にまたがる継続提示の動作例 ......................... 81 -58- ARIB STD-B62 第1章 第一編 第3部 一般事項 目的 1.1 本標準規格は、日本の標準方式として規定されるデジタル放送における第 2 世代マルチメディア 符号化方式に関し、字幕・文字スーパーの符号化について定める。 適用範囲 1.2 本標準規格は、高度広帯域衛星デジタル放送で用いられるマルチメディア符号化方式のうち、字 幕・文字スーパーの符号化について適用する。 参照文書 1.3 1.3.1 準拠文書 以下の文書、勧告のうち、特定の版が指定されていない準拠文書はその最新版を用いる。特定の 版が指定されているものについては指定されている版を用いることとするが、本標準規格の使用者 は最新版の準拠文書の適用性について検討を行うことが望ましい。 [1] W3C Timed Text Markup Language 1 (TTML1) (Second Edition), W3C Recommendation 24 September 2013(以下「TTML1 規格」という。) [2] SMPTE Timed Text Format(SMPTE-TT), SMPTE ST 2052-1:2013(以下「SMPTE-TT 規格」 という。) 1.3.2 関連文書 本標準規格に関連する規格は次のとおりである。 [1] ARIB STD-B60「デジタル放送における MMT によるメディアトランスポート方式」 1.4 1.4.1 用語 略語 AIFF Audio Interchange File Format AIFF-C Audio Interchange File Format - Compressed MMT MPEG Media Transport MPU Media Processing Unit PCM Pulse Code Modulation PNG Portable Network Graphics SMPTE Society of Motion Picture & Television Engineers SMPTE-TT SMPTE - Timed Text -59- ARIB STD-B62 第一編 第3部 SVG Scalable Vector Graphics TTML Timed Text Markup Language UCS Universal multiple-octet coded Character Set URI Uniform Resource Identifier URL Uniform Resource Locator WOFF Web Open Font Format -60- ARIB STD-B62 第2章 2.1 第一編 第3部 字幕・文字スーパーの提示機能 字幕・文字スーパーの種別 テレビジョン放送の映像と同時に提示する文字表示を中心とするサービスのうち、映像の内容と 関連したサービスを字幕とよび、それ以外のものを文字スーパーと称する。伝送及び符号化方式の 規定にあたっては、特にそれらを区別せず、総称して字幕と呼ぶことにする。 2.2 字幕提示機能の概要 表 2-1 に本標準規格における字幕の提示機能の概要を示す。 表 2-1 表示機能 図形 1920 x 1080、3840 x 2160、7680 x 4320 横書き、縦書き、混在が可能 UTF-8 を用いて伝送される字幕においては、第 2 部に規定される 文字種及び非組込フォント指定による文字種 複数フォント指定可能 本編 第 2 部 5.5 で規定する非組込フォントによる 画素(px)単位で指定可能 赤(R)、緑(G)、青(B)、透明度(A)を各 256 階調指定可能 文字単位 点滅、アンダーライン、オーバーライン、取り消し線、縁取り、 影付き、太字、斜体、太字斜体 PNG、SVG タイミング制御 表示開始時間、表示終了時間、表示継続時間 切換制御 カット、ポップオン、ペイントオン、ロールアップ、スクロール、 書式 文字列の方向 文字レパートリ フォント 外字処理 文字表示サイズ 着色 文字着色単位 文字属性 表示制御 字幕の提示機能 キーフレームアニメーション その他 付加音 PCM(AIFF-C)、MP3、MPEG-2 AAC、MPEG-4 AAC 内蔵音 PCM(AIFF-C)、MP3、MPEG-2 AAC、MPEG-4 AAC -61- ARIB STD-B62 第一編 第3部 表 2-2 表示モード 受信時 字幕表示モード 表示機能 自動表示 視聴者の操作に関係なく受信中は常に表示 自動非表示 視聴者の操作に関係なく常に非表示 選択表示 視聴者の操作及び受信機の設定に基づいて表示(又は 非表示) 記録再生時 自動表示 記録時自動的に記録され、再生時は視聴者の操作に関 係なく常に表示 自動非表示 再生時非表示 選択表示 記録時自動的に記録され、再生時は視聴者の操作に基 づいて表示(又は非表示) 書式は、1920 x 1080、3840 x 2160、7680 x 4320 に対応する。 表 2-3 表示書式と表示領域サイズ 表示書式 表示領域のサイズ 1920 x 1080 横 1920×縦 1080 3840 x 2160 横 3840×縦 2160 7680 x 4320 横 7680×縦 4320 -62- ARIB STD-B62 第3章 第一編 第3部 字幕・文字スーパーの記述言語 本章では、W3C 勧告 ”Timed Text Markup Language 1 (TTML1) (Second Edition)” 及び SMPTE ST 2052-1:2013 ”Timed Text Format (SMPTE-TT)” をベースとして、高度広帯域衛星デ ジタル放送として機能を追加した字幕・文字スーパーの記述言語 ARIB-TTML を規定する。 ARIB-TTML 記述言語により記述された文書を ARIB-TTML 文書と呼ぶことにする。 3.1 文字符号化 文字符号化方式 3.1.1 ARIB-TTML 文書の文字符号化方式は本規格 第一編 第 2 部に規定される UTF-8 を用いる。 字種 3.1.2 UTF-8 を用いて記述される ARIB-TTML 文書で使用する字種は、本規格 第一編 第 2 部に規定 される文字種及び外字とする。制御符号としては、以下の制御符号を利用する。 表 3-1 3.2 ARIB-TTML 文書で利用可能な制御符号 コード位置 U+0009 値 Character tabulation(TAB) U+000A U+000D LINE FEED (LF) CARRIAGE RETURN (CR) 名前空間 ARIB-TTML 文書において、要素や属性には、以下の名前空間及び接頭辞を用いる。本標準規格 により拡張した要素や属性には、接頭字 arib-tt: を用いる。 表 3-2 名前空間 名前 TT 接頭辞 tt: 名前空間 http://www.w3.org/ns/ttml TT Parameter TT Style ttp: tts: http://www.w3.org/ns/ttml#parameter http://www.w3.org/ns/ttml#styling TT Metadata SMPTE ttm: smpte: http://www.w3.org/ns/ttml#metadata http://www.smpte-ra.org/schemas/2052-1/2013/smpte-tt ARIB arib-tt: http://www.arib.or.jp/ns/arib-ttml/v1_0 -63- ARIB STD-B62 3.3 第一編 第3部 ARIB-TTML の文書構造 ARIB-TTML 文書は、TTML1 規格[1]及び SMPTE-TT 規格[2]に準拠し、本標準規格にて拡張し た要素、属性を加えた文書構造により記述される。ARIB-TTML 文書の上位構造を図 3-1 に示す。 図 3-1 ARIB-TTML 文書の上位構造 最上位は、tt 要素、その下に head 要素及び body 要素を配置できる。head 要素の下には、文書 全体にわたるスタイル等を規定する styling 要素や文書全体にわたるレイアウト等を規定する layout 要素を配置できる。body 要素の直下には、div 要素や p 要素が配置される。div 要素や p 要 素の下には、字幕や文字スーパーとして提示するテキストなどが記述できる。div 要素及び p 要素 では、begin 属性等の時刻制御用の情報を記述し、指定した時間に字幕テキスト等を表示すること ができる。ここまでの各要素は基本的に TTML1 規格に準拠するが、それ以下の要素や属性に関し ては、SMPTE-TT 規格及び本標準規格により拡張されたものも含む。以下に本標準規格により拡 張する要素、属性を規定する。 3.3.1 ARIB-TTML のプロファイル ARIB-TTML プロファイルの識別子は、 -64- ARIB STD-B62 第一編 第3部 http://www.arib.or.jp/ns/profiles/arib-ttml-full/v1_0 とする。TTML1 規格に従った ARIB-TTML プロファイル定義おける、feature 要素記述及び extension 要素記述は運用にて規定する。 3.3.2 3.3.2.1 拡張要素 arib-tt:font-face 要素 arib-tt:font-face 要素は、ARIB-TTML 文書において、外字等に用いることができる非組込フォ ントを指定するための要素である。ARIB-TTML 文書の styling 要素に、0 以上の arib-tt:font-face 要 素 を 配 置 す る こ と が で き る 。 非 組 込 フ ォ ン ト に 関 す る 規 定 は 3.5.2 節 を 参 照 の こ と 。 arib-tt:font-face 要素のシンタックスを表 3-3 に、文書構造を図 3-2 に示す。 表 3-3 arib-tt:font-face 要素のシンタックス <xsd:element name="font-face" type="arib:font-faceType"/> <xsd:complexType name="font-faceType"> <xsd:sequence> <xsd:element name="src" type="arib:font-face-srcType" maxOccurs="unbounded"/> </xsd:sequence> <xsd:attribute name="font-family" type="xsd:string" use="required"/> <xsd:attribute name="unicode-range” type="xsd:string"/> <xsd:attribute name="id" type="xsd:ID"/> </xsd:complexType> <xsd:complexType name="font-face-srcType"> <xsd:attribute name="url" type="xsd:anyURI" use="required"/> <xsd:attribute name="format" type="xsd:string"/> <xsd:attribute name="id" type="xsd:ID"/> </xsd:complexType> -65- ARIB STD-B62 第一編 第3部 図 3-2 arib-tt:font-face 要素の構造 arib-tt:font-face 要素の意味: font-family:非組込フォントを利用する際に tts:fontFamily 属性で指定するフォントファミリ名 を定義する属性で必須の属性である。 unicode-range:フォントが対応している文字符号値の範囲を表す。以下に記述例を示す。 ・unicode-range = "U+A5":特定の文字だけに適用する例 ・unicode-range = "U+0-7F":範囲を1つ指定する例 ・unicode-range = "U+A5, U+0-7F, …":範囲を複数指定する例 arib-tt:src:url 属性及び format 属性を指定するための親要素。1 つ以上の src 要素を定義する 必要がある。 url:フォントファイルの場所を表す URL を定義する属性で必須の属性である。 format:フォントファイルのフォーマットを定義する属性。"svg" 又は "woff"が記述できる。 3.3.2.2 arib-tt:keyframes 要素 arib-tt:keyframes 要素は、アニメーションの動作を定義するための要素である。アニメーション の開始から終了までの一連の動作は、arib-tt:keyframes 要素の子要素の keyframe 要素が指定する 状態をたどって行われる。アニメーションを用いる際は、arib-tt:animation 属性により、本要素内 で定義した名前で呼び出される。例えば、複数の keyframe 要素の tts:origin 属性が変化していれ ば、対象となる要素がその指定に応じて移動する。ARIB-TTML 文書の styling 要素に、0 以上の arib-tt:keyframes 要素を配置することができる。arib-tt:keyframes 要素ののシンタックスを表 3-4 に、文書構造を図 3-3 に示す。 -66- ARIB STD-B62 表 3-4 第一編 arib-tt:keyframes 要素のシンタックス <xsd:element name="keyframes" type="arib:keyframesType"/> <xsd:complexType name="keyframesType"> <xsd:sequence> <xsd:element name="keyframe" type="arib:keyframeType" minOccurs="2" maxOccurs="unbounded"/> </xsd:sequence> <xsd:attribute name="animationName" type="xsd:string" use="required"/> <xsd:attribute name="id" type="xsd:ID"/> </xsd:complexType> <xsd:complexType name="keyframeType"> <xsd:attribute name="position" type="xsd:string" use="required"/> <xsd:attribute ref="tts:backgroundColor"/> <xsd:attribute ref="tts:color"/> <xsd:attribute ref="tts:fontSize"/> <xsd:attribute ref="tts:extent"/> <xsd:attribute ref="tts:opacity"/> <xsd:attribute ref="tts:origin"/> <xsd:attribute name="id" type="xsd:ID"/> </xsd:complexType> 図 3-3 arib-tt:keyframes 要素の構造 -67- 第3部 ARIB STD-B62 第一編 第3部 arib-tt:keyframes 要素の意味: animationName:keyframes 要素で定義するアニメーションの名前を指定する属性。 ARIB-TTML 文書中の arib-tt:animation 属性で、アニメーション名が指定されることで、アニメ ーションが呼び出される。 keyframe:アニメーションの各段階(キーフレーム)を定義するための要素。position 属性が"0%" 及び"100%"の keyframe 要素を必ず定義する必要がある。keyframe 要素で複数の属性値を指定す ることも可能である。 position:アニメーションの中で当該キーフレームが発生する時間を表すパーセント値。 tts:backgroundColor:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素の背 景色を指定する場合に用いる。 tts:color:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素中の文字色を指定 する場合に用いる。 tts:extent:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素の領域の幅と高 さを指定する場合に用いる。 tts:fontSize:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素のフォントサ イズを指定する場合に用いる tts:opacity:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素の半透明合成時 のアルファ値を指定する場合に用いる tts:origin:当該キーフレームにおいて、arib-tt:animation 属性を指定した要素の位置を指定す る場合に用いる ※各属性の詳細な動作は別途運用にて規定する。 3.3.2.3 arib-tt:audio 要素 arib-tt:audio 要素は、ARIB-TTML 文書において、付加音及び受信機内蔵音を再生するために利 用することができる要素である。ARIB-TTML 文書中の div 要素又は p 要素の子要素として配置す ることができる。音声の再生に先立って ARIB-TTML 文書のパースが行われ、div 要素又は p 要素 内で、begin 属性が指定されている場合は、その開始時間が音声の再生開始時間となる。begin 属 性が指定されていない場合は、ARIB-TTML 文書の提示の開始と同時に音声の再生が始まる。音声 の再生に関する規定は 3.6 節を参照のこと。arib-tt:audio 要素のシンタックスを表 3-5 に、文書構 造を図 3-4 に示す。 -68- ARIB STD-B62 表 3-5 第一編 第3部 arib-tt:audio 要素のシンタックス <xsd:element name="audio" type="arib:audioType"/> <xsd:complexType name="audioType"> <xsd:attribute name="src" type="xsd:anyURI" use="required"/> <xsd:attribute name="loop" type="xsd:boolean"/> <xsd:attribute name="id" type="xsd:ID"/> </xsd:complexType> 図 3-4 arib-tt:audio 要素の構造 arib-tt:audio 要素の意味: src:音声ファイルの場所を表す URL を定義する属性で必須の属性である。 loop:指定した音声を繰り返し再生するかどうかを指定することができる boolean 値である。loop 属性を省略した場合は、loop="false"とする。 3.3.3 3.3.3.1 拡張属性 arib-tt:animation arib-tt:animation 属性は、本属性を指定した要素に対して arib-tt:keyframes 要素で定義したア ニメーションを適用する場合に利用する属性である。style 要素、body 要素、div 要素、p 要素、span 要素の属性として指定することができる。arib-tt:animation 属性のシンタックスを表 3-6 に示す。 表 3-6 arib-tt:animation 属性のシンタックス <xsd:attribute name="animation" type="xsd:string"/> arib-tt:animation 属性の意味: animation: 以下に示す 6 つの値を、<animation-name>、<animation-duration>、 <animation-timing-function>、<animation-delay>、<animation-iteration-count>、 -69- ARIB STD-B62 第一編 第3部 <animation-direction>の順番でスペース区切りによりまとめて指定する文字列。 (例:arib-tt:animation="myAnimation1 1000ms linear 0ms 1 normal") ・<animation-name>:arib-tt:keyframes 要素で定義したアニメーション名を指定 ・<animation-duration>:アニメーション 1 回分の継続時間をミリ秒(ms)で指定 ・<animation-timing-function>:アニメーションを適用する場合の、 アニメーションの 進行割合を指定する。以下の値を指定できる。 "ease": 3 次ベジェ曲線 cubic-bezier(0.25, 0.1, 0.25, 1.0) を指定したのと同じ(開 始と完了を滑らかにする) "linear":cubic-bezier(0.0, 0.0, 1.0, 1.0) を指定したのと同じ(一定) "ease-in":cubic-bezier(0.42, 0, 1.0, 1.0) を指定したのと同じ(ゆっくり始まる) "ease-out":cubic-bezier(0, 0, 0.58, 1.0) を指定したのと同じ(ゆっくり終わる) "ease-in-out":cubic-bezier(0.42, 0, 0.58, 1.0) を指定したのと同じ(ゆっくり始ま ってゆっくり終わる) ・<animation-delay>:アニメーションの開始を遅らせる時間を指定。遅らせる必要がな い場合は 0 を指定。 ・<animation-iteration-count>:アニメーションを適用する場合に、 アニメーションの 繰り返し回数を指定。 ・<animation-direction>:アニメーションを繰り返す場合に、交互に反転再生させるかど うかを指定する際に指定。以下の値を指定できる。 "normal": 普通方向の再生でアニメーションを繰り返す "alternate": 奇数回では普通方向の再生、偶数回では逆方向の再生となって、アニ メーションを繰り返す 3.3.3.2 arib-tt:border arib-tt:border 属性は、文字囲み(ボーダー)のスタイル、太さ、色をまとめて指定する際に使 用する属性である。style 要素、body 要素、div 要素、p 要素、span 要素の属性として指定するこ とができる。arib-tt:border 属性のシンタックスを表 3-7 に示す。 表 3-7 arib-tt:border 属性のシンタックス <xsd:attribute name="border" type="xsd:string"/> arib-tt:border 属性の意味: border:以下に示す 3 つの値を、< border-style>、<border-width>、<border-color>の順番でス ペース区切りによりまとめて指定する文字列。(例:arib-tt:border="solid 3px white") ・< border-style >:ボーダーのスタイルを指定する。以下の値を指定できる。 -70- ARIB STD-B62 第一編 第3部 "none": ボーダーは表示されず、太さ 0 になる。他のボーダーが重なった場合には、 重なったボーダーが表示される。 "hidden":ボーダーは表示されず、太さ 0 になる。他のボーダーが重なった場合で も、重なったボーダーは表示されない。 "solid":1 本線で表示される。 "double":2 本線で表示される。 "groove":立体的に窪んだ線で表示される。 "ridge":立体的に隆起した線で表示される。 "inset":上と左のボーダーが暗く、下と右のボーダーが明るく表示され、領域全体 が立体的に窪んだように表示される。 "outset":上と左のボーダーが明るく、下と右のボーダーが暗く表示され、領域全体 が立体的に隆起したように表示される。 "dashed":破線で表示される。 "dotted":点線で表示される。 ・< border-width >:ボーダーの太さをピクセル値(px)で指定。 ・< border-color >:ボーダーの色を指定。指定方法は、3.5.5 節に従う。 3.3.3.3 arib-tt:letter-spacing arib-tt:letter-spacing 属性は、文字の間隔を指定する際に使用する属性である。style 要素、body 要素、div 要素、p 要素、span 要素の属性として指定することができる。arib-tt:letter-spacing 属 性のシンタックスを表 3-8 示す。 表 3-8 arib-tt:letter-spacing 属性のシンタックス <xsd:attribute name="letter-spacing" type="xsd:string"/> arib-tt:letter-spacing 属性の意味: letter-spacing:デフォルトの文字間隔に付加する間隔をピクセル値(px)で指定。 3.3.3.4 arib-tt:marquee arib-tt:marquee 属性は、要素を自動スクロールさせる際に使用する属性であり、スタイル、方 向、スピード、繰り返し数をまとめて指定する際に使用する。arib-tt:marquee 属性を指定した要 素に図形が含まれる場合、図形も含めてスクロールする。style 要素、body 要素、div 要素、p 要素、 span 要素の属性として指定することができる。arib-tt:marquee-style 属性のシンタックスを表 3-9 に示す。 -71- ARIB STD-B62 第一編 第3部 表 3-9 arib-tt:marquee-style 属性のシンタックス <xsd:attribute name="marquee" type="xsd:string"/> arib-tt:marquee-style 属性の意味: marquee-style:以下の 4 つの値を、< marquee-style>、<marquee-direction>、<marquee-speed>、 <marquee-play-count>の順番でスペース区切りによりまとめて指定する文字列。 (例:arib-tt:marquee="scroll forward normal 1") ・<marquee-style >:スクロールの動きの方法を指定する。以下の値を指定できる。 "scroll":開始側から終了側まで、要素の内容を完全にスクロールする。 "slide":開始側から終了側まで、要素の内容がが表示し終わるまでスクロールして 停止する。 "alternate":開始側から終了側まで、要素の内容が表示し終わるまでスクロールし た後、逆向きに表示し終わるまでスクロールする。 ・< marquee-direction>:スクロールの方向を指定する。以下の値を指定できる。 "forward":横書きの場合は「左から右」、縦書きの場合は「上から下」に、要素を スクロールする。 "reverse":横書きの場合は「右から左」、縦書きの場合は「下から上」に、要素を スクロールする。 ・<marquee-speed >:スクロールの動きの速さを指定する。"slow"、"normal"、"fast"の いずれかを指定するが、具体的な速度は運用にて規定する。 ・<marquee-play-count >:スクロールの回数を指定する。数値若しくは" infinite"(無限) を指定できる。 3.3.3.5 arib-tt:ruby arib-tt:ruby 属性は、指定した要素がルビであることを指定するとともに、同じ ARIB-TTML 文 書内においてルビの対象となる文字列を含む要素を指定することが可能な属性である。例えば、ル ビの対象となる span 要素に対して xml:id 属性の値を’ruby_1’と定義し、ルビとして表示する span 要素に対して arib-tt:ruby 属性の値を’ruby_1’と指定することで、ルビの対象となる文字列部分と、 ルビとして表示する文字列部分を指定することができる。arib-tt:ruby 要素は、div 要素、p 要素、 span 要素の属性として指定することができる。arib-tt:ruby 属性のシンタックスを表 3-10 に示す。 表 3-10 arib-tt:ruby 属性のシンタックス <xsd:attribute name="ruby" type="xsd:string"/> -72- ARIB STD-B62 第一編 第3部 arib-tt:ruby 属性の意味: ruby:ルビの対象となる要素の xml:id の値を指定 3.3.3.6 arib-tt:text-shadow arib-tt:text-shadow 属性は、文字に影を付ける際に使用する属性であり、水平方向の影のズレ、 垂直方向の影のズレ、影のぼかし範囲、影の色をまとめて指定する際に使用する。style 要素、body 要素、div 要素、p 要素、span 要素の属性として指定することができる。arib-tt:text-shadow 属性 のシンタックスを表 3-11 に示す。 表 3-11 arib-tt:text-shadow 属性のシンタックス <xsd:attribute name="text-shadow" type="xsd:string"/> arib-tt:text-shadow 属性の意味: text-shadow:以下の 4 つの値を< offset-x>、<offset-y>、< blur-radius>、<color>の順番でスペ ース区切りによりまとめて指定する文字列。(例:arib-tt:text-shadow="5px 5px 2px blue") ・<offset-x>:横方向の影のズレの長さをピクセル値(px)で指定。正の値を指定すると右へ、 負の値を指定すると左へ影が移動。 ・<offset-y>:縦方向の影のズレの長さをピクセル値(px)で指定。正の値を指定すると下 へ、負の値を指定すると上へ影が移動。 ・<blur-radius>:影のぼかし半径をピクセル値(px)で指定。 ・<color>:影の色を指定。指定方法は、3.5.5 節に従う。 3.4 3.4.1 ARIB-TTML 文書からのリソース参照 放送で伝送するリソースの参照 放送により ARIB-TTML 文書と ARIB-TTML 文書から参照するリソースファイルを同時に伝送 する場合、ARIB-TTML 文書からそれらのリソースを指定するための URL の記述方法を表 3-12 に示す。 表 3-12 ARIB-TTML 文書から MMT で伝送するリソースの参照方法 subt://<subsample_index> <subsample_index> の意味: 同一の字幕データ伝送単位におけるリソースのサブサンプル番号。ARIB-TTML 文書(サブサン プル番号=0)に続き 2 つめ(サブサンプル番号 1)以降に配置されるサブサンプル番号を指定する。 -73- ARIB STD-B62 第一編 第3部 上記の指定方法によって参照できるリソースは、参照元の ARIB-TTML 文書と同一の字幕データ 伝送単位で伝送したリソースのみであり、伝送単位を受信してから次の伝送単位を受信するまでの 間だけ参照可能である。ARIB-TTML 文書を含む次の伝送単位を取得した際は、前の伝送単位に含 まれていたリソースは受信機のキャッシュから消去され、参照先のリソースの存在は保証されない。 字幕データ伝送単位は、MMT による伝送においては MPU となる。 3.4.2 受信機内蔵音の参照 ARIB-TTML 文書内で、audio 要素により、受信機内蔵音を再生する場合には、表 3-13 に示す URL の記述方法を利用する。 表 3-13 ARIB-TTML 文書から受信機内蔵音の参照方法 romsound://<sound_id> <sound_id> の意味: 受信機内蔵音の音源の番号(0 以降の整数値)を指定 3.5 3.5.1 フォント font-family ARIB-TTML 文書中の font-family 属性に丸ゴシック、太丸ゴシック、角ゴシックが指定された 場合、適切な書体で表示すること。他の font-family が指定された場合、選択される書体は商品企 画とする。英文フォントについては、generic-family に sans-serif が指定された場合はプロポーシ ョナルフォントで、monospace が指定された場合は等幅フォントで表示すること。 3.5.2 外字を含む非組込フォントの指定 3.3.2.1 節で規定した arib-tt:font-face 要素が指定された場合、受信機はその指定に従って非組込 フォントを利用した表示を行う。放送においては、3.4.1 節で規定した参照方法により、ARIB-TTML 文書と同時に伝送されたフォントファイルを用いて表示する。指定可能なフォントの形式は本編 第 2 部 5.5 節に準拠する。 表 3-14 に非組込フォントにより外字の表示を行う ARIB-TTML 文書の例を示す。非組込フォン トファイルは、ARIB-TTML 文書と同じ字幕データ伝送単位中のサブサンプル番号 1 で伝送されて おり、"subt://1"により参照される例である。 -74- ARIB STD-B62 表 3-14 第一編 第3部 外字の表示を行う ARIB-TTML 文書の例 <?xml version="1.0" encoding="UTF-8"?> <tt xmlns="http://www.w3.org/ns/ttml" xmlns:arib-tt="http://www.arib.or.jp/ns/arib-ttml/v1_0" xmlns:smpte="http://www.smpte-ra.org/schemas/2052-1/2013/smpte-tt" xml:lang="ja"> <head> <styling> <arib-tt:font-face font-family="extChar1" unicode-range="U+E000"> <arib-tt:src url="subt://1" format="svg"/> </arib-tt:font-face> </styling> </head> <body> <div> <p begin="00:00:03" end="00:00:06">外字の表示 </p> </div> </body> </tt> 3.5.3 font-size 文字の大きさを font-size 属性により画素(px)単位で指定する。1 つの値、又はスペース区切りに より 2 つの値を指定することができる。値を 1 つのみ指定した場合は、フォントの高さを指定した こととする。2 つの値を指定した場合は、前者をフォントの幅、後者をフォントの高さとする。 3.5.4 font-weight 書体の太さ(フォントウェイト)を font-weight 属性により指定する。normal 若しくは bold が指 定された場合の太さは運用にて規定する。 3.5.5 color 文字の着色は、color 属性により文字単位で赤、緑、青、透明度を 256 階調で指定する。色名若 しくは、#rrggbb(赤、緑、青を 2 桁の 16 進数で指定)、#rrggbbaa(赤、緑、青、透明度を 2 桁 の 16 進数で指定)で指定できる。利用可能な色名の定義は、別途運用にて規定する。 3.6 音声の再生 3.3.2.3 節で規定した arib-tt:audio 要素が指定された場合、有効な ARIB-TTML 文書を提示して いる期間内で付加音及び受信機内蔵音を再生する。 -75- ARIB STD-B62 3.6.1 第一編 第3部 付加音 放送においては、3.4.1 節で規定した参照方法により、ARIB-TTML 文書と同時に伝送された音 声ファイルが参照された場合、当該音声ファイルを再生する。指定可能な付加音の符号化形式は、 本規格 第一編 第 2 部に規定される PCM(AIFF-C)形式、MP3 形式、MPEG-2 AAC 形式、MPEG-4 AAC とする。 3.6.2 受信機内蔵音 3.4.2 節で規定した参照方法により、受信機内蔵音が参照された場合には、当該内蔵音を再生する。 音源は、別途運用規格にて規定される sound_id の値を使用する。 3.7 図形の表示 SMPTE-TT 規格[2]により定義された smpte:backgroundImage 属性を利用して、以下に規定す る図形を表示できること。 3.7.1 ARIB-TTML 文書中に定義された図形の表示 ARIB-TTML 文書では、SMPTE-TT 規格で規定される smpte:image 要素を用いて、文書中に図 形 デ ー タ を 埋 め 込 む こ と が 可 能 で あ る 。 smpte:image 要 素 で 定 義 さ れ た id 属 性 の 値 を smpte:backgroundImage 属性により指定することで、文書中に定義されたデータを参照して図形 を表示する。指定可能な図形の符号化形式は本規格 第一編 第 2 部に規定される PNG 形式とする。 表 3-15 に文書内の図形表示を行う ARIB-TTML 文書の例を示す。smpte-image 要素により定義さ れた図形データの id 値が"Img1"であり、smpte:backgroundImage 属性により、"#Img1"により参 照される例である。 -76- ARIB STD-B62 表 3-15 第一編 第3部 文書内の図形表示を行う ARIB-TTML 文書の例 <?xml version="1.0" encoding="UTF-8"?> <tt xmlns="http://www.w3.org/ns/ttml" xmlns:arib-tt="http://www.arib.or.jp/ns/arib-ttml/v1_0" xmlns:smpte="http://www.smpte-ra.org/schemas/2052-1/2013/smpte-tt" xml:lang="ja"> <head> <metadata> <smpte:image xml:id="Img1" imageType="PNG" encoding="Base64"> [Base64 エンコードによる画像データ] ・・・・・ </smpte:image> </metadata> </head> <body> <div> <div begin="00:00:05" end="00:00:10" smpte:backgroundImage="#Img1"> <p>画像表示</p> </div> </div> </body> </tt> 3.7.2 ARIB-TTML 文書外の図形の表示 MMT を用いた放送においては、smpte:backgroundImage 属性で、3.4.1 節で規定した参照方法 により ARIB-TTML 文書外のリソースが指定された場合、ARIB-TTML 文書と同時に伝送された画 像ファイルを表示できること。指定可能な図形の符号化形式は本規格 第一編 第 2 部に規定される PNG 形式及び SVG 形式とする。表 3-16 に外部の図形表示を行う ARIB-TTML 文書の例を示す。 画像ファイルは、ARIB-TTML 文書と同じ字幕伝送単位でサブサンプル番号 1 として伝送されてい る場合であり、"subt://1"により参照される例である。 -77- ARIB STD-B62 第一編 第3部 表 3-16 外部の図形表示を行う ARIB-TTML 文書の例 <?xml version="1.0" encoding="UTF-8"?> <tt xmlns="http://www.w3.org/ns/ttml" xmlns:arib-tt="http://www.arib.or.jp/ns/arib-ttml/v1_0" xmlns:smpte="http://www.smpte-ra.org/schemas/2052-1/2013/smpte-tt" xml:lang="ja"> <head/> <body> <div> <div begin="00:00:05" end="00:00:10" smpte:backgroundImage="subt://1"> <p>画像表示</p> </div> </div> </body> </tt> 3.8 画面の消去 空の ARIB-TTML 文書(<tt></tt>)を受信した場合、画面消去の命令とみなし、提示中の字幕 を全て消去すること。 3.9 ARIB-TTML 文書のデフォルト値 ARIB-TTML 文書内の属性値、スタイル、レイアウトは、別途運用規定で定めるデフォルト値を 定める。 -78- ARIB STD-B62 第4章 第一編 第3部 初期化動作 制御情報と初期化動作の範囲は表 4-1 に示す通りとする。初期化動作により、表 4-2 に示す初期 状態とするものとする。 表 4-1 初期化動作項目 制御情報と初期化動作範囲 表示画面 音声再生 図形 非組込フォント ○ ○ ○ ○ ARIB-TTML 文書更新 〇 〇 〇 〇 字幕 (ライブモードの場合) *2 *3 *3 *3 *3 データ ARIB-TTML 文書更新 ○ ○ ○ ○ ○ ○ ○ ○ 制御情報 字幕の付加識別情報の更新*1 (ライブモード以外の場合)*4 画面消去(空要素) 注)*1 MMT による放送の場合は、MH-データ符号化方式記述子に配置され、TS による放送 の場合は、データ符号化方式記述子又は DII メッセージ中に配置される。 *2 MH-データ符号化方式記述子に配置される字幕・文字スーパー伝送方式の付加識別情報 において OPM(動作モード)の値が"00"の場合。 *3 更新前の ARIB-TTML 文書中の要素の end 属性又は dur 属性に"indefinite"が指定され た場合にのみ、初期化動作を行わない。動作例を解説 1 に示す。 *4 ARIB-TTML 文書中の要素の end 属性又は dur 属性に"indefinite"が指定されていても 初期化動作が行われ、提示は継続されない。 表 4-2 初期状態 項目 初期状態 表示画面 画面消去。提示時刻制御は提示終了時刻を経過した状態とする。 音声再生 再生停止状態。付加音の場合は、データを保持していない状態とする。 図形 データを保持していない状態とする。 非組込フォント 非組込フォントの指定を解除し、データを保持していない状態とする。 -79- ARIB STD-B62 第一編 第3部 第5章 5.1 字幕・文字スーパーの伝送 MMT を用いた字幕・文字スーパーの伝送 ARIB STD-B60 第 9 章に規定される、字幕・文字スーパーの伝送方式を用いて伝送する。 5.2 MPEG-2 TS を用いた字幕・文字スーパーの伝送 MPEG-2 TS を用いた字幕・文字スーパーの伝送方式については[T.B.D.]とする。 -80- ARIB STD-B62 解説1 第一編 第3部 ライブモードにおける、複数 TTML 文書にまたがる継続提示の動作例 TTML は、一つの動画に対して字幕データを表現するデータフォーマットである。一つの TTML 文書で完結した符号化形式になっているため、複数の TTML 文書の相関はない。例外として TTML1 規格の Annex L で Non-Normative(必須でない)規定として断片化された TTML のストリーミン グ仕様が書かれているが、この仕様も一つの提示対象が分離された場合の対応がなされているわけ ではない。そこで、本規格では複数の TTML の継続提示を行うための仕組みを導入した。ここでは その仕組みについて解説する。 図 D1-1 に継続表示が必要な事例を示す。事例で送られている TTML-2 の中の文字 4 は、50.856 秒まで提示していてほしい字幕だが、TTML-3 の文字 5 を送出するために TTML を分離しなけれ ばならない。ライブ放送を想定しているため、文字 5 の字幕送出が TTML-2 の送出時点では確定し ていないことを想定している。この場合、TTML-2 と TTML-3 の切り替え時に切り替え時間が生じ、 提示が一時中断されることが予想される。これは、仮に TTML-2 の文字 4 の p 要素の end 属性の 指定がないとしても、TTML の処理系が TTML-3 の描画処理を行うにあたってなんらかの指示を 受けなければ、いったん表示を消去する必要があるため、提示が一時中断されることは避けられな い。 番組開始の基準時間 00:00:01.878 00:00:08.608 00:00:15.296 00:00:24.556 00:00:36.178 00:00:50.856 00:00:16.278 t TTML‐1 TTML‐2 TTML‐3 <p begin="00:00:01.878“ end="00:00:05.334" > 文字1</p> <p begin="00:00:08.608" end="00:00:15.296" > 文字2</p> <p begin="00:00:16.278“ end="00:00:24.556" > 文字3</p> <p begin="00:00:25.008" end="00:00:36.178" > 文字4</p> <p begin="00:00:36.178“ end="00:00:50.856" > 文字4</p> <p begin=“00:00:40.111” end=“00:00:50.856”> 文字5</p> 文字1 文字2 文字3 文字4 文字4 文字5 図 D1-1 TTML の継続提示が必要な想定事例 -81- ARIB STD-B62 第一編 第3部 そこで、提示の継続を TTML 処理系が認識できるように、提示継続を行いたい p 要素の end 属 性(若しくは dur 属性)に定数"indefinite"を指定することで、処理系に提示継続を伝える。 番組開始の基準時間 00:00:01.878 00:00:08.608 00:00:15.296 00:00:24.556 00:00:36.178 00:00:50.856 00:00:16.278 t TTML‐1 TTML‐2 TTML‐3 <p id=“p1” begin="00:00:01.878“ end="00:00:05.334" >文字 1</p> <p id=“p2” begin="00:00:08.608" end="00:00:15.296" > 文字2</p> <p id=“p3” begin="00:00:16.278“ end="00:00:24.556" > 文字3</p> <p id=“p4” begin="00:00:25.008" end=“indefinite" > 文字4</p> <p id=“p4” begin=“indefinite “ end="00:00:50.856" > 文字4</p> <p id=“p5” begin=“00:00:40.111” end=“00:00:50.856”> 文字5</p> 文字1 文字2 文字3 文字4 文字5 図 D1-2 提示継続を行う場合の例 図 D1-2 に end 属性に"indefinite"を用いた例を示す。この例で示すように、提示継続を行いたい 字幕がある場合、TTML-2 の文字 4 を提示する p 要素のように時間として"indefinite"を指定する。 さらに次に伝送される TTML-3 に提示継続する対象の字幕要素の begin 属性にも"indefinite"を指 定する。この二つの p 要素が提示継続されるが、二つの要素の同一性は、id 属性が同一であること を用いる。処理系は、end 属性に"indefinite"が指定された提示要素については、新しい TTML 文 書が伝送されてきても保持し、同一の id 要素の DOM ツリーに差し替える処理を行う。ただし、図 D1-2 の例のように TTML-3 で文字 4 を提示する p 要素の end 属性の値が確定している場合、DOM ツリー上の置き換えられた p 要素の当該 end 属性の値は新しい TTML 側の値に上書きされること に注意すること。それ以外の当該 p 要素の DOM ノードの値は継続される(つまり TTML-2 で指定 された値になる)。TTML-2 で指定された表示領域などの style を含む DOM ノードの各プロパティ の値と TTML-3 の同一 id で指定された要素のそれが異なる場合でも、当該 p 要素の DOM ノード の値は継続されることが望ましい。また TTML3 の begin 属性が"indefinite"でない場合は、TTML-3 のパースが終わり当該 id の p 要素の begin 属性を判定次第、初期化動作を行う。結果として提示は 継続されないことになる。TTML-2 の end 属性(又は dur 属性)に"indefinite"が指定されている ものがない場合、受信機は TTML-3 の取得開始時点で、初期化動作を行うことができる。 -82- デジタル放送における マルチメディア符号化方式(第2世代) 標 準 規 格 ARIB STD-B62 1.0 版 (第一分冊) 平成 26 年 7月 発 1.0 版第1刷発行 行 所 一般社団法人 電 波 産 業 会 〒100-0013 東京都千代田区霞が関1-4-1 日土地ビル11階 電 話 03-5510-8590 FAX 03-3592-1103
© Copyright 2024 Paperzz