放送番組のラウドネスとラウドネスレンジ - MUSICグループ・コマーシャル

NAB2010
放送番組のラウドネスとラウドネスレンジ
Thomas Lund
TC Electronic A/S デンマーク
要約
放送がデジタル化になる過程で、さまざまな放送形態に適応し、制作から伝送
までの系において、信頼性があり、扱いも容易なラウドネスとラウドネスレン
ジのコントロールが求められてきた。このためには、パラメータをしっかり定
義しておくことが必要となる。ここが不十分な場合には、過剰な音質処理や番
組内で CM と本編でのレベル差といった現象をおこしてしまう。
ITU-R BS1770 規格を元に、番組間でのラウドネス許容範囲について、一般視聴
者が音量の相違を許容できるのはどれくらいかを、いわゆる「チャンネル・ザ
ッピング」
(頻繁にチャンネルを切り替える傾向)を想定した、客観的指標のラ
ウドネス・サンプルを使い主観評価実験を行った。
本論文では EBU プロジェクトである P/LOUD の研究成果も示す。ここでは、リ
ニア PCM 音声だけでなく様々な圧縮コーデックにおける最新の勧告案が提示さ
れている。
我々は、最近の ATSC が研究提案している HDTV における Dolby 方式のコーデ
ックとトークのラウドネスといったより特定の分野を対象とした取り組みにも
注目している。
本研究は、放送界関係者が、将来の放送形態や視聴者の要求を現在進行形で改
革しながら品質を維持した制作から伝送、素材管理のシステムを構築するため
の新しい、そして普遍的な指標を提供するものである。その対象となるのは、
ラジオや TV 放送の制作、設備、管理といった業務に携わるエンジニアの方々で
あり、その目的は、特定の製品の使用を推奨するのではなく、あくまで科学的
な見地から得られた情報を提供することにある。
はじめに
プロオーディオで長年用いられてきたレベル・コントロール手法は、D-TV にお
けるレベル・ジャンプや、CD 音声の歪み、異なるフォーマット/放送プログラ
ム・ジャンルにおける音声間の非互換性の原因となってきた。それらの現象の
根本にある問題が「ラウドネス・コントロール」であり、従来の不適切なラウ
ドネス管理により、視聴者は頻繁にボリュームを調整せざるを得ない状況に陥
っていると言えよう。
最適なラウドネス・コントロールを得るには、単にピークレベルやダイアログ
(台詞/ナレーションなど)のレベルだけに着目した制作方法では十分とはい
えない。この問題点を改善するべく、現在では放送業界のみならず、映画音響
や音楽の分野においても共通のコントロール方法の確立が求められている。
BS.1770 勧告の「適正化」セクションでは、「今日のデジタル伝送技術が広ダイ
ナミックレンジ伝送を可能としている一方で、試聴者は、異なった番組や音源
であっても一定の客観的なラウドネスレベルで聞きたいという要求がある。音
声レベルを測定するには多くの手段が現存しているが、これらはいずれも主観
的なラウドネスという指標を示すことができない」と述べている。
本稿では、ITU-R 規格にもとづいてラウドネスをどう表し、これまでの研究をさ
らに発展させた内容として、このラウドネス指標が映画音響やドラマ、クラシ
ック音楽といったダイナミックレンジの広いジャンルの音源(ワイド・ラウド
ネスレンジ WLR)と、CM やプロモーション、POP 音楽などに見られるダイナ
ミックレンジの狭いジャンルの音源が混在した場合にいかに現状を改善できる
のかを述べる。
1 番組のラウドネス・バランス
放送番組におけるラウドネス・バランスについては以下に述べるような指標が
ある。
1 隣接した番組間のラウドネス差の許容範囲
2 チャンネル内での自然で妥当な音声レベル
3 同一伝送プラットホーム内での自然で妥当な音声レベル
4 放送チャンネル相互でのレベル差の許容範囲
これらを実現するために現状では、以下に述べるような各種のコントロール方
法が採用されている。
1耳での実試聴:
オーディオエンジニアが、番組内の主要な部分を再生する。
これは、経験のある担当者が必要で、かつ時間もかかるため実用的ではない。
2 VU メータリング:
長年にわたりアナログ音声でのレベル・コントロールとして使用されてきた。
オーディオエンジニアの経験が必要。素材別の適正な知識。VU メータの指示 範囲は、現在の広ダイナミックレンジ音声を表示するには、不十分。チャン
ネルあたり一つの VU メータで素材を送出していくのは、リスクがある。
3 QPPM メータリング:
準ピークメータについても2で述べたことが当てはまる。ダイナミックレ
ンジの狭い素材では、好まれるメータリングである。
4 ピークレベル・メータリング:
音楽 CD のマスタリング現場では、サンプル・ピークレベルをノーマライズ
する(通常 Odb FS 付近)ことが多い。この場合、ピークリミッターやクリッ
パーが音圧を最大に得る目的で使われるのが一般的で、ラウドネスのバラン
スを調整しているわけではない。この結果「ラウドネス戦争」と呼ばれる音
圧競争が問題となっており、音質も劣化している。
5 台詞レベルを基準にしたノーマライズ:
台詞のレベルを基準にして番組全体のレベルを可変する方法。この方法は、
台詞が無い作品では効果的ではない。このような場合、Dolby 社が専有する
独自技術である、台詞とそれ以外の素材音とを区別するような仕組みが必要
となる。この手法では、台詞とそれ以外の音源とのバランスはジャンルに
よって大幅に異なり、CM や PV ではこれが濫用され、過大に音圧を上げる
ことが頻繁に行われている。
6 ダイナミックレンジのプロセッシング
ダイナミックレンジをプロセッサーによって補正圧縮する方法。過渡な処理
を行うと、素材ごとのラウドネスを一見揃えているような結果をもたらすが、
音質は、著しく劣化する。また最大音圧を得るためにも利用されている。
適度なダイナミックレンジの圧縮は、広ダイナミックレンジを持つ素材では、
一定の効果をもたらすが、どこが適正であるかは、番組内容や放送メディア
に左右される。
7 ラウドネスデータのスポット測定
特定の部分を測定する場合は、番組内でどこが効果的かを手動で選択して測
定、または視聴。こうした部分チェックでは、台詞がある部分が望ましいが
音楽のイントロ部分といったところでも問題ない。
8 ラウドネスデータの全体測定
番組の時間やジャンルによらず全体をチェックする機能で、生放送リアルタ
イム/サーバー・ベースのワークフローでも適用。(詳細は後述)
2 視聴者の許容範囲
実効値レベル RMS 値とピークレベルの差をヘッドルームと呼ぶが、この指標は、
LIVE コンサートや音楽ミキシング、マスタリングそして放送といったメディア
で重要な要素である。我々はダイナミックレンジ許容度(DRT)という指標を
用い、視聴者が異なる視聴環境下において番組内でどれくらいのヘッドルーム
をもつのが適正なのかを調査してきた。この調査で得られた結果は、信号伝送
系がどれくらいのヘッドルームを持つのが良いかを定義することにも応用でき
ると考えている。我々の最近の活動では、ITU-R BS-1770 に基づくラウドネスレ
ンジの適正化についても発表しているので参考にされたい。
いくつかの国では、既にこうした観点から独自の規定を設けているところもあ
る。その内容は、番組内レベル差 - 特に本編と CM やプロモーション番組におけ
るレベル差について規定しているものである。一般視聴者が番組間でどれくら
いのレベル差を許容するのかを研究するのは、きわめて自然な成り行きと言え
よう。
Riedmiller 等が提唱した「適正ゾーン/Comfort Zone」という考え方は、視聴者
がどの範囲であればレベル差を気にしないかを示したものである。このゾーン
から外れた音声レンジは、視聴者が「小さ過ぎる/大き過ぎる(soft/loud)」と
感じ、レベルを調整したくなる領域である。この範囲内に収まっている音声は、
台詞の有無に関わらず、番組内で不快なレベル差を視聴者に感じさせない。
台詞のある部分が、この範囲から下がっていた場合は、このゾーンのラウドネ
スレンジが台詞にだけ適用されていたと考えられる。この種の内容は、残念な
がら番組の切り替え点を評価するための研究には適していないと考えてよい。
とはいえ、この考え方で素材の分布を見ると、適正ゾーンの内外で非対称的な
レベルの分布を見ることができる。「小さすぎる限界」と感じたレベルは、「大
きすぎる限界」と感じるレベルの2倍差となっている。一例でいえば、前のレ
ベルから+5.6db 大きいとレベルを下げ、-10.2db 小さくなるとレベルを上げて調
整する結果となっている。
番組トランジションのタイミングで視聴者がボリューム調整を行う場面の多く
ではラウドネス・ジャンプが発生していることが推定され、それはトランジシ
ョン間にダイアログ/台詞が含まれているか否かに関わらず起こっている。先
述の Riedmiller の研究からダイアログ/台詞のない音声素材のラウドネス・ジャ
ンプに関しては、視聴者は然程不快感を感じないという推定を行うには情報が
不十分過ぎるため、ここで LJT(ラウドネス・ジャンプ許容値)といった観点での
研究を行った。
Fig-01
茶色の先頭45秒区間は、試聴レベルの校正信号。灰色部分は、基準信号音で
灰色と緑色部分は、評価用信号音で各々15秒区間で構成
この研究では、15名の被験者が異なった試聴環境下、同番組を用い、合計5
00のラウドネス・ジャンプに対する評価を行った。用いられた素材は、ニュ
ース/高圧縮音楽/CM そして映画などである。これらの素材からラウドネスレ
ンジが 1.5LU 以内に収まった12カ所の部分を選び個別素材のレベルを可変し
てラウドネス正規化をおこなった。
テスト項目では、まず、被験者に基準レベルの内容を再生して、それぞれが一
番聞きやすいと思うレベルを設定してもらう。基準として選択した素材は、そ
れぞれラウンドネス分布が中心領域(Center of Gravity)で同じになる素材を採
用しているのでどれも同じラウドネス値を持った素材である。(Fig-01 参照)。
このサンプルを再生して被験者は、以下の5段階評価を行う。
1 レベルの変化がない。
2 レベルが大きいがあえて調整するほどではない
3 レベルがうるさいので調整が必要
4 レベルは小さいがあえて調整するほどではない
5 レベルが小さすぎるので調整が必要
サンプルは、Fig-02 に示す10通りの異なった組み合わせを使用し、ある素材は
台詞が中心、またあるものは音楽が中心の素材とした。
Fig-02
黄色で示す部分はスピーチ素材、緑色部分は音楽素材
評価実験の結果、番組間でレベルの変化が 5LU 以上あるとレベルを下げる傾向
にあり、逆にレベルが 8LU 以上小さいとレベルを上げる傾向にあることが 95%
の範囲で見られた。(表—01参照)
表−01
切り替え時のレベルジャンプについて様々なジャンル プラットホーム
再生環境を組み合わせて行った許容度結果
これは言い換えれば、番組が切り替わるポイントでは、視聴者は、次の番組の
レベルが大きくなることに対して敏感であることを示している。この傾向は、
プログラム・ジャンルや音の種類に関係なく示されるところにも注目したい。
LJT の非対称性は、ラウドネス計測を行ったり、ラウドネス・ディスクリプター
(ラウドネス値表示)を生成する機器を開発する際には非常に重要なポイント
となることをここに記しておく。
3 ラウドネス値の表示
「ラウドネス・ディスクリプター」とは、放送や音楽全体で各音声素材別のラ
ウドネス値を数値で表す機能のことである。表示のためのラウドネス測定アル
ゴリズムは、BS.1770 規格に沿った一定の方法を採用しモノーラル信号からステ
レオ、5.1CH サラウンド信号まで音声素材の種類によらず、サンプリング率やフ
ォーマットなどにも依存せずどこでも共通で適応できる信頼性と正確性を併せ
持ったものでなくてはならない。
以前発表した論文で我々は、音声素材ラウドネス記述のための分布と表示につ
いて CoG-Center of Gravity という方法を提案した。この方法は、ジャンルや素材
に関わらず共通に適応できる有益な表示方法であると考えている。
4 CoG (Center of Gravity)ラウドネス表示
CoG 表示は、番組全体のラウドネス値の測定結果である。ある番組と他の番組
間でラウドネスレベルのオフセットをゲインオフセットのみで調整する場合、
オフセット値は両番組の CoG 値の差を適用すれば良いことになる。測定は、
BS.1770 規格に沿って全チャンネル分(モノ/ステレオ/サラウンド入力チャン
ネル全体)Leq 値を測定して積分した値である。
CoG 表示は、適応型ゲートを採用しており番組内での無音部分を無視する動作
により番組の適正なラウドネス値を測定する実用的な方法である。
しかし、単一の固定ゲートレベルをどこに設定すればジャンルや内容によらず
測定できるかは、難しいことが分かったため、我々は、相対的なスレッショル
ドレベルを持つ適応型のゲートを採用した。この方法は、フィード/フォワー
ド構造を持つゲートで高いラウドネス値の番組であっても有効な動作を行うこ
とが出来る。このゲートで相対スレッショルドレベルを-20db に設定すると多く
の番組で良い結果を出すことが分かっている。さらにこのゲートは、先行型測
定法(look-ahead)を採用することでスレッショルドレベルの前後でスムースな
ゲート動作を行うことが出来る。このための遅延時間は、測定窓や測定の時定
数によって決められる。先行型測定法のメリットは、CM やプロモーション番組
のように短時間の番組であっても正確なラウドネス測定が行えることである。
5 ラウドネスレンジ
ラウドネス表示の「連続性(Consistency)」と「ラウドネスレンジ(Loudness
Range)」は、素材のラウドネスがどれくらい分布しているかを示す数値で総体
区間のラウドネス変化を測定し単位は、LU を用いている。
連続性の指標は、測定ラウドネスレンジの-1/2 として表し、例えば 7.0 LU のラ
ウドネスレンジがある場合は、連続性値は、その半分の-3.5LU と表示する。
現実の制作現場では、この両者のうちラウドネスレンジの指標を使うことが好
まれているが、両者は、同じことを表している。
正確さと信頼性の両方をうまく満足させるには、測定ラウドネスに統計的解析
手法を用いる。これによれば、瞬間的な過大ラウドネス値の音があっても長時
間の番組全体のラウドネスレンジには大きな影響を与えないという結果がでる。
同様に音楽の終わりがフェードアウトしていた場合でも全体のラウドネスレン
ジを増加させることはない。つまりラウドネスレンジは、低レベル部分と高レ
ベル部分の分布状況から決定できるといえる。
この手法は、統計学で用いる IQR 法(4分位範囲表示法)に近似しており測定
分散データから最も分布の高いデータを採用する方法でラウドネスレンジを表
すと多くのジャンルや番組内容で有益な結果を出すことが出来る。
ラウドネスレンジの測定でも、CoG で採用した適応型のゲートを採用している。
例えばある番組では、低レベルのバックグラウンドノイズが連続していたとす
るとこうした番組のラウドネスレンジは、通常のレベルとの間で大きなレベル
差を生じることになり結果極めて高いラウドネスレンジ値を表すことになるか
らである。
これを補正するために ALC(ラウドネス補正回路)を採用してラウドネスレン
ジを小さくすることができる。ラウドネスレンジの表示は、ダイナミックレン
ジの表示やクレストファクター等とは異なっているので混同しないようにして
ほしい。
6 標準化と EBU P/LOUD
ITU-R BS.1770 規格では、全体のラウドネス値を測定するための基本について述
べているが、さらに詳細なラウドネス・コントロールをどうするかには、言及
していないが、制作のワークフローを扱う人々には、共通となる指標や基本と
しておおいに関心のある点となる。
筆者らは、このための活動として ATSC S6-3 や EBU(P/LOUD)でこうした表示を
どう定義すれば良いのかに参画研究した。
P/LOUD では、BS.1770 勧告案に加えてターゲットレベルやいくつかの共通ラウ
ドネス表示の定義について提案しているが TC Electronic もこの活動に参画し活
動を行っているメーカである。
広ラウドネスレンジ(WLR)音声には、大きなラウドネス部分と小さなラウド
ネス部分の差が非常に大きいという特徴がある。我々は、この両者を強音と弱
音(FOREGROUND SOUND/BACKGROUND SOUND)と呼ぶことにする。
WLR 音声は、その特徴として通常のラウドネスよりさらに大きなラウドネスの
再現が可能なレベル設定を行える点にある。EBU P/LOUD では、以下のような
実験を実施した。ここでは、ゲート無しの BS.1770 規格に沿った長時間番組測
定結果に比べて強音部分に焦点をあてて番組間でレベルのオフセットを与えた
場合にどういった結果がでるかを実験した。この表示を FgL(Foreground
Loudness)という用語で以下に示すことにする。
FgL は、CoG 特性によく似た表示方法で、適応型ゲートのスレッショルドレベ
ルが高く設定されている。これによって高いレベル領域に焦点を当てたラウド
ネス測定を行うことが出来、スレッショルド値から下のレベル領域は、無視さ
れることになる。このためのスレッショルドレベルを-6db/LU という高い値に設
定したが、この値は、先に我々が実験した結果から導いた値である。
ラウドネスを調整する場合に、ある部分で高いラウドネス分布があり、他で低
いラウドネス分布があったとして、CoG 法を使うと、ラウドネスの高い部分は、
不自然なほど大きくなってしまうが、FgL 法であれば、より改善された結果をも
たらすことができよう。これはオーディオエンジニアが、ラウドネスの異なる
番組間でラウドネスを調整する場合に、その中に含まれている特徴的なラウド
ネス値の部分に着目して調整する方法と同じと考えて良い。
ITU SRG-3(現在は、BS.1770)実験法に基づいて49サンプルがテスト素材に
採用され、実験は、McGill 大学と TC Electronic で担当した。これらのサンプル
は、ダイナミックレンジの広くない Non WLR 素材である。その理由としては、
実験を行う上で、各サンプルのラウドネスレベルは、同じであることが求めら
れる。例えば、ダイナミックレンジの広いテストサンプルがあるとそれだけ大
きな音として認識し、それ以外のサンプルでは、サンプル音全体のラウドネス
として認識するからである。
SRG-3 テスト法(現在の BS.1770 勧告)で提起しているラウドネスモデルの基
本は、あまりラウドネスレベルの変化がない均一なモデルを推奨しているが、
果たしてそれで十分なのかという議論もある。均一なラウドネスモデルを推奨
した理由としては、
「大きなレベルポイント」を BS.1770 で測定しなければなら
ないのは何故か?という疑問に基づいている。ラウドネスレンジが小さく、無
音部分もない素材であれば、CoG 測定や FgL 測定および素材そのものを測定し
た場合でも結果は、すべて同じだからである。
7 ダイナミックレンジの大きな番組の表示
番組によっては、ラウドネスの大きな部分と小さい部分を持つものがある。
これらを我々は、WLR と呼ぶことにした。例えば、ラウドネスレンジが、15LU
を超えるような番組を WLR 番組と呼んでいる。こうした番組では、大きな音部
分と小さな音部分でラウドネスにかなりの相違が見られる。以下では、広いダ
イナミックレンジの番組/中庸なダイナミックレンジの番組/狭いダイナミッ
クレンジの番組の3タイプで実験した結果を示す。
広いダイナミックレンジで使ったサンプルは、1999年の映画「Matrix」を使
用し 5.1ch AC-3 サラウンド音声全チャンネルで測定した。データは、デジタル
データは使わず、D/A 後のアナログ、また DRC 機能は OFF としてダイナミック
レンジを測定した。その結果ラウドネスレンジは、25.0 LU という結果である。
この値は、一般の TV 受信機では、かなり厳しいレンジとなる。市販 DVD のラ
ウドネスレンジは、平均して 14
24LU で、CoG は、-26~-21 LKFS である。
Matrix の DVD では、CoG で-21.0 LKFS、FgL は-17.2LKSF で約 4 LU 高いことに
なる。まさに映画のラウドネス調整といえよう。Fig-03 には、測定結果を示す。
Fig-03
広いラウドネスレンジの例として測定した映画 Marix の各測定パラメータ結果。ここでは、ラウ
ドネス分布、ラウドネスレンジ、CoG および FgL 値を示している
図を見ると、CoG 値よりも 10-20LU 低い部分に多くの音が分布しているがこれ
は、通常のアクション映画では、見られない分布である。
通常の台詞レベルは、-44~-30LKFS 区間に収まっており、アクションノイズを伴
った場合で-25~-18LKFS の範囲にある。台詞の正規化と言う動作は、ラウドネス
の適正バランスをとる目的には、単純に適応できないということがここから推
察できよう。
次に、典型的な中庸ラウドネスレンジの番組を見てみよう。TV 番組「Friends」
を使用して測定すると、Fig-04 に示すようなラウドネスレンジ 6.6 LU を示して
いる。この DVD は、ステレオ音声で DVD からピークレベルで-6dbFS で再生さ
れ、結果 CoG 値で-24.7 LKFS である。これは、-30~-50LKSF 以下の微少レベル
をゲート機能でカットして測定した値である。
Fig-04
中庸のラウドネスレンジ例で測定した TV 番組 Friend の測定データ。
次に狭いダイナミックレンジの例として女性のトークを測定した。この結果を
Fig-05 に示すが、大変よくレンジがコントロールされ、適度な聴き易さに収まっ
ていることが分かる。ラウドネスレンジは、わずか 2.1LU で Cog 値と FgL 値は、
前2サンプルと異なり大きなレベル部分も持たないため、ほぼ同じ値である。
Fig-05
狭いラウドネスレンジの例として測定した女性のスピーチのデータ
3サンプルの Cog 値は、それぞれ-21.0 -24.7 -28.7 LKSF でこれらのラウドネスを
調整してターゲットラウドネス値に揃える場合は、単純にその差分だけレベル
オフセットをつければ良い。
8 ラウドネス表示方法の評価
ラウドネスの調整が確実に遂行できていない場合は、番組間の切り替え部分で
墓穴を掘る結果となる。それは、同一チャンネル内での番組切り替えでも、異
なったチャンネル間の切り替えでも同様である。これを防止するためには、我々
が「ZAP TEST」と呼ぶ実験結果から得られたバランス補正手法を導入すること
を提唱したい。
ここにそれぞれ異なった時間やフォーマット、ジャンルのプログラム A と B の
2つがあったとして、A と B のランダムな部分を選択する(これをカット位置
と呼ぶことにする)。リスナーは、番組 A をカット位置まで聞いて、そこから番
組 B へ切り替えたとしよう。多分この切り替え地点で何らかのラウドネス変化
(ラウドネス・ジャンプ)を認識するはずである。
次に異なるカット位置を選択して同様の切り替えを行う。これらの動作をあら
ゆる切り替え点での A-B の組み合わせでラウドネス・ジャンプがおきるとして
コンピュータシミュレーションで「ラウドネス・ジャンプ分布指数」として予
測する。(これは、相対的なラウドネス値の変動にのみ着目した実験で結果は、
ターゲット・ラウドネス値の如何に左右されないというメリットがある)。
もし番組 A の CoG 値を番組 B の持つ CoG 値に調整したとすると切り替え地点
でのラウドネス・ジャンプは、どうなるであろうか?
ZAP TEST から言えるのは、番組のなかでラウドネス・ジャンプ補正を CoG ま
たは FgL 値で+5/-8LU 範囲に収めた WLR の番組が入っていても視聴者は、十分
許容範囲内であるという結論である。FgL 値を測定する場合に、高いスレッショ
ルドのゲートを設定するほど、狭いダイナミックレンジの番組(NLR)に比べ
て一層のレベル減少を与える結果となる。ZAP TEST の詳細は、参考資料11を
参照願いたい。
他の評価法方法はなにか?といえば、EBU P/LOUD などでも言及しているよう
な色々な尺度を使って聞いてみることであると提案できるが、この論文を書い
ている時点で最適な方法は、-6db の相対スレッショルドを設定したゲートをか
けて測定した FgL 測定法が一番適切な選択肢であると考えている。
9 応用例
一般視聴者は、常に均一なレベルの POP 音楽の再生と、映画の中で突然大きな
音がすることのどちらを嗜好しているのだろうか?
まだ誰もこれに確かな回答を与えることは出来ていない。現状確かに言えるこ
とは、番組と CM の切り替えで過剰なレベル変動を聞くのは、好みではないと
いうことだ。しかし事は、多分に政治的な側面を持っており簡単に解決する問
題ではない。
BS.1770 では、測定と共通の表示法について言及しているが、これをプロオーデ
ィオ業界では、異なったジャンルやフォーマットの番組で音圧競争を回避する
ためのツールとして提供できるようになった。
音楽やポストプロダクション、映画といった制作で既にこうしたメータリング
が実現可能となった今、それらに関わる人々が、
「適正なターゲット・ラウドネ
ス」や「ラウドネスレンジ」を正しく扱えるのである。例えば 10LU を超えるラ
ウドネスレンジの番組があった場合にもそれを適切な範囲へ収めるための適切
なダイナミックレンジ処理が最終段階ではなく、プロダクションの現場で行え
るわけである。
共通の表示方法があれば、すべてのジャンルの番組にたいしても伝送/配信の
仕様に適応することができ、スタジオでは、どのようなダウンストリームであ
れば良いかを正確に把握している場合、扱う信号系は、どの段階でも変形する
ことなく効率よく扱うことができる。そうでない場合は、伝送/配信の各段階
で「正規化」や「ラウドネスレンジ」を補正するための余分な時間と手間を浪
費することになる。
放送局を例にすれば、ラウドネスレンジが 10LU を超えた番組を携帯端末で視聴
するための伝送へ送る時に、適正なプロセスを行う場合や、局内のサーバーへ
素材を収納する段階で、適切な素材別のレベルオフセットを付加して収納する
ことや、ラウドネス値を診断すること等が可能となる。
HDTV においてひとつまたは複数の番組切り替えポイントが広いダイナミック
レンジを持っていたとすると、それを違和感なく自然に切り替える処理を行う
ことが出来るといったケースが考えられよう。
AC-3 フォーマットを採用した伝送であれば、CoG や FgL 指標によって台詞の正
規化のための適切なパラメータをメタデータとして挿入することが出来る。
多言語番組のようなマルチ放送においても、それぞれのチャンネルで正規化し
た音声を放送でき、番組本編と、CM 間の音量差についても適切な解決が行える
ようになる。ダイナミックレンジの広い番組(WLR)では、特徴的な部分チェック
を行う事で改善効果をもたらすこともできよう。
放送局がレベルの正規化を行うもう一つのメリットは、CoG と FgL 値が同一で
あった時に台詞正規化が出来ない場合でも、その影響を最小限にとどめておく
ことが出来る点にある。
HDTV 放送でのダイナミックレンジ処理を AC-3 デコーダ側だけに任せる場合に、
ラウドネスレンジ表示計を使って DRC プロファイルに適切なパラメータをセッ
トすることもできる。しかし DRC 処理は、基本的に完全ではなく、その処理方
法は、Leq K 係数の重み付けを行っていない処理であると言う点に留意しておか
なくてはならない。つまり、DRC 処理は、予測できないのである。制作側が
BS.1770 に基づいたメータリングを行ったとして、制作から伝送/配信といった
すべての系で変形しない信号系を形成する役目を担うことはできないのである。
AC-3 の DRC 機能を使おうとする野心的な放送局がある場合でも、ラウドネス
レンジ表示が、信号系の良否を判断するのに有益となる。その理由は、制作ス
タジオでミキシング時に測定したダイナミックレンジとそれをダウンストリー
ムで伝送/配信しているどの段階での測定値も同じ結果を得ることができ、言
い換えれば全信号系内で、同一のダイナミックレンジを確保する方法だからで
ある。
これは、放送局が、メーカ別の TV や STB に関わらずメタデータや予測できな
い要素について放送番組の音に影響を与えずに確認するうえで重要なポイント
である。
ある番組例をここに紹介しよう。
「デスパレードな妻たち」というドラマシリー
ズのアナログ音声出力を DVD 再生機の 5.1CH、STB からのステレオさらに外付
けの AC-3 デコーダ出力(DRC OFF)で分析した結果を Fig-06/07 に示す。
Fig-06
TV ドラマシリーズ「デスパレードな妻たち」を例に Sony DVD 再生機 DVP NS900V のアナログ
5.1CH 出力測定結果。右の表示は、番組40分全体で測定した最大ツルーピークを示す
Fig-07
同じ素材を Marantz AC-3 デコーダでアナログ出力した 5.1CH の測定結果.
右の表示は、番組40分全体で測定した最大ツルーピークを示す
Sony 製 DVD 再生機と STB 出力のラウドネスレンジは、11.4 LU を示した、これ
は 95-98%の視聴者が快適に聞こえる範囲になっているが、AC-3 外付けデコード
からの出力は、15.4LU を示した。
放送をした結果については、体系的にログを記録し、クレームを出した視聴者
の環境を調査して、得られたデータをもとにしてターゲット値や処理工程を見
直すことが必要となる。
10 国際標準化活動
ITU-R BS.1770 規格は、新たな音声レベルの運用を世界共通に行う上でのきっか
けとなった。長年の活動から、WLR 番組の障害を防止し、「HD」の意味を品質
という面で確かなものにしたといえる。デジタル放送におけるラウドネス・コ
ントロールと言うテーマは、多分に政治的な項目であり、特にイタリアやアメ
リカではそれが顕著となった。論点の主眼は、本編と比べた過剰なレベルの CM
やプロモーションをどう整合させるかにあった。イタリアでは、2010年2
月5日にその結果が現出した。オーストラリアとイギリスの商業放送局は、こ
の活動に前向きな立場をとり、自前の規則を策定した。これらは、BCAP/Ofcom
といった活動としてそれぞれ通常番組編成での自主規制として実施されさらに
BCAP では、2008年7月に BS.1770 規格に基づいたラウドネス測定をすべて
の音声素材で実施することを決定した。アメリカ ATSC でも新たな勧告を出す
べく活動し、日本では、NHK ARIB、民放連が視聴テストを実施しながら BS.1770
規格と EBU P/LOUD 案の適正化を検討している。オーストラリアとブラジルの
組織でも同様な取り組みがなされている。
次世代 TV とは、BCAP が直感的に掲げた「コマーシャルは、過剰にうるさく、
誇張されてはならない」をよりどころにしているといえる。しかし.アメリカ
の ATSC A/85 条項は、そうは見えない。ここでは、現在 D-TV で採用されてい
る AC-3 コーディックにおける台詞のレベルに言及しようとしている。
この条項の例外として、CM やプロモーションの多種類時間枠制作におけるラウ
ドネスレベルの扱いという項目が検討されている。
これらを包括した解決方法を EBU P/LOUD の活動グループが提起している。
瞬時ラウドネスとスライディングラウドネス(継時ラウドネス)総体ラウドネ
スの値での相違点や BS.1770 の初期段階で曖昧であったゲート機能、LFE ダウ
ンミックス、そして相互補完表示といった項目にさらに詳細な定義を付け加え
ることが行われた。ATSC A-8 で検討している項目についても2010年に5つ
の研究結果を ITU の活動のひとつとして発表した。
まとめ
● 視聴者は、番組の切り替え時点で次の番組が小さいレベルに比べて大きい
レベルの場合にレベルを調整するという現象が見られる。
● この値は、5LU 以上ある場合に見られ、小さい場合は 8LU の差があった場
合に調整する傾向にある。
● 切り替え地点でのラウドネス変化量は、台詞のレベルの変化のみでなく音
楽や効果音の変化がある場合にも検知している。
● ダイナミックレンジの広い番組とそれ以外の番組がいかに自然に継続でき
るかの手法について放送側と家庭での取り組みはさらに挑戦していかなくては
ならない課題である。
● CoG と FgL 指標は、番組のラウドネスを調整する場合に有益である。しか
し、広いダイナミックレンジを持つ番組とそうでない番組間で自然な切り替え
を行うことは簡単ではなく、より入念な準備をしなければならない。
例えば、ダイナミックレンジを操作するプロセッサーの使用もその解決方法の
ひとつとして有益である。
● クラシック音楽のような場合は、その芸術表現からくる意図を重視したオ
ーディオエンジニアの対応も必要となるがいずれにせよ、ラウドネスレンジを
把握するための測定機能は、こうした場合でも有効である。
● EBU P/LOUD で提起した FgL 指標は、その計測テスト方法についてジャン
ルに左右されず大きな音のラウドネスを測定する上で満足のいく結果を出すこ
とが出来た。
● ラウドネスレンジの表示方法とその応用について提起した。ここでは、広
いラウドネスレンジ.中庸なラウドネスレンジ、狭いラウドネスレンジの3タ
イプについて実験を行った結果これら3タイプのラウドネス分布に大きな相違
があることが分かった。また表示計の実際をデモしてこれが、ラウドネスの変
化を客観的に特定する有益なツールとなることを示した。
● これらの分析から、レベルのジャンプを防止するために放送側や再生側で
レベルのオフセットを付けるだけでは解決しないことが分かった。番組の冒頭
か終了の地点でダイナミックレンジの広い箇所がある場合、ラウドネスレンジ
表示を行うことで CoG や FgL 値の算出に役たち、有益な解決に導くことができ
る。
謝辞
本研究にあたり私の同僚 Esben Skovenborg 及び Sφren H.Nielsen の有益な助言
と協力に感謝する。
REFERENCES
[1] Spikofski, G. & Klar, S. (2004) "Levelling and Loudness - in radio and television broadcasting", EBU
Technical Re-view, 2004.
[2] Emmett, J. (2003) "Audio levels - in the new world of digital systems", EBU Technical Review, 2003.
[3] Moerman, J.P. (2004) "Loudness in TV Sound", in Proc. of the AES 116th Conv.
[4] Grimm, E.M., van Everdingen, R. & Schöpping, M.J.L.C. (2008) "Towards a Recommendation for a
European Standard of Peak and LKFS Loudness Levels", in Proc. of the IBC 2008.
[5] AES Staff Writer (2008) "If it's loud does that mean it's bad? - Two workshops on broadcast issues from
the 123rd Convention", Journal of the Audio Engineering Society, vol.56:6, pp.493-498.
[6] ITU-R (2007) "Rec. ITU-R BS.1770-1, Algorithms to measure audio programme loudness and true- peak
audio level.", International Telecommunications Union.
[7] Skovenborg, E. & Lund, T. (2008) "Loudness Descriptors to Characterize Programs and Music Tracks", in
Proc. of the AES 125th Convention, San Francisco.
[8] Katz, B. (2002) "Mastering Audio: The Art and the Sci-ence", Oxford: Focal Press.
[9] Jones, B.L. & Torick, E.L. (1982) "A New Loudness Indi-cator for Use in Broadcasting". Proc. of the 71st
AES Con-vention, Montreux.
[10] Skovenborg, E. & Nielsen, S.H. (2007) "Real-Time Visualisation of Loudness Along Different Time
Scales", in Proc. of the 10th Int. Conference on Digital Audio Effects (DAFx-07), Bordeaux.
[11] Skovenborg, E. & Lund, T. (2009) "Loudness Descrip-tors to Characterize Wide Loudness-Range
Material", in Proc. of the AES 127th Convention, New York.
[12] Lund, T. (2006) "Stop Counting Samples", in Proc. of the AES 121st Convention, San Francisco.
[13] Jones, S. (2005) "The Big Squeeze -- Mastering engi-neers debate music's loudness wars", Internet web
page: http://mixonline.com/mag/audio_big_squeeze/, Mix.
[14] Nielsen, S.H. & Lund, T. (2003) "Overload in Signal Conversion", in Proc. of the 23rd AES Intl.
Conference, Co-penhagen.
[15] EBU (2009) "EBU Project Group P/LOUD (Loudness for broadcasting)", Internet web site:
http://wiki.ebu.ch/loud/Main_Page.
[16] Soulodre, G.A., Lavoie, M.C. & Norcross, S.G. (2003) "The Subjective Loudness of Typical Program
Material", in Proc. of the AES 115th Convention, New York.
[17] Skovenborg, E., Quesnel, R. & Nielsen, S.H. (2004) "Loudness Assessment of Music and Speech", in Proc.
of the AES 116th Convention, Berlin.
[18] Soulodre, G.A. & Norcross, S.G. (2003) "Objective Measures of Loudness", in Proc. of the AES 115th
Conven-tion, New York.
[19] Skovenborg, E. & Nielsen, S.H. (2004) "Evaluation of Different Loudness Models with Music and Speech
Material", in Proc. of the AES 117th Convention, San Francisco.
[20] Riedmiller, J.C., Lyman, S. & Robinson, C. (2003) "In-telligent Program Loudness Measurement and
Control: What Satisfies Listeners?", in Proc. AES 115th Convention, New York.
[21] ATSC Recommended Practice (2009): Techniques for Establishing and Maintaining Audio Loudness for
Digital Television. Document A/85.
[22] Lund, T. (2006) "Control of Loudness in Digital TV", in Proc. of the NAB 2006 Convention, Las Vegas.
[23] Lund, T. (2008) “Control of Loudness Across Broadcast Platforms”, in Proc. of the NAB 2008 Convention,
Las Ve-gas.
[24] BCAP rule on the sound levels of TV advertisements. Consultation response document, United Kingdom,
2008.
[25] A Survey Of Audio Loudness in Multi-Channel Televi-sion Programmes. FreeTV Australia, Sept., 2009.
[25] Metering manufacturer’s input document to EBU P/LOUD based on meeting Dec 9, 2009