Annotation - CrestMuse プロジェクト

9 編(音楽情報処理)-- 1 章(基礎・境界))
■2 群(画像・音・言語)-- 9 編(音楽情報処理)-- 1 章(基礎・境界)
1 -- 8 メタデータ・アノテーション
(執筆者:梶克彦)
コンテンツの意味内容 (コンテンツ自体の構造,制作者が込めた意図等) や周辺情報 (制作
者情報,関連コンテンツ等) に基づいて検索,推薦,変換などのタスクを行うためには,それ
らの情報を計算機が処理可能な形式で記述し,管理する仕組みが必要である.そこで,コン
テンツの様々な情報を注釈として関連付けられるアノテーション (メタデータとも呼ばれる)
に関する研究やサービスが盛んになってきている.
1--8--1 主なアノテーション記述形式
現在,音楽におけるアノテーションとして最も一般に普及しているのが ID3 タグ1) である.
ID3 タグは,アーティスト,曲名,ジャンルなど,楽曲の基本情報をオーディオファイルの
形式である MP3 に埋め込むための規格である.楽曲の基本情報を管理する CDDB2) が ID3
タグの普及を促進した.多くの音楽プレイヤは,CDDB から楽曲情報を自動的にダウンロー
ドし MP3 に ID3 タグを埋め込む機能を持っている.
埋め込み式のアノテーションは,コンテンツと同時に流通するため利便性が高いという利
点があるが,アノテーション管理を一元化することができず記述形式の柔軟性に問題がある.
そこで,コンテンツとは分離して記述可能なアノテーション形式が提案されている.
コンテンツと分離したアノテーションの記述形式には,記述の柔軟性から XML が用られ
ることが多い.MusicXML3) ,WEDELMUSIC XML Format4) は楽曲の楽譜相当の情報を記
述するための形式である.また MPEG-75) は音声や動画などのマルチメディアコンテンツに
対するアノテーション記述形式である.オーディオ信号の特徴などの低レベルな情報から,
楽器の音色や音声認識の結果などの高レベルな情報まで記述可能である.CrestMuseXML6)
は音楽情報処理研究のための共通データフォーマットである.音楽情報処理によって得られ
る様々な結果を,リンクされた複数の XML ドキュメントとして表すことができる.
共通した形式のアノテーションを Web 上で公開することで,多くのユーザがアノテーション
の検索や応用を行うことができるようになる.そこで,コンテンツに共通する基本情報 (タイト
ル,制作者,提供者,言語など) の語彙として Dublin Core7) が提唱された.また RDF(Resource
Description Framework) によって,Web 上のリソースに対するアノテーションの記述形式が
共通化された.RDF はリソース間の関係を有向グラフとして記述する.これによりコンテン
ツ間の複雑な関係を表現することが可能になる.MusicBrainz9) はアーティストや作品の基本
情報やその関係などをデータベース化するプロジェクトである.Dublin Core や RDF を採用
し,さらに音楽特有の語彙 (アルバム,トラックの長さ,楽曲指紋など) の定義を行っている
ため,拡張性,汎用性が高い形式であるといえる.
1--8--2 アノテーションシステム
Marsyas10) は楽曲オーディオファイルの音響解析結果をアノテーションとして自動解析す
るシステムである.パワースペクトル,MFCC,音量,音高,周期性など,多くの音楽研究に
有効な解析結果を提供する.本システムはスタンドアロンで動作し,コマンドラインか GUI
により操作を行う.
c 電子情報通信学会 2010
電子情報通信学会「知識ベース」 ⃝
1/(5)
9 編(音楽情報処理)-- 1 章(基礎・境界))
図 8・1 Clam Music Annotator
音響信号の可視化により,アノテーションを容易にしたのが Clam Music Annotator11) や
Sonic Visualiser12) や である.Clam Music Annotator(図 8・1) は,時間範囲に対する音高や和
音などの情報を付与または編集することができる.Sonic Visualiser は波形やスペクトルなど
の音響信号の解析結果をアノテーションとしてインポート,エクスポート可能なのが特徴で
ある.
大量のアノテーションを獲得するためには,Web 上のユーザから収集することが有効であ
る.大衆的な音楽サービスを提供するためには,膨大な数の楽曲に対するアノテーションを
網羅的に収集する必要がある.そこで CDDB は,未登録の楽曲基本情報をインターネット上
のユーザから音楽プレイヤを通して収集している.
一般ユーザがアノテーションに関わることによるノイズの問題がある.正確なアノテーショ
ンを収集するためには,ユーザに何らかのインセンティブを与える必要がある.そこでゲーム
によるアノテーション手法が注目を集めている.Google Image Labeler20) は The ESP Game21)
を基にしたゲームである.2 人の同じ画像を見ている人が同じタグを付与したらスコアが加
算される.このようなゲーム的手法は音楽アノテーションにも取り入れられている22) 23) .
c 電子情報通信学会 2010
電子情報通信学会「知識ベース」 ⃝
2/(5)
9 編(音楽情報処理)-- 1 章(基礎・境界))
図 8・2 音楽アノテーションシステム
一般にサービスプロバイダがトップダウンに提供する検索項目と,ユーザが検索したい項
目は必ずしも一致しない.そこでフォークソノミーというユーザが付与するタグによる分類
法が注目を集めている.フォークソノミーに基づくサービスでは,ユーザがコンテンツに対
して自由に複数のタグを付与でき,コンテンツはユーザに付与されたタグ集合により特徴づ
けられる.ユーザはタグクラウド (コンテンツのタグ集合を一挙に表示する可視化手法) を見
ることでそのコンテンツの内容を推測したり,タグをたどって類似コンテンツを検索するこ
とが可能である.既に Annotea14) , del.icio.us15) ,flickr16) ,youtube17) など多くのシステムで取
り入れられている.音楽サービスとしては Last.fm18) が代表的であり,楽曲やアルバム,アー
ティストに対して,ジャンルや印象,聴きたい状況など自由にタグを付与することができる.
フォークソノミーには,様々な属性の語がタグという一種類のアノテーションとして付与さ
れることによる分類の粗さの問題がある.そこでフォークソノミーの柔軟性をもち,かつア
ノテーションの詳細な分類が可能である音楽アノテーションシステム19) が提案された.Web
上のユーザから図 8・2 のように楽譜中に現れる音符や歌詞などの要素集合に対するアノテー
ションを収集する.収集するアノテーションの種類 (解説,印象,コードなど) は,ユーザに
より自由に設定可能であり,他のユーザが作成したアノテーションの種類を用いることもで
きる.
1--8--3 応用
楽曲鑑賞にアノテーションを利用する例として,MoodLogic24) と Musicream25) を挙げる.
MoodLogic は Web 上のユーザコミュニティと専門家によってテンポや印象情報を収集し,
「アップテンポなロック」や「ロマンチックなブルース」など,印象情報に基づく検索やプレ
イリスト生成が可能である.図 8・3 に示す Musicream は「流し楽曲」
「類似くっつき」
「メタ
プレイリスト」
「タイムマシン」といった機能による新しい音楽の聴き方を提供するシステム
であり,Marsyas の解析結果に基づいて実装されている.
次に楽曲制作にアノテーションを利用する例として CUIDADO (Content-based Unified Inc 電子情報通信学会 2010
電子情報通信学会「知識ベース」 ⃝
3/(5)
9 編(音楽情報処理)-- 1 章(基礎・境界))
図 8・3 Musicream
terfaces and Descriptors for Audio/music Databases available Online)26) を挙げる.CUIDADO
は楽曲ブラウジング・検索・オーサリングの支援を目指すプロジェクトである.音楽制作者
のための検索・編集・処理ツールである Sound Palette が提供されている.ユーザは楽曲ファ
イルをインポートするだけで自動でセグメント化された楽曲断片が利用可能になる.またテ
ンポの異なる二つの楽曲をミックスさせる際に,自動的にテンポを同期させるなど,音楽の
セマンティクスに基づいた編集を支援する.
Web 上のユーザとのコミュニケーションの場を提供するシステムとして,Pandora,Last.fm,
を挙げる.音楽のコミュニケーションサービスとして既に多くのユーザを集めているのが,前
述の Pandora や Last.fm といった SNS(ソーシャルネットワーキングサービス) である.SNS
とはインターネットを介して人と人のコミュニケーションをサポートするサービスである.
これらのシステムでは,楽曲の鑑賞履歴や楽曲の好き嫌いのフィードバック情報を用いてユー
ザプロファイルを作成し,協調フィルタリングによって類似する楽曲を好む他のユーザを発
見し紹介する.
■参考文献
1)
2)
3)
ID3v2, http://www.id3.org/
Gracenote: CDDB, http://www.gracenote.com
M. Good: MusicXML: An Internet-Friendly Format for Sheet Music, Proceedings of XML 2001 Conference, 2001.
c 電子情報通信学会 2010
電子情報通信学会「知識ベース」 ⃝
4/(5)
9 編(音楽情報処理)-- 1 章(基礎・境界))
4)
5)
6)
P. Bellini and P. Nesi:WEDELMUSIC Format: An XML Music Notation Format for Emerging Applications, Proceedings of WEDELMUSIC, pp.79-86, 2001.
B. S. Manjunath, P. Salembier, T. Sikora: Introduction of MPEG-7, Jorn Wiley&SonsLtd.,2002
北原鉄朗,橋田光代,片寄晴弘:音楽情報科学研究のための共通データフォーマットの確立を目指し
て,情報処理学会研究報告,2007-MUS-71,pp.149-154, 2007.
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
17)
18)
19)
20)
21)
22)
23)
24)
25)
26)
Dublin Core Metadata Initiative, http://dublincore.org/
Resource Description Framework(RDF), http://www.w3.org/RDF/
A. Swartz: MusicBrainz: a Semantic Web Service, Intelligent Systems, IEEE, Volume 17, Issue 1, pp.
76-77, 2002.
G. Tzanetakis and P. Cook. : MARSYAS: A Framework for Audio Analysis Organized Sound, Cambridge University Press 4(3), 2000.
X. Amatriain, J. Massaguer, D. Garcia and I. Mosquera: The CLAM Annotator:A Cross-platform Audio
Descriptors Editing Tool, Proceedings of ISMIR, 2005.
C. Cannam, C. Landone, M. Sandler and J. P. Bello.: The Sonic Visualizer: A Visualization Platform
for Semantic Descriptors from Musical Signals
Pandora Internet Radio, http://www.pandora.com/
J. Kahan, M. Koivunen, E. Prud’Hommeaux and R. Swick,: Annotea: An Open RDF Infrastructure for
Shared Web Annotations, Proceedings of WWW, 2001.
del.ico.us, http://del.icio.us/
Flickr, http://www.flickr.com/
YouTube, http://jp.youtube.com/
Last.fm, http://www.lastfm.jp/
梶克彦, 長尾確, 楽曲に対する多様な解釈を扱う音楽アノテーションシステム, 情報処理学会論文誌,
Vol.48, No.1, pp.258-273, 2007.
Google Image Labeler, http://images.google.com/imagelabeler/
L. v. Ahn and L. Dabbish: Labeling Images with a Computer Game, Proceedings of CHI, pp. 319-326,
2004.
E. L. M. Law, L. v. Ahn, R. B. Dannenberg, M. Crawford: TagATune: A Game for Music and Sound
Annotation, Proceedings of ISMIR, 2007.
M. I. Mandel, D. P. W. Ellis: A Web-Based Game for Collecting Music Metadata, Proceedings of ISMIR,
2007.
MoodLogic, http://www.moodlogic.com/
M. Goto and T. Goto: Musicream: New Music Playback Interface for Streaming, Sticking, Sorting, and
Recalling Musical Pieces Proceedings of ISMIR, 2005.
H.Vinet, P. Herrera and F. F. Pachet : The CUIDADO Project, Proceedings of ISMIR, 2002.
c 電子情報通信学会 2010
電子情報通信学会「知識ベース」 ⃝
5/(5)