埼玉大学紀要 工学部 第39号 2006 107 速報 におけるメロディ情報を利用した繰り返し構造の検出 高田友則 橋口博樹 ! ""# $%& はじめに 音を抽出する。ただし、音階のド 最近の音楽情報処理のニーズ拡大とともに、音楽家向け の技術だけでなく、音楽家でない一般ユーザーが恩恵を 受けるような技術が注目されている 。コンピュータに よる楽曲構造の理解、大量の楽曲集合からの検索技術や リアルタイム音楽情景記述システム の構築が取り組 まれている。著者らも、楽曲の音響信号をデータベース, 鼻歌をクエリ(検索要求)とした鼻歌検索に着手し,検 索手法の提案 や、データベースの圧縮を目的とし た楽曲の要約 を行っている。 本研究では、音符相当表現である標準 ファイルを '&( を 4 とし、そこか ら半音上がるごとに " 上がるようにする。こうして、得 られた単音の系列を ' '"( '.( ' (( とする。ただ し、 は曲の総フレーム数を表す。 無音部分を利用したグループ分け 一般的な楽曲では、構造の区切れ(6 メロ・7 メロの 間など( では歌が歌われていないということが多い。この 特徴を利用し、メロディートラックの連続する無音部分 の長さがある閾値以上のとき、構造が分かれていると判 断する。つまり、閾値より短い無音部分は同じ構造の一 部とみなす。6 メロ・7 メロといった楽曲の構造は、一 用い繰り返し構造を検出することを目的とする。音響信号 般に 3∼"4 程度に分かれているという先見知識に基づき、 が提案されている。$ の考え方に従って繰り返し構 連続する無音の長さを調整する。楽曲 、連続する無音 については、繰り返し構造、サビ検出の方法 '$( 造を検出するにあたり、まずは のメロディトラッ クの部分を解析対象とし、その無音部分を楽曲の構造の 切れ目として有効に利用する。 特徴量の抽出と問題の定式化 特徴量の抽出 ファイルからメロディートラック '一般的には ) トラック目( を取り出し、" フレームを "*"+ 秒として、 埼玉大学工学部情報システム工学科 & , , - .## , / 0 ,/ , , 112/2#34 5 (原稿受付日:平成18年 4月17日) の長さ を区切りとするグループの数を ' ( とす ると、 が大きいほど ' ( は小さくなり、 が小さ いほど ' ( は大きくなるので、 ' ( 3 を満た す最大の をその楽曲の無音長の閾値候補とする。しか し、この があまり小さすぎると、構造の区切れでない ような所で分けてしまう可能性があるので、 の下限を '実装では 8 .4 ".# 秒( とし、 8 ! '! ' ( 3 ( となる を閾値とする。閾値 による無音部分で分け た互いに交わらない有音のグループ構造を 9'( 8 8 : ; " に含まれる無音区間の長さはいずれも以下 MIDIにおけるメロディ情報を利用した繰り返し構造の検出 とする。ここで上の互いに交わらないとは、 108 8 : ; 8 : ; ' 8 ( に対して、 8 を意味する。 したがって、一般性を失うことなく 9'( の要素数を として " 評価実験 「$%& 研究用音楽データベース:ポピュラー音楽と 著作権切れ音楽」 の計 ""# 曲の を対象に、前 節の方法で検出された繰り返し区間からサビ区間を特定 する。サビ区間の特定には、$ の方法のうち、 「曲中で多く繰り返される区間がサビである」という考 としてよい。 え方と、 「一般的な楽曲では、長い区間の繰り返しがあっ 繰り返しの検出 た場合、その末尾の部分がサビである可能性が高い」と 8 ' ( と 8 ' ( に 対して、一致度 ' ( を ! Æ' ( ' ( 8 ! Æ' ( 整数の数列 いう特徴を利用している。なお、""# 曲の正解のサビ区 間は、一人の人間が聴いて作成した。また、評価方法も $ の評価方法 に準じ、再現率 '> (、 適合率 ' > (、および両者を統合した 値 ' > /( で評価する。 8 .< 正しく検出したサビ区間の長さの合計 8 正解のサビ区間の長さの合計 と定義する。ただし Æ ' ( は、 と に関するクロネッ 8 : ; 9'( に 対 し て 、 8 ' (( の部分列 ' ( とその変換 ' ( カーのデルタを表す。明らかに、4 任意の ' ( " である。 ' '"( '.( ' ( を次のように定義する。 8 正しく検出したサビ区間の長さの合計 検出した区間の長さの合計 ' ( 8 ' '( ' < "( '(( ' ( 8 '4 ' < "( '( ' < .( '( '( '(( "> ! ' ( 8 ' ' < "( '( ' < .( ' < "( '( ' "(( ? 4+ ? 43# 6 & すなわち、 ' ( は単純な の部分列であり、 ' ( は 3+ )3 31 始点からの相対音高列、 ' ( は階差音高列である。さ らに、 ' ( 8 ' ' ( ' (( ' ( 8 ' ' ( ' (( ' ( 8 ' ' ( ' (( によって有音区間に対して、音高に基づく類似度を定義 する。また、= マッチングによる類似度 を 4 から " に正規化して定義し直した類似度を ' ( とする。 こ れ ら の 準 備 の 下 、楽 曲 の 切 れ 目 構 造 から、各 ' 8 " ( 9'( 8 に類似する要 素を集めた部分集合を作る。 8 9'( ' ( ただし、 は 8 " のいずれかを利用するが、 は完全マッチングなので 8 43 とし、 は伸 縮が考慮された = マッチングなので、43 よりも多少 小さい 4# を採用した。 3) 34 3) )# .+ 1+ @. ".. @2+ " に を用いたときの 値が 4+ 43# を超えた ""# 曲中の曲数を示す。音響信号を扱った $/ は 43# の(正答)曲が 24 曲であり、本 実験結果は を扱っているにもかかわらず、それに 勝っていない。これは、メロディトラックのみを扱った ことが原因と考えられ、他のトラックを含めた方法に改 良する必要性を意味する。これについては今後の課題と したい。 謝辞 本研究の一部は,平成 "3 年度埼玉大学 ." 世紀総合研究 プロジェクト経費による支援を受けて行われた. 埼玉大学紀要 工学部 第39号 2006 109 '""( 参考文献 '"( 後藤真孝 リアルタイム音楽情景記述システム> 全体 構想と音高推定手法の拡張 情処研報音楽情報科学 .444/-,/13/.@ "+ .444 '.( 後藤真孝 リアルタイム音楽情景記述システム:サビ 区間検出法 情報処理学会 音楽情報科学研究会 研究報告 .44./-,/)3/+ A .44. B "44 .3/1) .44. '1( 後藤真孝 ,C0,C:サビ出し機能付き音 楽視聴機 情報処理学会 インタラクション .441 論 文集 @/"+ .441 ')( 後藤真孝 平田圭二 音楽情報処理の最近の研究 日 '#( 後藤真孝 橋口博樹 西村拓一 岡 隆一 本音響学会誌 A +4 B "" +3#/+2" .44) $%& 研究 用音楽データベース:ポピュラー音楽データベース と著作権切れ音楽データベース 情処研報音楽情報 科学 '+( .44"/-,/)./+ 1#/). .44" 橋口博樹 西村拓一 張 建新 滝田順子 岡隆一 モ デル依存傾斜制限型の連続 = を用いた鼻歌入力に よる楽曲信号のスポッティング検索 電子情報通信学 会論文誌 '3( A 52)// B ". .)3@/.)22 .44" 橋口博樹 工藤雅志 クロマ類似度を用いた音楽デー タベースの圧縮 埼玉大学紀要 第 .44# 12 号 ..D.+ '2( B E $ 7 F / = 6 6 $ .441 % 6/ , = 6 6 / B G > "2#/"22 .441 '@( B E E 5 H 5 I F 0 $ , , $ E J - , & = / = ,$ .44" .""D."2 .44" '"4( 西村拓一 橋口博樹 関本信博 張建新 後藤真孝 岡 隆一 始端特徴依存連続 = を用いた鼻歌入力によ る楽曲信号のスポッティング検索の高速化 情報処 理学会音楽情報科学 A )./. 3/") .44" 大津展之 判別および最小 . 乗法基準に基づく自動 しきい値選定法 信学論 '( "@24 5+1/ ) 1)@/1#+ '".( $K & 5 $ 7/ . "@3@
© Copyright 2024 Paperzz