MIDIにおけるメロディ情報を利用した繰り返し構造の検出

埼玉大学紀要 工学部 第39号 2006
107
速報
におけるメロディ情報を利用した繰り返し構造の検出
高田友則
橋口博樹
! ""# $%& はじめに
音を抽出する。ただし、音階のド
最近の音楽情報処理のニーズ拡大とともに、音楽家向け
の技術だけでなく、音楽家でない一般ユーザーが恩恵を
受けるような技術が注目されている 。コンピュータに
よる楽曲構造の理解、大量の楽曲集合からの検索技術や
リアルタイム音楽情景記述システム
の構築が取り組
まれている。著者らも、楽曲の音響信号をデータベース,
鼻歌をクエリ(検索要求)とした鼻歌検索に着手し,検
索手法の提案 や、データベースの圧縮を目的とし
た楽曲の要約 を行っている。
本研究では、音符相当表現である標準 ファイルを
'&( を 4 とし、そこか
ら半音上がるごとに " 上がるようにする。こうして、得
られた単音の系列を '
'"( '.( ' (( とする。ただ
し、 は曲の総フレーム数を表す。
無音部分を利用したグループ分け
一般的な楽曲では、構造の区切れ(6 メロ・7 メロの
間など( では歌が歌われていないということが多い。この
特徴を利用し、メロディートラックの連続する無音部分
の長さがある閾値以上のとき、構造が分かれていると判
断する。つまり、閾値より短い無音部分は同じ構造の一
部とみなす。6 メロ・7 メロといった楽曲の構造は、一
用い繰り返し構造を検出することを目的とする。音響信号
般に 3∼"4 程度に分かれているという先見知識に基づき、
が提案されている。$ の考え方に従って繰り返し構
連続する無音の長さを調整する。楽曲 、連続する無音
については、繰り返し構造、サビ検出の方法 '$( 造を検出するにあたり、まずは
のメロディトラッ
クの部分を解析対象とし、その無音部分を楽曲の構造の
切れ目として有効に利用する。
特徴量の抽出と問題の定式化
特徴量の抽出
ファイルからメロディートラック '一般的には )
トラック目( を取り出し、" フレームを "*"+ 秒として、
埼玉大学工学部情報システム工学科
&
,
, - .## ,
/
0
,/ , , 112/2#34 5
(原稿受付日:平成18年 4月17日)
の長さ を区切りとするグループの数を ' ( とす
ると、 が大きいほど ' ( は小さくなり、 が小さ
いほど ' ( は大きくなるので、 ' (
3 を満た
す最大の をその楽曲の無音長の閾値候補とする。しか
し、この があまり小さすぎると、構造の区切れでない
ような所で分けてしまう可能性があるので、 の下限を
'実装では 8 .4 ".# 秒( とし、
8 ! '! ' (
3 (
となる を閾値とする。閾値 による無音部分で分け
た互いに交わらない有音のグループ構造を
9'( 8 8 : ; " に含まれる無音区間の長さはいずれも以下
MIDIにおけるメロディ情報を利用した繰り返し構造の検出
とする。ここで上の互いに交わらないとは、
108
8 : ;
8 : ; ' 8 ( に対して、
8 を意味する。
したがって、一般性を失うことなく 9'( の要素数を として
" 評価実験
「$%& 研究用音楽データベース:ポピュラー音楽と
著作権切れ音楽」 の計 ""# 曲の を対象に、前
節の方法で検出された繰り返し区間からサビ区間を特定
する。サビ区間の特定には、$ の方法のうち、
「曲中で多く繰り返される区間がサビである」という考
としてよい。
え方と、
「一般的な楽曲では、長い区間の繰り返しがあっ
繰り返しの検出
た場合、その末尾の部分がサビである可能性が高い」と
8 ' ( と 8 ' ( に
対して、一致度 ' ( を
! Æ' ( ' ( 8
! Æ' ( 整数の数列
いう特徴を利用している。なお、""# 曲の正解のサビ区
間は、一人の人間が聴いて作成した。また、評価方法も
$ の評価方法 に準じ、再現率 '> (、
適合率 ' > (、および両者を統合した 値
' > /( で評価する。
8 .<
正しく検出したサビ区間の長さの合計
8
正解のサビ区間の長さの合計
と定義する。ただし Æ ' ( は、 と に関するクロネッ
8 : ; 9'( に 対 し て 、 8
' (( の部分列 '
( とその変換 '
(
カーのデルタを表す。明らかに、4
任意の ' ( " である。
' '"( '.( '
( を次のように定義する。
8
正しく検出したサビ区間の長さの合計
検出した区間の長さの合計
'
( 8 ' '( ' < "( '((
'
( 8 '4 ' < "( '( ' < .( '( '( '((
"> ! '
( 8 ' ' < "( '( ' < .( ' < "( '( ' "((
? 4+ ? 43# 6 & すなわち、 '
( は単純な の部分列であり、 '
( は
3+
)3
31 始点からの相対音高列、 '
( は階差音高列である。さ
らに、
'
( 8 ' '
( '
((
'
( 8 ' '
( '
((
'
( 8 ' '
( '
((
によって有音区間に対して、音高に基づく類似度を定義
する。また、= マッチングによる類似度 を
4 から "
に正規化して定義し直した類似度を '
( とする。
こ れ ら の 準 備 の 下 、楽 曲 の 切 れ 目 構 造
から、各
' 8 " (
9'( 8
に類似する要
素を集めた部分集合を作る。
8 9'( '
(
ただし、 は 8 " のいずれかを利用するが、
は完全マッチングなので 8 43 とし、 は伸
縮が考慮された
= マッチングなので、43 よりも多少
小さい 4# を採用した。
3)
34
3)
)#
.+
1+
@. ".. @2+ " に を用いたときの 値が 4+ 43#
を超えた ""# 曲中の曲数を示す。音響信号を扱った $/
は 43# の(正答)曲が 24 曲であり、本
実験結果は を扱っているにもかかわらず、それに
勝っていない。これは、メロディトラックのみを扱った
ことが原因と考えられ、他のトラックを含めた方法に改
良する必要性を意味する。これについては今後の課題と
したい。
謝辞
本研究の一部は,平成 "3 年度埼玉大学 ." 世紀総合研究
プロジェクト経費による支援を受けて行われた.
埼玉大学紀要 工学部 第39号 2006
109
'""(
参考文献
'"(
後藤真孝 リアルタイム音楽情景記述システム> 全体
構想と音高推定手法の拡張 情処研報音楽情報科学
.444/-,/13/.@ "+ .444
'.(
後藤真孝 リアルタイム音楽情景記述システム:サビ
区間検出法 情報処理学会 音楽情報科学研究会 研究報告
.44./-,/)3/+ A
.44. B
"44 .3/1) .44.
'1(
後藤真孝
,C0,C:サビ出し機能付き音
楽視聴機 情報処理学会 インタラクション .441 論
文集 @/"+ .441
')(
後藤真孝 平田圭二 音楽情報処理の最近の研究 日
'#(
後藤真孝 橋口博樹 西村拓一 岡 隆一
本音響学会誌
A
+4 B
"" +3#/+2" .44)
$%& 研究
用音楽データベース:ポピュラー音楽データベース
と著作権切れ音楽データベース 情処研報音楽情報
科学
'+(
.44"/-,/)./+ 1#/). .44"
橋口博樹 西村拓一 張 建新 滝田順子 岡隆一 モ
デル依存傾斜制限型の連続 = を用いた鼻歌入力に
よる楽曲信号のスポッティング検索 電子情報通信学
会論文誌
'3(
A
52)// B
". .)3@/.)22 .44"
橋口博樹 工藤雅志 クロマ類似度を用いた音楽デー
タベースの圧縮 埼玉大学紀要 第
.44#
12 号 ..D.+
'2( B E $
7 F
/
=
6
6
$ .441 %
6/
, =
6
6
/
B G
> "2#/"22 .441
'@( B E E 5 H
5 I F
0 $ , ,
$ E J - , &
=
/
=
,$ .44" .""D."2 .44"
'"4(
西村拓一 橋口博樹 関本信博 張建新 後藤真孝 岡
隆一 始端特徴依存連続 = を用いた鼻歌入力によ
る楽曲信号のスポッティング検索の高速化 情報処
理学会音楽情報科学
A
)./. 3/") .44"
大津展之 判別および最小 . 乗法基準に基づく自動
しきい値選定法 信学論 '(
"@24
5+1/ ) 1)@/1#+
'".( $K & 5 $ 7/
. "@3@