楽曲におけるドラムリズムパターン抽出

楽曲におけるドラムリズムパターン抽出
075737D:反田裕也 指導教員:姜 東植
• R& B
リズム & ブルースの略で、歌唱重視のジャンル。リ
ズムマシンなどの機器を使いドラムの演奏情報を入力
はじめに
1
近年、オンライン上での音楽配信サービスにより、大量
の楽曲を入手し聴くことが可能になっている。iTune Music
する楽曲が多い。
Store や Amazon などの配信サービスでは、第三者の評価
をもとに楽曲の推薦をし、人気がある楽曲の検索を容易に
している。また、ユーザーのダウンロード履歴をもとに、似
• ジャズ
19 世紀末から 20 世紀にかけて、アメリカ南部で黒人
たような行動を取った他のユーザーがダウンロードした楽
の民族音楽と白人のヨーロッパ音楽とが融合してでき
曲を紹介するサービスもある。このサービスにより、ユー
た音楽。オフビートの独特のリズム感、即興演奏など
ザーの好みの楽曲を提供しようとしている。
が特徴。
しかし、この方法ではあまり多くの人に聴かれなかった
2.2
離散フーリエ変換
り、配信されたばかりの楽曲など、ユーザーの評価が十分
離散フーリエ変換とは、本来アナログ信号、つまり連続
に得られていない楽曲に対しては機能しない問題がある。
そのため、、楽曲そのものから抽出した情報をもとに検索
した信号を対象にしたフーリエ変換を離散化したデジタル
する手法が注目されている。特に楽曲検索における 1 つの
信号に適用したものである。離散フーリエ変換により時系
指標となる音楽ジャンルを抽出することが有効的とされて
列データから、特定の周波数点や帯域でどのような強度の
いる。
信号を持つかを調べることができる。
楽曲データから音楽ジャンルを特定する研究には、ニュー
X(k) =
ラルネットワークや、マハラノビス距離 [1] などの手法を
用いた研究が既に存在する。我如古氏 [4] は楽曲の周波数
N −1
1 ∑
x(n)e−2πkn/N
N n=0
(1)
の推移から音楽ジャンルの特徴量を抽出し、一つの楽曲に
X(k) : 周波数成分, x(n) : 時間領域の信号, N : データ数
含まれるジャンルの割合の判別を行った。しかしながら、
e : ネイピア数, π : 円周率, j : 虚数単位
この方法では、多くの楽器からなる楽曲において、周波数
2.3
ドラム音と周波数の関係
の特徴をつかみづらいという問題があった。
注目するバスドラムとスネアドラムの音が、周波数とど
そこで本研究では、ジャンルを分ける三つの要素 (リズム、
メロディ、ハーモニー) のうちリズムに注目した。より適
のような関係があるのかを調べるため、二つのドラム音が
切なジャンル識別が行えるよう、使用頻度が高く、各周波
混在した楽曲データのスペクトログラムを示す。
数帯域で特徴的な 2 つのドラム (バスドラムとスネアドラ
ム) のリズムパターンを抽出することを目標とする。
基本概念
2
2.1
音楽ジャンル
音楽ジャンルはリズム、メロディー、ハーモニーといっ
た音楽的要素や、演奏の形態、文化、歴史的背景をもとに
分類されている。
本研究では特徴量を求めるジャンルをロック、クラシッ
ク、ジャズの 3 つとする。以下に各ジャンルの定義を示す。
[2]
• ロック
強いビートを特徴とするポピュラー音楽。電気的に増
幅した大音量のサウンドを特色とする。
図 1: ドラム音の周波数と振幅
1
図 1 からわかるように、0-150Hz と 150-250Hz の部分で
振幅が大きく変化していることがわかる。バスドラムより
スネアドラムの音のほうが高いので [3]、バスドラムの特性
周波数として 0-150Hz、スネアドラムの特性周波数として
150-250Hz に着目する。 ドラム音の抽出
3
3.1
抽出の手順
ドラム音抽出の手順を以下に示す。
(1) 入力 : wave 形式の楽曲データを入力する。
(2) ドラム音の強調 : 高音域をカットし、ドラム音を
強調する。
(3) フーリエ変換 : 0.2 秒ごとにフーリエ変換を行い、
周波数と信号の強度を求める。
(4) 最大値を算出 : 各周波数帯域 (0-150 と 150-250) で
単位時間あたりの最大値を求める。
(5) ドラム音推定 :(4) で求めた最大値のうち、閾値を
超えたものをドラム発音部とする。
(6) 標準パターン作成 :バスドラムを 1、スネアドラムを
2 として標準パターンを作成する。
4.2
実験
図 3: 標準パターン
標準化した結果、スネアドラムは特殊なパターンはなかっ
たが、バスドラムはジャンルごとに異なるパターンが見られ
た。そこで本実験では、バスドラムの発音部の間隔を求め、
2 つの間隔の並び方からジャンルごとに特徴の識別を行う。
3.1 で求めた標準パターンのうち、各ジャンルから 3 曲を学
習データとした。残り 7 曲で実験を行った。学習データのう
ち、ロックでよく見られたパターンは、”99”,”22,”26”,”33”
だった 。R&B で は 、”44”,”34”,”43”だった 。ジャズ で
は、”12”,”31”,”23”,”46”だった。
実験
4
4.1
ドラム音の標準パターン作成
3.1 で示した手順に従い、3 ジャンルの楽曲を 10 曲につ
いて、ドラムの標準パターンを作成する。この時、ドラム
図 4: 実験の概要
4.3
音が含まれる可能性が高い、楽曲開始から 1 分後を起点と
した 60 秒のデータを用いる。以下に一例を示す。
実験結果
上記のパターンが、各ジャンルの識別用データの中で現
れた割合を以下に示す。
図 5: 実験の概要
5
まとめ
識別データに含まれるジャンルごとのリズムパターンの
割合を求めることができた。今後 2 つの並びだけでなく、
図 2: 上:0-150Hz の最大値, 下:150-250Hz の最大値
3 つ 4 つのリズムパターンの特徴を用いることで、楽曲の
中に含まれるジャンルの識別を行うことが考えられる。こ
の方法によって、より適切なジャンル判別が行えると考え
られる。
参考文献
[1] 土橋祐亮, 北原鉄郎, 片寄晴弘 , ”音響信号を対象とし
たベースラインからの音楽ジャンル解析”, 情報処理学
会研究報告.SLP, 音声言語情報処理 2008(12),217-224
,2008.
[2] デ ジ タ ル 大 辞 泉,kotobank.jp/dictionary/daijisen/,
2010.11.19.
[3] ヤマハ楽器解体全書,www.yamaha.co.jp/plus/,2010.11.19.
[4] 我如古英人 ,”固有周波数推移による音楽ジャンル識
別”,琉球大学工学部情報工学科卒業論文,(2009).
[5] 仲西拓也,”リズムパターンを用いた音楽ジャンル判別”,
琉球大学工学部情報工学科卒業論文,(2007).