楽曲におけるドラムリズムパターン抽出 075737D:反田裕也 指導教員:姜 東植 • R& B リズム & ブルースの略で、歌唱重視のジャンル。リ ズムマシンなどの機器を使いドラムの演奏情報を入力 はじめに 1 近年、オンライン上での音楽配信サービスにより、大量 の楽曲を入手し聴くことが可能になっている。iTune Music する楽曲が多い。 Store や Amazon などの配信サービスでは、第三者の評価 をもとに楽曲の推薦をし、人気がある楽曲の検索を容易に している。また、ユーザーのダウンロード履歴をもとに、似 • ジャズ 19 世紀末から 20 世紀にかけて、アメリカ南部で黒人 たような行動を取った他のユーザーがダウンロードした楽 の民族音楽と白人のヨーロッパ音楽とが融合してでき 曲を紹介するサービスもある。このサービスにより、ユー た音楽。オフビートの独特のリズム感、即興演奏など ザーの好みの楽曲を提供しようとしている。 が特徴。 しかし、この方法ではあまり多くの人に聴かれなかった 2.2 離散フーリエ変換 り、配信されたばかりの楽曲など、ユーザーの評価が十分 離散フーリエ変換とは、本来アナログ信号、つまり連続 に得られていない楽曲に対しては機能しない問題がある。 そのため、、楽曲そのものから抽出した情報をもとに検索 した信号を対象にしたフーリエ変換を離散化したデジタル する手法が注目されている。特に楽曲検索における 1 つの 信号に適用したものである。離散フーリエ変換により時系 指標となる音楽ジャンルを抽出することが有効的とされて 列データから、特定の周波数点や帯域でどのような強度の いる。 信号を持つかを調べることができる。 楽曲データから音楽ジャンルを特定する研究には、ニュー X(k) = ラルネットワークや、マハラノビス距離 [1] などの手法を 用いた研究が既に存在する。我如古氏 [4] は楽曲の周波数 N −1 1 ∑ x(n)e−2πkn/N N n=0 (1) の推移から音楽ジャンルの特徴量を抽出し、一つの楽曲に X(k) : 周波数成分, x(n) : 時間領域の信号, N : データ数 含まれるジャンルの割合の判別を行った。しかしながら、 e : ネイピア数, π : 円周率, j : 虚数単位 この方法では、多くの楽器からなる楽曲において、周波数 2.3 ドラム音と周波数の関係 の特徴をつかみづらいという問題があった。 注目するバスドラムとスネアドラムの音が、周波数とど そこで本研究では、ジャンルを分ける三つの要素 (リズム、 メロディ、ハーモニー) のうちリズムに注目した。より適 のような関係があるのかを調べるため、二つのドラム音が 切なジャンル識別が行えるよう、使用頻度が高く、各周波 混在した楽曲データのスペクトログラムを示す。 数帯域で特徴的な 2 つのドラム (バスドラムとスネアドラ ム) のリズムパターンを抽出することを目標とする。 基本概念 2 2.1 音楽ジャンル 音楽ジャンルはリズム、メロディー、ハーモニーといっ た音楽的要素や、演奏の形態、文化、歴史的背景をもとに 分類されている。 本研究では特徴量を求めるジャンルをロック、クラシッ ク、ジャズの 3 つとする。以下に各ジャンルの定義を示す。 [2] • ロック 強いビートを特徴とするポピュラー音楽。電気的に増 幅した大音量のサウンドを特色とする。 図 1: ドラム音の周波数と振幅 1 図 1 からわかるように、0-150Hz と 150-250Hz の部分で 振幅が大きく変化していることがわかる。バスドラムより スネアドラムの音のほうが高いので [3]、バスドラムの特性 周波数として 0-150Hz、スネアドラムの特性周波数として 150-250Hz に着目する。 ドラム音の抽出 3 3.1 抽出の手順 ドラム音抽出の手順を以下に示す。 (1) 入力 : wave 形式の楽曲データを入力する。 (2) ドラム音の強調 : 高音域をカットし、ドラム音を 強調する。 (3) フーリエ変換 : 0.2 秒ごとにフーリエ変換を行い、 周波数と信号の強度を求める。 (4) 最大値を算出 : 各周波数帯域 (0-150 と 150-250) で 単位時間あたりの最大値を求める。 (5) ドラム音推定 :(4) で求めた最大値のうち、閾値を 超えたものをドラム発音部とする。 (6) 標準パターン作成 :バスドラムを 1、スネアドラムを 2 として標準パターンを作成する。 4.2 実験 図 3: 標準パターン 標準化した結果、スネアドラムは特殊なパターンはなかっ たが、バスドラムはジャンルごとに異なるパターンが見られ た。そこで本実験では、バスドラムの発音部の間隔を求め、 2 つの間隔の並び方からジャンルごとに特徴の識別を行う。 3.1 で求めた標準パターンのうち、各ジャンルから 3 曲を学 習データとした。残り 7 曲で実験を行った。学習データのう ち、ロックでよく見られたパターンは、”99”,”22,”26”,”33” だった 。R&B で は 、”44”,”34”,”43”だった 。ジャズ で は、”12”,”31”,”23”,”46”だった。 実験 4 4.1 ドラム音の標準パターン作成 3.1 で示した手順に従い、3 ジャンルの楽曲を 10 曲につ いて、ドラムの標準パターンを作成する。この時、ドラム 図 4: 実験の概要 4.3 音が含まれる可能性が高い、楽曲開始から 1 分後を起点と した 60 秒のデータを用いる。以下に一例を示す。 実験結果 上記のパターンが、各ジャンルの識別用データの中で現 れた割合を以下に示す。 図 5: 実験の概要 5 まとめ 識別データに含まれるジャンルごとのリズムパターンの 割合を求めることができた。今後 2 つの並びだけでなく、 図 2: 上:0-150Hz の最大値, 下:150-250Hz の最大値 3 つ 4 つのリズムパターンの特徴を用いることで、楽曲の 中に含まれるジャンルの識別を行うことが考えられる。こ の方法によって、より適切なジャンル判別が行えると考え られる。 参考文献 [1] 土橋祐亮, 北原鉄郎, 片寄晴弘 , ”音響信号を対象とし たベースラインからの音楽ジャンル解析”, 情報処理学 会研究報告.SLP, 音声言語情報処理 2008(12),217-224 ,2008. [2] デ ジ タ ル 大 辞 泉,kotobank.jp/dictionary/daijisen/, 2010.11.19. [3] ヤマハ楽器解体全書,www.yamaha.co.jp/plus/,2010.11.19. [4] 我如古英人 ,”固有周波数推移による音楽ジャンル識 別”,琉球大学工学部情報工学科卒業論文,(2009). [5] 仲西拓也,”リズムパターンを用いた音楽ジャンル判別”, 琉球大学工学部情報工学科卒業論文,(2007).
© Copyright 2024 Paperzz