ギブスサンプリングを用いたインタラクティブ作曲手法

ギブスサンプリングを用いたインタラクティブ作曲手法の提案
白井 亨∗1
谷口 忠大∗1
A proposal of an interactive music composition system
Akira Shirai∗1
, Tadahiro Taniguchi∗1
Abstract
– Recently, music composition using computer software is gathering attentions. Many people want to compose their original music. However, musical composition
is still too difficult for beginners to obtain their favorable original music. In this paper,
we propose a novel method for generating a melody by using a generative probabilistic model using Gibbs sampler. Furthermore, users can modify the composed music by
interacting with the generation process. This method enables users to create their favorable melodies. We also evaluate the probabilistic music composition method by several
experiments.
Keywords : 芸術・エンタテイメント,知覚・認知,感性・感覚・情動,身体的インタラクション,イ
ンタフェースデザイン
1.
はじめに
ないという問題がある.
このような問題に対して対話型進化計算を用いユー
現在,パソコンの高性能化などによって作曲環境を
ザの感性をシステムに取り入れて対話的にユーザの曲
手軽に手にいれることができるようになった.またフ
想に合う楽曲を生成する研究が行われている [3] .この
リーの作曲支援ツールなども多く存在し,初心者に
方法を用いることでユーザは自分の曲想に合う楽曲を
とって手のつけやすいものになったと言える.しかし,
生成することができると言われる.安藤らの研究では
実際に作曲を行うためには様々な音楽的知識が必要で
作曲を本職とした人向けのシステムを開発しており実
あり,これを持っていない音楽初心者にとっては作曲
際にプロの作曲家から一定の評価を得ている [5] .また
は未だに気楽に取り組めるものではない.また,作曲
鈴木らは立体音響の中で仮想的な空間を歩くという方
のツール自体も複雑な物が多く,初心者にとってすべ
法で音楽初心者のユーザでも直感的に作曲を行うこと
ての機能を使いこなすのは困難である.結局,環境は
ができるシステムを提案している [4] .梶原らの研究で
容易く導入できるが作曲に至るまでには作曲を行う側
は現代音楽の作曲技法である 12 音技法による作曲を
に相当な学習が必要であり多くの人々はその入り口地
対話型進化計算を用いて実現している [6] .対話型進化
点で躓いてしまうのが現状である.よって,音楽知識
計算以外の自動作曲手法では日本語の韻律を制約とし
を持たない人間の代わりに音楽ルールを学習したコン
て動的計画法により自動作曲を行うという手法を提案
ピュータが作曲を行うことで楽曲の複雑な構造を理解
している [7] や,ニューラルネットワークを用いて楽曲
していなくても作曲を行うことのできるシステムの開
の構造とイメージを結びつけ,入力されたイメージか
発が望まれている.
ら最適な楽曲を進化計算によって生成する手法 [8] ,楽
そこで,音楽知識を持たない人々でも手軽に作曲を
曲をマルコフ確率場で表現し,ある作曲家の特徴を特
行うことが出来る自動作曲システム [1] [2] が開発され
徴関数で表わすことでその作曲家風の楽曲を生成する
ている.自動作曲システムではユーザが楽曲イメージ
手法 [9] ,カオスニューラルネットワークを用いて新し
(ジャズ風,沖縄風,明るい,暗いなど)を選ぶこと
いメロディーを連続的に生成する手法 [10] などがある.
でそのイメージに合う楽曲を生成することが出来る.
これらの手法では音楽初心者でも手軽に作曲が行える
しかし,一般的な自動作曲システムでは楽曲イメージ
ように工夫がなされている.しかし,まず対話型進化
はあらかじめ用意されたものに限られ,その中にユー
計算による作曲手法では解として数十秒から数分ある
ザの望むイメージがなかった場合作曲を行うことが出
メロディーをすべて聞いて評価することになりユーザ
来ない.また,楽曲に対して感じるイメージというも
の疲労が増大してしまうため,結果的に世代数を少な
のは人によって違うと考えられ,イメージから作曲さ
くする必要があり適切な解に近づけないという問題が
れた楽曲が必ずしもユーザの感性と一致するとは限ら
ある.また,対話型進化計算以外の手法では動的計画
*1:立命館大学
*1:Ritsumeikan Univ.
法を用いることが多いが,動的計画法を用いる場合,
大域的な評価値などを加えると式が複雑化していき解
ノートナンバー),持続,休符などの情報が格納され
の探索が困難になってしまうという問題がある.また,
る.ノートを1オクターブに制限した場合の状態集合
同じ入力に対しては同じ結果が返ってくるために多様
は RS = {60, 61, ..., 72, 1000, 1001} となる.ここで 60
性が損なわれるという問題がある.
∼72 は基準となるドの音から完全 8 度上のドまでを
そこで本研究では以上の問題点を踏まえ,ギブスサ
表す MIDI ノートナンバーであり 1000 と 1001 はそれ
ンプリングを用いたインタラクティブ作曲手法を提案
ぞれ持続と休符を表すものとして使用した.また,c
する.本提案手法ではギブスサンプリングにより楽曲
にはコード名が格納される.コードの状態集合 Rc は
を確率的に生成することで式が複雑化するのを避け,
コーパスの種類によって変化する.
様々な評価値を容易に導入することが可能となる.ま
楽初心者でも手軽に負担を感じることなく趣向にあっ
2. 3
情報抽出
次に楽曲コーパスより音高の遷移確率を抽出する.
あるコード上での音高遷移確率は以下の式で表わさ
た楽曲を生成することを目指す.
れる.
た,システムとユーザのインタラクションによって音
2.
2. 1
提案手法
p(Si |Si−1 , ci ) =
手法概要
C(ci , Si−1 , Si )
C(ci , Si−1 )
(1)
ただし C(S) はコーパス上に存在する S の数を表す.
ここでコーパスの量が十分であればこのままで良い
のだが,コーパスの量が十分でない場合には不確かな
遷移や存在しない遷移が現れてしまうという問題があ
る.よって,不確かな遷移に対してはコード上でのバ
イグラム音高遷移確率以外の確率をコーパスより抽出
し遷移確率のスムージングを行い,存在しない遷移に
bigram
対してはベースライン補正を行う.抽出するのはそれ
ぞれコード上での音高出現確率 puni,oncode ,コード情
報のない音高出現確率 puni,of f code ,コード情報のな
い音高遷移確率 pbi,of f code ,ノートをすべて C 上に移
動した場合の音高遷移確率 pbi,degree である.また式
図 1 提案手法の概念図
本研究で提案する手法の概念図を図 1 に示す.まず
は既存楽曲を蓄えた楽曲コーパスを定義する.この楽
曲コーパスには複数の歌手による楽曲を保存しておく
ものとする.次に楽曲コーパスより抽出した情報をも
とにメロディーを生成する確率モデルを構築する.確
率モデルからのメロディー生成にはギブスサンプリン
(1) のコード上での音高遷移確率を pbi,oncode とする.
それぞれ以下の式で表す.
puni,oncode (Si |Si−1 , ci ) = p(Si |ci ) =
C(Si )
(3)
puni,of f code (Si |Si−1 , ci ) = p(Si ) = ∑
i C(Si )
pbi,of f code (Si |Si−1 , ci ) = p(Si |Si−1 ) =
グという手法を用いる.ギブスサンプリングを複数回
行うことで複数のメロディーを生成する.ここで生成
メロディーに様々な制約を与えることも可能であり,
C(ci , Si )
(2)
C(ci )
pbi,degree (Si |Si−1 , ci ) =
C(Si−1 , Si )
(4)
C(Si−1 )
C(d(Si , ci ), d(Si−1 , ci ))
(5)
C(d(Si−1 , ci ))
今回は見本楽曲からの情報を音楽理論 GTTM による
ここで d(・,・) は第二引数で与えられるコード上の音で
グルーピング構造とし,これを制約として用いた.こ
ある第一引数の音をコード C 上の音に変換する関数
れらの生成されたメロディーに対してユーザがインタ
である.
ラクションを行うことでユーザの趣向に合った楽曲を
生成していく.
2. 2 楽曲コーパス
既存楽曲をアーティスト毎にデータ化し蓄積した
ものを楽曲コーパスとして定義する.楽曲はメロデ
存在しない遷移に対しては以下の式を足し合わせる
ことでベースライン補正を行う.
1
pbaseline =
λ
ここで λ はノートの取り得る状態数を表す.
(6)
ィーのノート列 S = (S1 , S2 , ..., SN ) とコード列 c =
以上の式を用いてスムージングを行うのだが,その
(c1 , c2 , ..., cN ) のように N 次元のベクトルで表現され
際にそれぞれの重みを wR として表しどの確率に重み
る.S には 8 分音符長ごとにメロディーの発音 (MIDI
を置くかを決定する.最終的な式は次のようになる.
p̂(Si |Si−1 , ci ) =
∑
∑
wR pR
(7)
R
た,グルーピング構造は本来階層的な構造をとるため
exGTTM でも階層構造を求める過程が存在している
wR = 1
(8)
が,本研究では構造の切れ目となり得る部分の抽出の
みを行った.
R
ただし,R = {(uni, oncode), (uni, of f code)
次からグルーピング構造 Z の抽出方法を記す.まず
, (bi, oncode), (bi, of f code), (bi, degree), (baseline)}
である.
2. 4 音楽理論 GTTM によるグルーピング構造
楽曲コーパスより抽出された音高遷移確率を用いた
作曲は言わば当たり障りのない平均的なメロディーを
作り出すものである.しかし,本研究の目的はユーザが
は 4 つの基本変数を算出する.4 つの変数はそれぞれ,
消音時刻から次の発音時刻までの間隔 ρi ,発音時刻間
隔 ιi ,音高の差 ηi ,音価の差の絶対値 βi である.基
本変数はそれぞれ以下のように表わされる.
{
τi+1 − εˆi if τi+1 − εˆi >
=0
ρi =
0
otherwise
(9)
新たに望むメロディーの生成であり,平均的なもので
はない.もちろん生成されたメロディーに対してユー
ιi = τi+1 − τi
(10)
ザがインタラクションを行うことでユーザの曲想に近
ηi = fi+1 − fi
(11)
βi = |ιi+1 − ιi |
(12)
づけていくことが可能であると考えられるが,このま
まではユーザの負担が増えるという対話型進化計算と
同様の問題がおこってしまう.そこで生成されるメロ
ディーに対して生成時にある程度制約をかける必要が
ここで τi は i 番目の音の楽譜上の正規の発音時刻,εi
ある.この制約がユーザの感性を反映したものであれ
は i 番目の音の楽譜上の正規の消音時刻,εˆi は i 番目
ば生成される平均的なメロディーをユーザの感性に合
の音の実際の消音時刻,fi は i 番目の音の音高を表し
うメロディー方向に引っ張ることが可能であると考え
ている.時間の単位は 8 分音符長,音高の単位は半音
られる.本研究ではその制約として音楽理論 GTTM
である.なお,今回は正規の発音時刻と実際の消音時
によるグルーピング構造を用いた.
刻との差はどの音符でもすべて一定とした.
簡約,プロロンゲーション簡約という4つのサブ理論
GPR2,3 は連続する 4 音(n1 , n2 , n3 , n4 )に関する
ルールである.i 番目の遷移(i 音目と i + 1 音目の間)
が各ルールにより生じる境界の深さは,境界になりう
の内のひとつであり,連続したメロディーをフレーズ
るかそうでないか(0 or 1)で表わされる.
グルーピング構造とは音楽理論 GTTM
[11]
に含ま
れているグルーピング構造,拍節構造,タイムスパン
やモチーフなどの構造に分割するものである.GTTM
GPR2a(スラー/休符)では,n2 の終わりから n3
は音楽知識のある人間がどのように楽曲の構造を認知
の始まりまでの時間間隔が n1 の終わりから n2 の始ま
しているかに着目した理論であり,旋律の区切りとリ
りまでの時間間隔および,n3 の終わりから n4 の始ま
ズムや韻律をもとに,旋律や和声を本質的な部分と装
りまでの時間間隔よりも長い場合,グループの境界と
飾的な部分に区分する手順が提案されている.この理
認識される.GPR2a は次式のように定式化できる.
{
1 if ρi−1 < ρi and ρi > ρi+1
(13)
D2a (i) =
0 otherwise
論で抽出された情報は人間の感性に基づいていること
から,GTTM によってユーザの曲想に合う既存楽曲
から抽出された情報を制約とすることで生成されるメ
ロディーをユーザの曲想に近づけることができると考
えられる.
GPR2b(アタックポイント)では,n2 の始まりか
ら n3 の始まりまでの時間間隔が n1 の始まりから n2
グルーピング構造の抽出には浜中らの exGTTM [12]
の始まりまでの時間間隔および,n3 の始まりから n4
を用いる.exGTTM とは浜中らにより提案された計
の始まりまでの時間間隔よりも長い場合,グループの
算機実装用にルールを再形式化した GTTM の計算機
境界と認識される.GPR2b は次式のように定式化で
モデルである.本研究では簡単化のため exGTTM の
きる.
{
グルーピング構造抽出過程を簡略化して使用する.具
体的には構造化のためのルール GPR1,2,3,4,5,6 の内
D2b (i) =
2,3 のみを用いる.さらに GPR3 については細かく
1 if ιi−1 < ιi and ιi > ιi+1
0 otherwise
(14)
3a,3b,3c,3d というルールがあるが,このうち 3a,3d の
みを用いる.なお GPR2 も細かいルール 2a,2b が存在
するが,こちらは両方用いることとする.まとめると
GPR3a(音高差)では,n2 ,n3 の音高差が n1 ,n2
および n3 ,n4 の音高差よりも大きい場合,グループ
の境界と認識される.GPR3a は次式のように定式化
使用するルールは GPR2a,2b,3a,3d の 4 つとなる.ま
できる.
{
D3a (i) =
1 if |ηi−1 | < |ηi | and |ηi | > |ηi+1 |
(15)
0 otherwise
GPR3d(音価)では,n2 と n3 が異なった音価で,
n1 と n2 および n3 と n4 が同じ音価の場合,グループ
の境界と認識される.GPR3d は次式のように定式化
できる.
p(Z|S)p(S|β)
′
′
S ′ p(Z|S )p(S |β)
p(S|Z, β) = ∑
(19)
しかし,この式のままでは例えば 8 小節のメロディー
を生成する場合ノートの種類数 12 を 8 小節のノート
列の次元 64 でべき乗した分(1264 )もの確率をすべ
て計算する必要があるため計算量が膨大になってしま
うという問題がある.そこでギブスサンプリングとい
{
う手法を用いることでこの問題を解決する.
1 if βi−1 = 0, βi =
| 0, and βi+1 = 0
(16)
2. 6 ギブスサンプリングによる楽曲生成
0 otherwise
ギブスサンプリング [13] とは以下のようにサンプリ
以上の式で求まった D2a , D2b , D3a , D3d を 8 分音符
ングを行う手法である.まずサンプリングしたい確率
を基準とするベクトル形式に変換したものをそれぞれ
分布 p(z) = p(z1 , ..., zM ) を考る.ギブスサンプリン
グルーピング構造 Z2a , Z2b , Z3a , Z3d とする.
グの各ステップでは,1つの変数の値が置き換えられ
2. 5 確率モデル
る.その際,残りの変数の値を固定した条件での,対
ここまでで抽出した情報とノート列の確率モデルを
象の変数の条件付き分布に従って抽出した値を用いる.
作成する.なおここでは計算を容易にするためグルー
すなわち,zi を分布 p(zi |z\i ) から抽出された値で置
ピング構造による制約が1つ Z の場合を考える.まず
き換える.ここで zi は z の i 番目の要素を表し,z\i
は音高の遷移確率からメロディーが生成されるモデル
は z1 , ..., zM から zi を除いたものを表す.この手続き
を考える.このモデルを bigram(β) で表わすと下式の
は,各ステップで更新する変数をある決まった順序で
ようになる.
循環するか,ある分布に従ってランダムに選択するこ
N
−1
∏
とで繰り返される.ギブスサンプリングのアルゴリズ
p(S|β) =
p(St+1 |St , ct+1 )p(S1 , c1 )
(17)
ムを次に示す.ここで M はデータ数を T は繰り返す
t=1
ステップ数を表す.
つまりメロディーは次のコードが分かっている上での
D3d (i) =
ノートの遷移確率から生成されることになる.この生
成されたノート列 S に対してグルーピング構造を求め
るのだが,確率モデルに組み込むために本来決定論的
に求まるグルーピング構造を多次元ガウス分布から確
率的に生成されるものと仮定し,以下の式で表わすこ
ととする.
p(Z|S) = √ 1N√
( ( 2π) |Σ|
)
1
t −1
× exp − 2 (Z − µ(S)) Σ (Z − µ(S))
(18)
ここで µ(S) は生成されたノート列 S から抽出された
グルーピング構造を表す.多次元ガウス分布の分散共
分散行列 Σ の値を変化させることでグルーピング構
造による制約の強さを調整することが可能である.
◆ギブスサンプリング◆
1. zi : i = 1, ..., M を初期化する.
2. τ = 1, ..., T に対して以下を行う.
(τ +1)
∼ p(z1 |z2 , z3 , ..., zM ) をサンプリング
(τ +1)
∼ p(z2 |z1
- z1
する.
- z2
グする.
≀
(τ )
(τ )
(τ +1)
, z3 , ..., zM ) をサンプリン
(τ +1)
(τ +1)
- zj
∼ p(zj |z1
サンプリングする.
(τ )
(τ )
(τ )
(τ +1)
(τ )
(τ )
, ..., zj−1 , zj+1 , ..., zM ) を
≀
(τ +1)
(τ +1) (τ +1)
(τ +1)
- zM
∼ p(zM |z1
, z2
, ..., zM −1 ) をサンプ
リングする.
上記のアルゴリズムを繰り返すことで求めたい確率
図 2 の確率モデルに対してベイズの定理を用いるこ
分布 p(z) からのサンプルを少ない計算量で得ること
とでノート列 S の生成モデルを得ることができる. こ
ができる.アルゴリズムを完成させるためには初期状
態の分布を指定する必要があるが,多くの繰り返しの
後に抽出されるサンプルは実質的に初期分布とは独立
である.
ギブスサンプリングを行う過程では変化させる確率
変数に依存しない項を無視することができるためとて
図 2 グルーピング構造の生成モデル
れによってノート列 S の周りの情報から次式のように
ノート列自身の分布を推定することができる.
も簡単な式でノート列の生成確率を表わすことができ
る.まずは上式を次のように変化させる部分 Si とそ
れ以外の部分 S\i に分ける.
p(Si = k|S\i , Z, β)
(20)
ギブスサンプリングの為には p(Si = k|S\i , Z, β) と
p(Si = l|S\i , Z, β) の比が求まればよいので分母や k
に依存しない項は無視することができる.よって上式
生成されたメロディーの中である音
ERS =
は次のように表わすことができる.
p(Si = k|S\i , Z, β) ∝ p(Z|Si = k, S\i )
×p(Si = k|Si−1 , ci )p(Si+1 |Si = k, ci+1 )
(21)
とでメロディーの生成を行うことができる.
また,今回のように制約が複数ある場合は次のよう
に単純な掛け合わせで計算することが可能である.
×p(Z3a |Si = k, S\i )p(Z3d |Si = k, S\i )
×p(Si = k|Si−1 , ci )p(Si+1 |Si = k, ci+1 )
2. 7
生成されたメロディーの全音の合計
(23)
生成されたメロディーの中である度数
上式にギブスサンプリングのアルゴリズムを用いるこ
p(Si = k|S\i , Z2a , Z2b , Z3a , Z3d , β)
∝ p(Z2a |Si = k, S\i )p(Z2b |Si = k, S\i )
(持続,休符を含む)が出現する回数
(22)
インタラクション
本提案手法で行うことのできるシステムとのイン
JRd =
跳躍する遷移が出現する回数
生成されたメロディーの全遷移の合計
た だ し RD
=
(24)
{p1, m2, M 2, m3, M 3, p4, a4 −
d5, p5, m6, M 6, m7, M 7, p8} である.
3. 1
結果
以下に重み wR を変化させた場合の結果を示す.生
成するメロディーのコード進行を Dm7 → G → Em →
Am とし,遷移確率による影響を見るために制約の強
さを表す Σ の分散成分を 10 とし十分弱くした.また,
サンプリング回数を 100 回とした.wR の設定を以下
の3種類とした.
設定1 wR = {0.99, 0, 0, 0, 0, 0.01}
設定2 wR = {0.59, 0.1, 0.1, 0.1, 0.1, 0.01}
設定3 wR = {0.19, 0.1, 0.1, 0.1, 0.5, 0.01}
タラクションは大きく分けて2つあり,1つ目はメロ
ディーの生成前に行う生成を行うためのデータセット
の設定,2つ目は生成後に行う生成メロディーに対す
る修正操作である.
まず生成前に行う設定として,使用コーパスの選択,
グルーピング構造のための見本楽曲の選択,コード進
行の選択がある.これらの設定を変えることでユーザ
は違った雰囲気のメロディーを得ることが可能である.
また,見本楽曲を自ら選ぶことである程度自分の思っ
ているメロディーを生成することが可能であると考え
られる.
図 3 ノートの出現確率(設定1)
次に生成後に行う生成メロディーに対する修正操作
について説明する.ギブスサンプリングはサンプリン
グを行う範囲を変えることも容易であり,ユーザが生
成されたメロディーに対して直したい部分とそうでは
ない部分を指定することで,直したい部分のみをもう
一度サンプリングすることを可能とした.よってユー
ザは生成されたメロディーが気に入らなかった場合,
一部分のみを再度作曲し直すことができ,気に入った
部分を残しての作曲が可能となっている.また,なか
なか良い結果がでない場合には制約の強さやコード進
行などのパラメータを変更することで生成結果に変化
を与えられると考えられる.
3.
図 4 跳躍の出現確率(設定1)
実験
図 3,5,7 はそれぞれ設定1,2,3で生成されたメ
音高の遷移確率を学習する際に設定する重み wR を
ロディーに出現するノートの確率を表し,図 4,6,8
変化させた場合に出力されるメロディーがどのように
はそれぞれ同様に生成されたメロディーに出現する跳
変化するかをノートの出現確率 E と跳躍の出現確率
躍の確率を表している.まずノートの出現確率を見る
J で比較した.
と pbi,oncode と pbaseline のみを用いた設定1(図 3)に
比べ,スムージングを行った設定2(図 5),設定3
(図 7)では持続音の確率が増え,休符の出現確率が
減っている.また,pbi,degree の重みを大きくした設定
3ではさらに休符の出現確率が減った代わりに黒鍵音
(C,G)の確率が増えている.
次に跳躍の出現確率を見ると設定1(図 4)では完
全1度の遷移,つまり同じ音へ遷移する確率が大きな
値を示しているが設定2(図 6),設定3(図 8)にな
るに連れて全体の確率が平坦になっている.
3. 2
図 5 ノートの出現確率(設定2)
考察
遷移確率のスムージングによる生成メロディーへの
効果について考察する.スムージングを行っていない
設定1では休符の出現確率が一番高く,なおかつ完全
1度の遷移が出現する確率が一番高い.これを見ただ
けでも生成されるメロディーは休みが多く同じ音の繰
り返しばかりのメロディーになってしまうと考えられ
る.比べて,スムージングを行った設定2,3では休
符の出現確率が押さえられ遷移確率も全体的に平坦に
近い形になっている.この傾向は設定3の方が強く多
様なメロディーを生成し得ると考えられる.しかし,
出現確率の方では黒鍵音の出現確率が増えており一
図6
跳躍の出現確率(設定2)
概にこの設定が良いとは言えず調整が難しいところで
ある.
4.
被験者実験
システムが生成するメロディーに対して何回修正操
作を行うことでユーザが満足するメロディーを得るこ
とができるか被験者 5 人に対して実験を行った.
4. 1
実験環境
まず,被験者に既存楽曲の情報を生成に利用するこ
とを説明した上で楽曲コーパスから好みの楽曲を選
択してもらう.次に選択された楽曲の各制約の強さ
図 7 ノートの出現確率(設定3)
Σ の分散成分を 0.3,コード進行を Dm7 → G → Em
→ Am,重み wR = {0.29, 0.1, 0.2, 0.2, 0.2, 0.01} とし
100 回ギブスサンプリングを行い生成確率の一番高い
メロディーを伴奏付きで被験者に提示した.被験者は
生成されたメロディーに対して修正操作を行うことが
でき,これを満足な結果が得られるまで繰り返す.こ
の際修正箇所は生成されたメロディーの楽譜を見なが
ら小節単位で指定でき一回の修正操作で1小節分のメ
ロディーを修正可能とした.修正を行う場合のサンプ
リング回数は 10 回としこちら生成確率の一番高いメ
ロディーを伴奏付きで被験者に提示した.
4. 2
結果
表 1 は各被験者が制約として使用した見本楽曲と修
図8
跳躍の出現確率(設定3)
正を行った回数を示したものである.5人中4人が1
回の修正で生成メロディーに満足し,被験者4に関し
ては最初にでてきたメロディーで満足であるという結
表 1 使用した見本楽曲と修正回数
クションによって新たな制約を加えて修正を行うなど
が考えられる.
被験者
見本楽曲
修正回数
被験者1
冷たい頬(Spitz)
1回
また,確率モデルの学習部分では重み wR をどのよ
被験者2
空も飛べるはず(Spitz)
1回
うな比率で与えるかで生成結果が大きく変化すること
被験者3
被験者4
被験者5
硝子の少年(KinKi
Kids)
Stage of the ground(Bump of Chicken)
君が思い出になる前に(Spitz)
1回
0回
が示された.しかし,重みを変化させたことで生成結
1回
果が良くなったかを評価することは難しく,今後も最
適な重みを求める問題について考える必要があるだろ
果になった. 図 9 に被験者4の実験で生成されたメ
う.今後,さまざまなインタラクションを考えていく
とともに,直感的にインタラクションを行うことので
きるインタフェースについても検討していく.これに
よって音楽知識のないユーザが直感的操作で楽曲の深
い部分に関わり,望む楽曲を容易に生成できるシステ
ムの構築を目指す.
参考文献
図 9 被験者4の生成メロディー
ロディーを示す.
4. 3
考察
本提案手法で行ったインタラクションの有効性につ
[1] 音楽研究所: 自動作曲システム ACS,
http://hp.vector.co.jp/authors/VA014815/music/autocomp.html
[2] 鵜飼利彦: Juice and Candy 3.33,
http://www.vector.co.jp/soft/win95/art/se309509.html
[3] 高木英行,畝見達夫,寺野隆雄: 対話型進化計算法の
研究動向,人工知能学会誌,Vol.13, No.5, pp.692-703
(1998).
[4] 鈴木鈴璽,三輪真生,有田隆也: 歩いて創る音楽−立
いて考察する.今回の結果を見る限りではどの被験者
もほぼ修正回数1回で生成メロディーに満足しており,
[5]
本提案手法により構築したシステムはユーザの望む楽
曲を生成できたと考えられる.しかし,これはあくま
で確率モデルの性能によるものと思われ,インタラク
ションに関してはどの程度の性能を示したか分からな
い.今回のインタラクションは1小節単位での修正と
いうとても限定的なものであり,インタラクションと
して不十分であろう.実際に被験者から「もっと細か
く修正部分を指定したい」,
「リズムを変えたい」など
の意見も上がっている.以上より,インタラクション
pp.77-87 (2005).
[6] 梶原悠介,前田陽一郎: 遺伝的アルゴリズムを用い
た 12 音技法に基づく音列自動生成システム,知能と
情報(日本知能情報ファジィ学会誌),Vol.5,No.5,
pp.792-803(2009).
[7] 深山覚,中妻啓,米林裕一郎,酒向慎司,西本卓也,小
野順貴,嵯峨山茂樹: Orpheus: 歌詞の韻律に基づ
いた自動作曲システム,情報処理学会研究報告,2008MUS-76,pp.179-184,2008.
[8] 秋口俊輔: ソフトコンピューティング手法を用いた
に関してはよりユーザの意思を反映させることのでき
る手法を考える必要があるだろう.
[9]
5.
まとめ
本稿では既存楽曲からギブスサンプリングにより確
率的にメロディーを自動生成する仕組みにユーザがイ
ンタラクティブに介入を行う事でユーザの曲想を取り
込みつつ柔軟にメロディーを生成するシステムの提案
を行い,また実験により当該手法の有効性を検証した.
被験者実験の結果から,本提案手法により構築した
システムが生成したメロディーはユーザを満足させる
ことが可能であることが示された.しかしながら,こ
れは確率モデルの性能によるものであると考えられ
る.被験者の意見などからインタラクション手法につ
いてより改善が求められるだろう.具体的には修正を
完全にサンプリングまかせにするのではなくインタラ
体音響を活用した音の適応度地形上の歩行に基づく対
話型進化計算−,MYCOM2008.
安藤大地,Palle Dahlstedt, Mats G.Nordahl, 伊庭
斉志: 対話型 GP を用いたクラシック音楽のための
作曲支援システム,芸術科学会論文誌,Vol.4, No.2,
[10]
曲印象からの楽曲自動生成システムの構築,知能と
情報(日本知能情報ファジィ学会誌),Vol.5,No.5,
pp.782-791(2009).
住田浩之,林朗: マルコフ確率場を用いた自動作曲,
情報処理学会研究報告,2008-MUS-74(27),pp.151156(2008).
徳丸正孝,村中徳明,今西茂: 「記憶と忘却」を繰り
返し発想し続けるシステム−記憶パターン更新型カオ
スニューラルネットワークと作曲システムへの応用−,
知能と情報(日本知能情報ファジィ学会誌)Vol.19,
No.3,pp.299-312(2007)
[11] Lerdahl, F. and Jackendoff, R.: A Generative Theory of Tonal Music, The MIT Press, Cambridge
(1983).
[12] 浜中雅俊,平田圭二,東条敏: 音楽理論 GTTM に基
づくグルーピング構造獲得システム,情報処理学会論
文誌,Vol.48, No.1, pp284-299 (2007).
[13] C.M. ビショップ (2008)『パターン認識と機械学習 下』
シュプリンガージャパン株式会社,257pp
付録
表 A· 1 楽曲コーパスリスト
Bump of Chicken
001001 Stage of the ground
001002 Title of mine
001003 ダンデライオン
001004 ベル
001005 メロディーフラッグ
001006 天体観測
001007 K
001008 ダイヤモンド
001009 ハルジオン
001010 ベンチとコーヒー
Spitz
002001
002002
002003
002004
002005
002006
002007
002008
002009
002010
002011
002012
002013
002014
002015
002016
002017
002018
002019
002020
ほうき星
004001
004002
硝子の少年
The Gospellers
003001
003002
ひとり
誓い
フェイクファー
バニーガール
ナナへの気持ち
ルナルナ
冷たい頬
夕陽が笑う、君も笑う
虹を越えて
渚
運命の人
涙がキラリ☆
君が思い出になる前に
空も飛べるはず
ロビンソン
チェリー
グラスホッパー
スパイダー
愛のことば
俺のすべて
楓
KinKi Kids
ジェットコースター・ロマンス