歌詞情報を用いた歌の感情抽出手法の提案

歌詞情報を用いた歌の感情抽出手法の提案
10871131 山田 彬 (灘本研究室)
あらまし:本研究では楽曲の歌詞から感情語を抽出し,その楽曲がどの感情ベクトルを持っ
ているか決定することを目的としている.具体的には歌詞中の単語と感情表現辞典の単語と
を比較し,共通する単語の数により楽曲の感情ベクトルを決定する.
1.はじめに
3.予備実験
現在パソコン上で音楽の再生・管理をするソ
フト「iTunes」や「Windows Media Player」な
どの普及により,パソコンから手軽にダウンロ
ードでき,歌を持ち運べるようになっている.
歌詞も同様にデジタルオーディオプレーヤーの
中に歌詞を入れて手軽に持ち運べるようになっ
ている.また歌詞については「歌ネット」や
「うたまっぷ」のような歌詞サイトの普及によ
り歌詞が重要視されつつあり,歌詞を詩や小説
のように読むことを目的とする人や歌詞の良さ
を色々な人と共有する人が増えてきている[1].し
かしながら,現在楽曲を選択する際は,歌詞よ
りもアーティストやメロディーで選択している
のが事実であり,検索システムにおいてもアー
ティストやメロディーでの検索しかなく,歌の
感情を用いた検索はない.そこで,本研究では,
歌詞から感情を示す言葉である感情語を抽出し,
中村明の提案する感情表現辞典[2]の単語と比較す
ることにより歌詞の示す感情を求める手法を提
案する.これにより,アーティストやメロディ
ーに偏らない,歌詞の持つ感情から歌を検索す
ることが可能となる.
3.1 実験内容
歌詞の感情を仮決定するために予備実験を行
った.被験者 9 名(20 代男性 4 名,女性 5 名)
で任意に選曲した楽曲 100 曲に対して,静かな
場所で 1 人の時に平常心を保って実験を行った.
被験者はまず歌詞を読み,次に歌詞が 10 次元の
どの感情ベクトルを持っているか 1 つ選択する.
被験者が選択した感情ベクトル(以下,正解デ
ータ)と提案手法が決定した感情ベクトルを比
較する.
3.2 感情ベクトルの除外
予備実験の結果,正解データにおいて「厭,
怖,怒,恥,驚」の 5 次元の感情ベクトルはほ
ぼ無いことが判明した.よってこの 5 次元を除
外した「喜,好,安,哀,昂」の 5 次元で歌詞
の感情を決定することにする.正解データを閾
値 22%以上とし,提案手法が決定した感情ベクト
ルの上位 2 位まで見たときの結果を表 1 に示す.
2.提案手法の概要
歌詞を形態素解析[3]をすることにより,単語の
原形を取得する.取得した単語の原形と感情表
現辞典の単語とを比較し共通の単語を抽出する.
抽出した単語を感情表現辞典の 10 次元の感情ベ
クトル「喜,好,安,哀,厭,怖,怒,恥,昂,
驚」にそれぞれ振り分ける.感情語を一番多く
持つ感情ベクトルをその楽曲の感情とする. 歌
詞の単語(図 1 左図)と感情表現辞典の単語
(図 1 右図)とを比較する様子を図 1 に示す.
表 1.予備実験の結果
上位 2 位
適合率
再現率
F値
43%
45%
44%
3.3 提案手法の結果と予備実験の結果の比較
実験の結果は,適合率は 43%,再現率は 45%,F
値は 44%であった.全体的に抽出できた感情語が
少なく,図 2 のように提案手法では感情語を抽
出できなかった歌詞が存在した.この問題を解
決するために,感情表現辞典の拡張を行う.
グロウアップ
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
喜
好
安
哀
人
図 1.歌詞の単語と辞典の単語との比較例
誕生日
100%
昂
提案手法
喜
好
安
哀
人
昂
提案手法
図 2.被験者実験の結果と提案手法の結果の比較
語を抽出できなかった楽曲(図 2)があったが,
感情表現辞典を拡張したことによって図 4 のよ
予備実験により感情表現辞典の拡張の必要性
が判明した.そこで感情表現辞典の拡張を行う. うに感情語を抽出できるようになり,正解デー
タとも一致した.
様々な拡張方法がある中で,歌詞には「出発」
を「たびだち」と読むように当て字が存在する
ため,本研究では類語辞典を用いて拡張を行う. 100%
グロウアップ
誕生日
100%
Yahoo! 辞書の類語辞典「必携類語実用辞典」[4]
90%
90%
80%
80%
を用いて感情表現辞典の全 1097 単語を 1 単語ず
70%
70%
60%
60%
つ検索し,出力された類語を感情とは関係のな
50%
50%
い単語を手作業で除外して辞典に登録し拡張す
40%
40%
30%
30%
る.拡張の様子を図 3 に示す.拡張の結果は,
20%
20%
平均約 1.8 倍の拡張に成功した.
10%
10%
4.感情表現辞典の拡張
0%
0%
喜
好
安
哀
人
昂
提案手法
喜
好
安
哀
人
昂
提案手法
図 4. 拡張後の被験者実験結果と提案手法の結果の比較
感情表現辞典を拡張することによってF値を向
上させることができた.感情表現辞典の単語は
歌詞には使われない単語が多かったため,感情
表現辞典の一般的な用語への対応が必要である.
本研究では英文に対する感情の振り分けは行っ
ておらず,英文を考慮する必要がある.さらに,
「晴れない」などの否定語は形態素解析時に
「晴れる」と「ない」に分割され,「晴れる」
のみが感情ベクトルに付与されるため,否定語
の考慮も必要である.
感情ベクトル
拡張前(個)
感情ベクトル
拡張後(個)
喜
231
喜
389
好
224
好
456
安
116
安
200
哀
250
哀
418
昂
276
昂
467
図 3.感情表現辞典の拡張
5 感情表現辞典拡張後の評価実験
5.1 実験内容
感情表現辞典の拡張を行った後,3 章と同様
の実験を行った.なお,正解データは 3 章の結
果を用いる.実験の結果を表 2 に示す.
表 2.予備実験の結果
上位 2 位
適合率
再現率
F値
41%
70%
51%
5.2 提案手法の結果と評価実験の結果の比較
実験の結果は,適合率は 41%,再現率は 70%,
F値は 51%であった.3 章での予備実験では感情
6.おわりに
本研究では歌詞情報から感情表現辞典を基に
感情語を抽出し,歌詞がどの感情ベクトルを持
っているか決定した.予備実験を行ったことに
よって「厭,怖,怒,恥,驚」の 5 次元の感情
ベクトルは歌詞において人が抱かない感情だと
判明した.さらに感情表現辞典の拡張を行った.
今後の課題は以下の通りである.
① 感情表現辞典の一般的な用語への対応
② 否定語に対する感情語の振り分け
③ 状況によって変化する単語の考慮
④ 英文への対応
参考文献
[1].オリコンエンタテインメント株式会社,
“ORIGINAL CONGIDENCE”, オリコ
ン・エンタテインメント, 平成 23 年 9 月 12
日号
[2].中村明,“感情表現辞典”,東京堂出版
[3].黒橋禎夫,河原大輔“日本語形態素解析シ
ステム JUMAN”,
<http://nlp.kuee.kyotou.ac.jp/nlresource/juman.html>,平成 21 年 9 月
[4].Yahoo! 辞書 類語辞典“必携 類語実用辞
典”,<http://dic.yahoo.co.jp/>