乳幼児の歌唱様音声の韻律的・音響的特徴

乳幼児の歌唱様音声の韻律的・音響的特徴
甲南女子大学
坂井康子
要旨
日本では明治時代以降,急速に西洋音楽がもたらされ,西洋音楽一辺倒とさ
え言われる時代を迎える。その結果,現在子どもたちの環境にある歌のほとん
どは,諸外国の旋律に日本語歌詞をあてはめた歌か,少なからず西洋音楽の影
響を受けた歌である。大人が提供している既成の歌は,子どもの間で自発的・
自然発生的に歌われるうた(わらべうた)とはかけ離れたものも少なくない。
こ う し た 中 で ,子 ど も が ど の よ う に 歌 い 始 め る か ,子 ど も は 歌 い た い こ と ば( 日
本語)をどのように歌おうとするのかといった乳幼児の自発的な歌唱に関する
研究は進んでいない。
そこで本稿では,乳幼児期の自発的な歌唱様音声の韻律的・音響的特徴に関
する研究をおこなった。まず研究の前提として,日本人が「歌唱様(歌ってい
る )」と 判 断 す る 音 声 の 韻 律 的 特 徴 を 分 析 し ,音 声 長 が 長 い ,末 尾 が 上 昇 す る 傾
向があることを検出した。続いて喃語期の音声,および語彙(日本語)獲得後
の音声の聴取テストをおこなった結果,各々「歌っている」とする評価の高い
音声は比較的音声長が長く,また末尾が上昇する傾向がみられた。さらに,歌
唱 様 音 声 の 音 響 的 な 特 徴 を 明 ら か に す る 試 み と し て ,感 情 性 の 分 類 を お こ な い ,
機嫌の悪い音声と歌唱様音声の音響的な差異を示した。
1.はじめに
乳幼児の音声研究の初期には,喃語と言語の間でつながりが無いとさえ言わ
れたほど乳幼児音声はとらえにくく,喃語自体や,喃語と言語の関係について
は不明な点が多い。しかし諸外国はもとより近年日本でも,発語前の音声に関
す る 研 究 が 進 め ら れ て い る [1-10] 。 乳 児 は ま ず , 言 語 音 声 を メ ロ デ ィ ー と し て
認 識 し ,そ の 後 文 節 的 特 徴 を 理 解 し て い く と さ れ [ 1 1 ] ,乳 幼 児 音 声 の セ グ メ ン テ
ーションにかかわる音声の長さやリズム,ピッチの動きなどの韻律の分析が,
音声の発達を研究する上で重要な課題となっている。これまでの乳幼児音声の
分析のほとんどは言語分野からのアプローチであったが,筆者は,乳幼児の音
声を言語に向かうものとしてだけではなく,歌唱をも含むものとして音響的に
と ら え ,研 究 を お こ な っ て き た [ 1 2 - 2 2 ] 。乳 幼 児 の 音 声 は ,言 語 的 要 素 を ほ ぼ 持 た
ないその出発点で最大限の音響的特徴を有し,とらえどころの無いすべての可
能性をもつ状態からまとまりをつくるようになる。そしてそこにはリズムや特
徴 的 な 動 態 が う ま れ ,こ と ば に 似 た 音 声 の ほ か ,
「 う た 」と 聴 き 取 る こ と が で き
る音声も確認されるようになる。
本 稿 で は ,乳 幼 児 の 音 声 に お け る「 う た( 歌 唱 様 音 声 )」の 韻 律 的 ・ 音 響 的 特
徴を探るために,まず次章で我々日本人がどのような特徴について「歌ってい
る」と判断しているかを聴取調査により明らかにし,次に第 3 章で,喃語から
言語への過渡的な時期に 3 音まとまって発せられる音声を分類し,歌っている
評価の高い音声の韻律的特徴を分析した。さらに第 4 章で,語彙獲得後の幼児
の歌唱様音声を感情性の分類の中で位置づけ,うたであると知覚される音声の
韻律および音響的特徴について分析した。
なお,
「 音 」,
「 音 節 」,
「 拍 」,
「 モ ー ラ 」な ど の 用 語 は 指 す も の が ジ ャ ン ル に よ
って異なるが,本稿では,人の音声における一つのおと自体を「音」と呼び,
「 音 節 」は 音 声 学 で 用 い る「 シ ラ ブ ル 」の こ と を 指 し ,
「 拍 」は リ ズ ム の 1 単 位
を指し,
「 モ ー ラ 」は 日 本 語 の 長 さ の 基 本 的 な 1 単 位 を 指 す 。喃 語 期 の 一 つ の お
と は「 音 」,言 語 獲 得 後 の 1 単 位 の お と を「 モ ー ラ 」と 呼 ぶ 。音 楽 の「 拍 」と の
混同を避け,本稿では「拍」を「拍節」のみに用いる。
2 .「 歌 唱 様 」 と 知 覚 す る 判 断 基 準 の 検 出
日本語獲得期の乳幼児の歌唱に関しては,音声の分析や分類の試みがなされ
[23-28]
,乳 幼 児 は 発 語 以 前 に す で に 歌 っ て い る と い う 可 能 性 が 示 唆 さ れ て い る [ 2 7 ] 。
しかし「歌っている」とする判断の基準やばらつきについてはこれまで明確に
さ れ て い な い 。 そ こ で 本 章 で は , 歌 唱 様 音 声 の 特 徴 を 探 る 前 提 と し て ,「 う た 」
であると知覚する判断基準について調べることにした。幼児の自然音声を用い
て聴取調査をおこない,音声のどのような特徴がことばと聴き取られ,また,
うたと聴き取られているのかを,被験者へのアンケートおよび対象音声の音響
分析をもとに考察する。
二 つ の 聴 取 調 査 [16]に は , 3 歳 児 と 4 歳 児 が 発 声 し た 長 時 間 の 音 声 資 料 の 中 か
ら ,( 1 ) で は 同 一 の 音 韻 で 韻 律 の 異 な る 音 声 を 用 い ,( 2 ) で は 1 フ レ ー ズ 中
に音声的特徴が変化する音声を選んで用いた。調査に用いたこれらの音声はい
ずれも既成のことばや歌ではなく,自発的,即興的に発せられた音声である。
ま ず 聴 取 調 査 ( 1 ) に 用 い た 3 歳 4 ヵ 月 女 児 ( 1976 年 大 阪 府 生 ま れ , 同 府 で
生 育 )に よ る 一 連 の 自 然 音 声( 約 27 秒 )は ,母 と 子 の 日 常 的 な 会 話 音 声 で あ る 。
こ の 中 で 女 児 は <や ま ず し す し の こ >と い う 単 語 を 6 回 , そ れ ぞ れ 異 な る 韻 律 で
発音している。
「 こ と ば 」あ る い は「 う た 」の よ う に 聴 こ え る こ の 音 声 を 含 む 母
子 の 会 話 を 109 名 の 被 験 者 に 約 20 回 聴 取 し て も ら い ,同 時 に 会 話 の 内 容 を 印 刷
し て い る 回 答 用 紙 の <や ま ず し す し の こ >の 部 分 に , そ れ ぞ れ こ と ば で あ る と 聴
くか,うたであると聴くか記入してもらった。聴取後にどのような点が判断の
基準になったかを記述するよう依頼した。
聴取調査(1)の結果,表 1 に示したように「やまずしすしのこ」音声①~
⑥は「ことば」あるいは「うた」であると判断された。①の音声はことばかう
たかの判断が分かれたが,②,④,⑥の音声は多数の被験者に「うた」と,③
と⑤は「ことば」ととらえられた。
表1
①~⑥の「やまずしすしのこ」をそれぞれ「ことば」または「うた」と
聴取した人の割合(%)
( 被 験 者 数 109 名 , 網 掛 け は 多 数 回 答 )
やまずしすしのこ
①
②
③
④
⑤
⑥
ことば
うた
どちらとも言えない
49.5
49.5
0.9
13.8
84.4
1.8
91.7
8.3
0
0.9
97.2
1.8
99.1
0.9
0
3.7
95.4
0.9
聴 取 後 の 記 述 欄 で は , う た と 聴 こ え る 音 声 の 特 徴 と し て 「 長 さ の 延 長 」,「 高
さ の 変 化 ,特 に 語 尾 の 上 昇 」に 関 す る 記 述 が 多 く 得 ら れ た 。
「 長 さ の 延 長 」を 指
摘 し た 被 験 者 は , 記 述 し た 101 名 中 53 名 で ,「 高 さ の 変 化 , 特 に 語 尾 の 上 昇 」
を 指 摘 し た 被 験 者 は 同 41 名 で あ っ た 。こ れ ら の 両 方 の 特 徴 を う た と 聴 こ え る 理
由 と し て 挙 げ て い る 被 験 者 は 22 名 で あ っ た 。
聴 取 調 査( 1 )の 結 果 と 実 際 の 音 声 と を 比 較 す る た め ,6 回 く り 返 さ れ た「 や
ま ず し す し の こ 」 音 声 の 各 々 の ピ ッ チ 曲 線 を 抽 出 し た ( 図 1 ) 。 分 析 は 「 SUGI
SpeechAnalyzer( 杉 藤 美 代 子 監 修 ア ニ モ 2000)」 を 用 い て お こ な っ た 。
図1
聴取調査(1)で用いた音声「やまずしすしのこ」①から⑥の音声波
形(上段)とピッチ曲線(下段)
図 1 のピッチ曲線を見ると,まず大多数の被験者にうたであると聴き取られ
た②④⑥において「長さの延長」と「語尾の上昇」がみられた。②の「しーす
し 」,④ の「 す し ー の 」⑥ の「 こ ー 」の 部 分 が 引 き 延 ば さ れ て お り ,① ② ④ ⑥ は
末 尾 の「 の 」か ら「 こ 」へ 上 昇 し て 終 わ っ て い る 。ま た ,
「やまずしすしのこっ
て 書 い て あ る 」と 発 音 さ れ て い る ⑤ の「 や ま ず し す し の こ( 網 掛 け が 高 い )」が
この語の本来の高低アクセントであると考えられることから,④と⑥で「やま
ずし」の「ず」から「し」にピッチがほぼ長 2 度上昇していることは,本来の
語アクセントから離れている。これらは,②と⑥のはじめの「や」と「ま」が
語アクセントに従わず,ほぼ同じ高さで発音されていること(わらべうたにお
いても,平板アクセントの語が歌われるときに,はじめの 2 モーラが同じ高さ
で 歌 わ れ る 傾 向 が あ る [29]) と 同 様 , う た と し て の 音 声 表 現 で あ ろ う 。 つ ま り ,
本来の語アクセントから離れて「旋律」を作っていると考えられる。
次に聴取調査(2)では,1 フレーズの中で音声的特徴が変化する音声を用
い て 聴 取 調 査 を お こ な っ た 。4 歳 0 ヵ 月 の 女 児( 1989 年 兵 庫 県 生 ま れ ,同 県 で
生 育 ) に よ る 音 声 (「 ほ た る の お な か を み ま し ょ う が あ る よ 」 約 5 秒 ) を ,「 う
た」と聴くか「ことば」と聴くか,また部分によって異なると聴こえる場合は
「 ど こ ま で が こ と ば で ど こ ま で が う た か 」を 尋 ね た 。音 声 の 長 さ に 合 わ せ て「 ほ
たるのおなかをみましょうがあるよ」と印刷した文字の下に,ことば,あるい
はうたと自由に書き込むよう依頼した。加えて,記入した際の判断理由を書く
よ う 依 頼 し た 。全 員 書 き 込 み 終 わ る ま で 約 20 回 聴 取 調 査( 2 )の 音 声 を 再 生 し ,
表2の結果を得た。
表2
「ほたるのおなかをみましょうがあるよ」を「ことば」
または「うた」と判断した区切り別の回答割合(%)
( 被 験 者 数 109 名 )
全体をことば
0.9
全体をうた
12.8
「ほたるのおなかをみましょう があるよ」
64.2
うた
「ほたるの
うた
あるいは
「ほたるの
うた
その他
ことば
おなかをみま
ことば
しょう
があるよ」
うた
ことば
10.1
おなかを
ことば
みましょう
うた
があるよ」
ことば
11.9
聴取調査(2)の判断理由については,音声が連続的に変化するため,回答
が困難であるとするものもあったが,聴取調査(1)と類似していた。
さらに聴取調査(2)に用いた「ほたるのおなかをみましょうがあるよ」の
音 声 を 音 響 分 析 し た 結 果 を 図 2 に 示 し た 。( 2 ) の 音 声 は 前 述 の ( 1 ) の 音 声
よりも判断が困難な理由として連続性をあげていたため,その結果を受けてピ
ッチ曲線だけでなく広帯域スペクトログラムによる分析も同時におこなった。
以下に,この音声がどのようなものかを,音声分析の結果に基づき解説する。
図2
聴取調査(2)で用いた音声「ほたるのおなかをみましょうが
あるよ」の音声波形(上段)とピッチ曲線(中段)および広帯域
スペクトログラム(下段)
ま ず 開 始 の「 ほ た る の ー 」の 部 分 は as 1 - e 1 - e 1 - h 1( 音 名:ド イ ツ 語 式 表
記 )に ほ ぼ 近 い 音 高 と し て 聴 き 取 ら れ ,
「 歌 声 」と と る こ と が で き る 共 鳴 の あ る
声 で あ る 。こ の 部 分 は ほ ぼ 全 員「 う た 」と す る 評 価 し て お り ,
「 ほ た る 」の 部 分
が , 同 児 の 発 話 よ り 少 し 長 い 各 モ ー ラ 約 300ms.( 以 下 ミ リ 秒 を ms.と 略 す ) 程
度であるのに対し,
「 の ー 」の 部 分 は 約 2 倍 程 度 の 長 さ で ,ほ ぼ 定 常 で あ り ,拍
節が感じられる部分である。次にことばと判断している人が一割程度みられた
「 お な か を( み ま )」の 部 分 は ,声 質 が 変 わ っ て「 話 声 」の 印 象 を 受 け る 音 声 で
あ る 。「 お 」 か ら 「 な 」 へ は 連 続 的 に 上 昇 し ,「 お な か を み ま し ょ 」 ま で は 各 モ
ー ラ が 同 児 の 日 常 発 話 と 同 じ 200ms.程 度 ,後 半 は 自 然 下 降 を し な が ら 推 移 す る 。
自然下降はことばの特徴であり,
「 お な か を み ま 」ま で は こ れ ら の 特 徴 か ら 発 話
的 な 特 徴 を 有 す る と 言 え よ う 。ま た ,ほ ぼ 全 員 が う た と 判 断 し た「 し ょ ー 」は ,
「 Sho」 の 「 o」 の 母 音 の ま ま お よ そ e 1 か ら c 1 へ 長 3 度 下 降 し た の ち , 800ms.
の間ほぼ同じ高さで延ばされており,この部分は声の高さは低いものの,引き
延ばしていることがうたとする評価を得た可能性がある。
「 し ょ ー ー 」と 延 ば し
た 後 ,「 が あ る よ 」 と の 間 に は 若 干 の 休 止 が 入 る 。「 ほ た る の お な か を み ま し ょ
う 」と い う 事 が「 あ る よ 」と い う 文 脈 で あ る と 考 え ら れ ,
「 が あ る よ 」の 部 分 は
ま た 200ms.程 度 で 短 く ほ ぼ 等 時 に 発 音 さ れ て お り ,「 こ と ば 」 と と ら え ら れ て
当 然 と 思 わ れ る 。 し か し 「 が 」 か ら 「 あ 」,「 あ 」 か ら 「 る 」,「 る 」 か ら 「 よ 」
は c1 - d1 - h1 - c1 に 近 い 音 高 に 推 移 し て お り , 最 後 の 「 よ 」 で 若 干 上 昇 し た
音声になっている。
これら二つの調査をまとめると,音声の引き延ばし,一定間の定常,末尾の
上昇がうたと聴き取られる特徴であると考えられる。また高い声,広い声域,
響く声がうたであるとする判断に影響している可能性がある。加えて聴取調査
(2)の結果から,幼児の音声にはことばとうたの特徴が混在するような部分
がみられることも示唆された。
3.喃語期の音声表出の実態
3.1.短い 3 音と長い 3 音
喃 語 期 の 音 声 を 分 析 す る に あ た っ て は ,様 々 な 要 素 を 考 慮 す る 必 要 が あ る が ,
本 章 で は ,第 2 章 の 結 果 を 受 け て ,喃 語 期 の 音 声 の 韻 律 的 側 面( リ ズ ム と 抑 揚 )
に 着 目 し て 分 析 を お こ な っ た 。言 語 発 達 と の 関 連 も 考 察 す る た め に 8 ヵ 月 齢( 喃
語 期 初 期 ),12 ヵ 月 齢( 一 語 発 話 期 の は じ ま り )と 喃 語 期 後 期 の 17 ヵ 月 齢( 二
語発話期のはじまり)という言語発達の著しい時期の喃語音声を中心にその後
の 月 齢 も 取 り 上 げ た [20]。 日 本 語 の 獲 得 過 程 に あ る 1 歳 前 後 の 子 ど も の 喃 語 や
日 本 語 の 音 声 表 現 に は ,3 音 ひ と ま と ま り の リ ズ ム フ レ ー ズ( 例 : / a -a -a / )が 特 徴 的 に み ら れ る こ と が 指 摘 さ れ て い る [ 2 3 , 2 4 , 2 7 , 2 8 ] 。3 音 の 音 声 の あ と に
休止を入れて 4 音のまとまりとしてとらえている場合もあるが,それには 4 音
という音数が音声表出の単位としてのまとまりをもたらしやすいという日本語
に 特 徴 的 な 枠 組 み が 機 能 し て い る こ と [ 3 0 ] も 考 え ら れ る 。筆 者 ら が 本 研 究 に 先 駆
け て お こ な っ た 縦 断 的 な 観 察 研 究 [ 1 4 , 1 5 ] に お い て も ,3 音 の 等 時 性 を 持 っ た リ ズ
ム を 感 じ さ せ る 音 声 表 現 が 頻 繁 に 確 認 さ れ た 。ま た ,幼 児 期 の 発 話 に お い て ,3
モ ー ラ の 音 声 が 最 も 多 い と い う こ と も 明 ら か に さ れ て い る [ 3 1 , 3 2 ] 。こ れ ら の 先 行
研究の知見を手がかりにし,3 音ひとまとまりの音声に着目して分析をおこな
った。
本章において,数多くの音声から 3 音音声を抽出する必要があることから,
NTT 乳 幼 児 音 声 デ ー タ ベ ー ス ( N T T コ ミ ュ ニ ケ ー シ ョ ン 科 学 基 礎 研 究 所 ) の
音声ファイルを音声資料として用いた。このデータベースは,発話間の無声区
間 500ms.未 満 を 1 発 話( 資 料 に は 発 話 と 書 か れ て い る が ,喃 語 を 多 く 含 む )と
み な し ,5 児 146008 フ ァ イ ル を 有 し て い る( 発 話 音 声 フ ァ イ ル の フ ォ ー マ ッ ト
は ,量 子 化 ビ ッ ト 数 16 ビ ッ ト ,量 子 化 周 波 数 16kHz,モ ノ ラ ル の wav 形 式 )。
本 章 で は そ の う ち 4 児 ( sk, mk, sa, ma) の 8 ヵ 月 , 12 ヵ 月 , 17 ヵ 月 , 20 ヵ
月 , 24 ヵ 月 齢 の 音 声 を 使 用 し た 。
4 児の音声ファイルから 3 音と聴き取られる音声を抽出した。喃語期の音声
は変化に富み,音と音の区切りが不明瞭であることから,3 音音声の選択に当
た っ て は ,2 音 ,4 音 と 聴 き 取 ら れ た 音 声 も 同 時 に ピ ッ ク ア ッ プ し ,筆 者 を 含 む
研究者 2 名が慎重に協議しながら 3 音音声を選択した。音声の区切りについて
判断がつかないときは,音声の音響分析をおこない,広帯域スペクトログラム
の 画 像 上 で 判 断 し た ( 詳 細 は [20]参 照 )。
ピ ッ ク ア ッ プ し た 1019 の 3 音 音 声 を 以 下 の 手 順 で 分 類 し た 。ま ず ,3 音 が 比
較 的 等 時 の 音 声 ([ R] と す る ) と 3 音 の い ず れ か が 他 の 音 声 よ り 延 音 さ れ て い
る 音 声 に 分 け た 。 そ の の ち 前 者 を , 比 較 的 短 い 3 音 (「[ R] △ 」 と す る ) と , 3
音の各音に特殊モーラ様部分を含む短くない 3 音に分類した。等時ではない 3
音の方は,リズムがあると知覚される 3 音(R とする)とリズムがほとんど知
覚 さ れ な い 3 音 ( 0 と す る ) に 分 け た ( 表 3 )。
4 児 の 8 ヵ 月 , 12 ヵ 月 , 17 ヵ 月 , 20 ヵ 月 , 24 ヵ 月 齢 の 音 声 の [ R] と R と O
の割合は図3のようであった。
表3
3 音音声の分類の凡例
比較的等
時の 3 音
[R]
△
[R]
等時では
ない 3 音
R
短い等時の 3 音音声
(日本語の 3 モーラ相当,軽音節様音声)
短くない等時の 3 音音声
( [R]△ + 特 殊 モ ー ラ 様 部 分 , 重 音 節 様 音 声 )
リズムがあると知覚される長短のある 3 音音
声
リズムがほとんど知覚されない長短のある 3
音音声
O
100%
100%
80%
80%
60%
60%
40%
40%
20%
20%
0%
8 12 17 20 24
sk
8 12 17 20 24
8 12 17 20 24
mk
sa
8 12 17 20 24
0%
8 12 17 20 24
ma
sk
[R] R O
図3
4 児 の 3 音 音 声 中 の [R]と R と
O の割合の変化
8 12 17 20 24
sa
△
図4
8 12 17 20 24
mk
8 12 17 20 24
ma
△以外
4 児 の [R]中 の △ と △ 以 外 の
割合の変化
2 ヵ 月 ~ 17 ヵ 月 の 音 声 行 動 の 有 音 ・ 無 声 ・ 無 音 区 間 を 測 定 し た 不 破 ら に よ る
関 東 在 住 幼 児 の 研 究 [ 3 3 ] に お い て ,「 12 ヵ 月 か ら 17 ヵ 月 の 間 に 音 声 行 動 が 劇 的
に変化する」と指摘されているが,筆者らの研究で 3 音全体を分類した結果で
は 17 ヵ 月 で の 顕 著 な 変 化 は 見 ら れ な か っ た( 図 3 )。不 破 ら の 研 究 で ,
「有声区
間 長 は 12 ヵ 月 ま で は ほ ぼ 一 定 ( 470ms.前 後 ) で あ る が , 17 ヵ 月 で は 321ms.と
急激に短くなった」との分析結果を報告していることから,我々が対象とした
3 音等時音声中に短い 3 音音声(△)がどの程度出現するかを各月齢で比較し
た と こ ろ , 4 児 共 に 17 ヵ 月 齢 , あ る い は 20 ヵ 月 齢 に お い て 短 い 3 音 音 声 の 増
加 傾 向 が み ら れ た ( 図 4 )。 こ の こ と に よ り , 言 語 獲 得 期 に 増 加 し た 短 い 3 音
等時音声は言語とつながりがあると考えられる。つまり喃語の音声長の変化に
ついては,まず喃語期初期において乳児は,重音節様の音声を発声しやすかっ
たが,しだいに軽音節様の音声を発声することができるようになり,その延長
上において様々な単語を発話できるようになることが示唆される。
ここで△以外の重音節様の音声の実態が疑問として残される。重音節様の音
声は,将来「あんぱんまん」のような特殊モーラを含むことばになる音声,歌
っている音声,口に出して言いやすくて声を遊んでいる音声などの様々な可能
性が考えられるため,次節ではこの音声についてさらに分析をおこなう。
3.2.3 音音声の聴取テストと韻律の比較
前 節 で 用 い た 等 時 の 3 音 音 声 [R]か ら 歌 っ て い る と す る 評 価 の 高 い 音 声 を 検
出し,その韻律的特徴を分析する研究をおこなった。なお,前章で記述式での
回答を求めた場合を「聴取調査」とし,本章以降では段階評価による数値回答
を求めたため「聴取テスト」と呼ぶ。
研究の方法を以下に記す。
( 1)4 児 の 8 ヵ 月 ,12 ヵ 月 ,17 ヵ 月 齢 の 喃 語 の 3 音 等 時 音 声 の う ち ,8 ヵ 月 齢
は 1 児 に 良 い デ ー タ が 無 く 3 児 か ら 4 件 ず つ , 12 ヵ 月 齢 と 17 ヵ 月 齢 は 4 児 か
ら 10 件 ず つ , 計 92 の 音 質 の 比 較 的 良 好 な 音 声 を 選 定 し , こ れ ら を う た 度 評 価
のテスト音声とした。なお,試行時,音声に雑音等不具合がみつかり,最終的
に 88 件 の 音 声 と し た 。
( 2)関 東 の 学 生 37 名 と 関 西 の 学 生 38 名 に ,続 け て 3 回 ず つ ラ ン ダ ム 配 列 し た
テスト音声を聴取させ,
「 乳 幼 児 が 歌 っ て い る 」よ う に 聴 こ え た か ど う か を ,1.
「 ま っ た く 感 じ な い 」 か ら 6.「 と て も 感 じ る 」 の 6 段 階 で 記 入 さ せ た 。
上記の方法で聴取テストをおこなった結果,関東と関西の被験者の結果に大
きな差異がみられなかったことから,これらの結果を一括し,歌っていると感
じる度合い(以降うた度評価という)の高いものから低いものまで並べた。う
た 度 評 価 の 上 位 10 音 声 は 表 4 , う た 度 評 価 下 位 10 音 声 は 表 5 の と お り で あ っ
た。なお表4中の音声の書きおこし表記はデータベースの作成担当者によるも
のである。
表4
上位
1
2
3
4
5
6
7
8
9
10
う た 度 評 価 の 1 位 か ら 上 位 10 位 ( 上 位 10 音 声 )
書きおこし
1 音目
変化
2 音目
変化
ヘーヤーアー
中
―
中
/
ギャッタッタ
中
\
低
/
コンコンコン
高
\
中
\
カーカーカー
中
\
低
/
アーミッチェ
高
\
中
\
シーシーオー
中
\
低
/
エイヤイヤイ
中
―
中
―
シーシーオー
中
\
低
/
ウイーヨーウー
中
―
中
/
ウオーウーラ
中
/
高
\
3 音目
高
高
低
高
低
高
中
高
高
低
表5
う た 度 評 価 の 最 下 位 か ら 下 位 10 位 ( 下 位 10 音 声 )( △ : 短 い 3 音 音 声 )
下位
書きおこし
1 音目
変化
2 音目
変化
3 音目
1 △
オリタ
中
/
高
\
低
2 △
イキャグ
高
\
中
\
低
3
アアータ
低
/
高
\
中
4 △
ゴリタ
中
―
中
\
低
5 △
ウガユ
中
―
中
―
中
6 △
アハシ
中
/
高
―
高
7
アッアッア。
中
/
高
―
高
8
アルジャイヨー
低
/
中
―
中
9 △
コゲタ
中
\
低
―
低
10
オーンーオー
高
\
中
\
低
う た 度 評 価 の 上 位 と 下 位 の 音 声 を 音 響 分 析 ソ フ ト 「 praat( フ リ ー )」 を 用 い
て音響分析し比較した。
ま ず 上 位 と 下 位 で は 音 声 長 が 異 な り ,上 位 10 音 声 の 持 続 時 間 の 平 均 値 は 1.83
秒 ,下 位 10 音 声 の 持 続 時 間 の 平 均 値 は 0.83 秒 で あ り ,上 位 10 音 声 の 方 が 有 意
に 長 い (p<.001)結 果 で あ っ た ( 図 5 )。 下 位 10 音 声 の 平 均 持 続 時 間 は 上 位 10
音声より 1 秒近くも短く,日本語の 1 モーラの平均的な音声長(発話の状況に
よ る が ,200ms.前 後 と さ れ る )と ほ ぼ 同 じ 程 度 の 長 さ で あ っ た 。な お ,上 位 10
音 声 に は 短 い 3 音( △ )が 全 く 含 ま れ て い な い が ,下 位 10 音 声 に は 短 い 3 音( △ )
が 6 件 含 ま れ ( 表 5 の 下 位 1, 2, 4, 5, 6, 9 位 の 音 声 ), 音 声 長 が う た 度 評 価
に影響していることがわかる。
図5
う た 度 評 価 上 位 10 音 声 (top10)と ,
下 位 10 音 声 (last10)の 持 続 時 間 の 比 較
図6はうた度評価 1 位(左)および最下位(右)の音声分析画像である。1
位のピッチ曲線(狭帯域スペクトログラムに付している線)を見ると,第 1 音
と第 2 音の間で一秒程度のあいだ音声が平坦で,音の変動が少ない。これに対
し,最下位の音声は常時変動しており,音声の平坦な部分がみられない。また
図6の最下段にみられるように,うた度評価 1 位に比べ最下位の音声は音声長
が非常に短い。
図6
う た 度 評 価 1 位 の 音 声 (ヘ ー ヤ ー ア ー )(左 )と 最 下 位 の 音 声 (オ リ タ )(右 )
図の上から音声波形,ピッチ曲線(赤線)と狭帯域スペクトログラム,
広帯域スペクトログラム,および 3 秒に設定した中での同音声
ところで,前掲の表4,表5には高さの変化を表している。音響分析による
ピ ッ チ 抽 出 の 結 果 を も と に ,概 ね 200Hz 台 を 低 ,300Hz 台 を 中 ,400Hz 以 上 は 高
と し て い る が ,前 の 音 高 よ り ,30Hz 近 く 上 昇 ,ま た は 下 降 し た 場 合 は ,前 の 高
さ表記と変えるなどしているため,これらは最終的に 3 音の相対的な高さの関
係 を 示 し た も の と な っ て い る 。1 音 目 か ら 2 音 目 ,2 音 目 か ら 3 音 目 へ ど の よ う
に音声が動いているかということを「変化」列に線の上下で表した。
上 位 10 音 声 に つ い て は , 1 音 目 か ら 2 音 目 , 2 音 目 か ら 3 音 目 へ , 音 声 の 変
化にさまざまなパタンがみられるが,末尾が上昇するパタン(中―中―高,中
―低―高)の数が 6 例と最も多い。この末尾が高くなるパタンは,第 2 章で歌
唱 様 で あ る 特 徴 と し て あ げ , ま た 母 子 コ ミ ュ ニ ケ ー シ ョ ン の 中 で 頻 出 す る [14,
15]
抑揚である。3 位と 5 位の高―中―低の音声については,3 位の音声は短 3
度,長 2 度の下降と聴き取られ,5 位の音声は 1 音目にこぶし風の音声表現を
含み,2 音 3 音がすばやく安定して発声されていることが,それぞれうた度評
価 が 高 い 理 由 で あ る と 考 え ら れ る 。残 る 10 位 の 音 声 は 1 音 ず つ が 平 坦 に 発 声 さ
れ,長 2 度上昇ののち完全 4 度に比較的近い下降が特徴である。
表 5 の 下 位 10 音 声 で は , 上 位 10 音 声 に 多 く 見 ら れ た 末 尾 が 高 く な る パ タ ン
が 1 例 も み ら れ な い 。3 音 目 の 音 を め ぐ っ て は ,下 位 10 音 声 の 半 数 が 第 2 音 か
ら下降し,半数がほぼ第 2 音と同じ高さで推移している。このように下位の 3
音の抑揚は上位とは異なっており,抑揚がうた度評価に関係することが確認で
きる。
ピ ッ チ レ ン ジ , ピ ッ チ の 最 高 値 , 同 最 低 値 は い ず れ も 上 位 10 音 声 が 下 位 10
音声を上回ったが,有意差は認められなかった。2 ヵ月齢時の音声について聴
取 実 験 を お こ な っ た 研 究 [9. p.85]に お い て も 「 歌 」 の 方 が ピ ッ チ の 最 高 値 が 高 く
ピッチレンジも広いとの結果が出ており,これと同様の結果であった。
4.ことばの音声表現―「おかあさん」音声の韻律的・音響的特徴
前章において,3 音等時音声の中でうた度評価の高い音声を抽出した結果,
その音声の特徴が第 2 章で示した歌唱様音声の韻律の特徴と合致した。本章で
はさらに,語彙(日本語)獲得後の音声を聴取テストにより分類し,分類の中
に位置付けられた歌唱様音声の韻律的・音響的特徴を検出する。
4.1.「おかあさん」音声の聴取テストと韻律の分析
ま ず 先 述 の NTT 乳 幼 児 音 声 デ ー タ ベ ー ス に 収 録 さ れ た 5 児 の 音 声 の う ち , 発
音 が 明 瞭 に な っ て き て い る 24 ヵ 月 か ら 36 ヵ 月 齢 の 「 お か あ さ ん 」 と 発 音 し て
い る 音 声 347 例 ( 助 詞 を 伴 っ て い な い 「 お か あ さ ん 」 の み ) を ピ ッ ク ア ッ プ し
た。これらは「おかあさん」という語であることから非常に感情が明確に表れ
ており,機嫌よく歌っているような音声や憤りをあらわにしている音声など多
様な音声である。そこで感情性の分類の中で「歌っている」と聴き取られる音
声を位置付ける研究をおこなうこととした。
筆 者 を 含 む 研 究 者 2 名 が , ま ず 「 お か あ さ ん 」 音 声 347 例 か ら 機 嫌 の 良 い 音
声(「 機 嫌 良 」と す る )20 例 と 機 嫌 が 悪 い 音 声(「 機 嫌 悪 」と す る )20 例 を 選
出 し た 。 こ の 機 嫌 良 , 機 嫌 悪 の 40 例 を ラ ン ダ ム 配 列 し た テ ス ト 音 声 に つ い て ,
成 人 21 名 に そ れ ぞ れ「 と て も 機 嫌 が 良 い 」か ら「 と て も 機 嫌 が 悪 い 」ま で の 6
段階評価を求めた。歌っているように聴こえる音声にチェックを入れることも
併せて依頼した。
こ の テ ス ト 結 果 の 上 位 10 音 声 と 下 位 10 音 声 を「 SUGI SpeechAnalyzer( 杉
藤 美 代 子 監 修 ア ニ モ 2000)」 を 用 い て 音 響 分 析 し , 各 シ ラ ブ ル (「 お 」「 か あ 」
「 さ ん 」) の 長 さ を 含 む 音 声 長 を 図 7 に 示 す 。 図 7 の 中 央 波 線 よ り 上 は 機 嫌 良
上 位 10 音 声 , 波 線 よ り 下 は 下 位 10 音 声 で あ る 。 歌 っ て い る と 聴 き 取 り , チ ェ
ックを入れた人の割合(うた評価)は♪印の横に示している。この結果,特に
機 嫌 良 上 位 の 1 位 と 10 位 に な っ た 音 声 は う た 評 価 が 高 か っ た 。
う た 評 価 の 高 い 二 つ の 音 声 は ,上 位 10 音 声 の 中 で 突 出 し て 音 声 長 が 長 か っ た
た め ,こ の 二 つ の 音 声 を 除 外 し ,機 嫌 良 と 機 嫌 悪 の 音 声 を 比 較 し た 。そ の 結 果 ,
機 嫌 悪 の 音 声 長 は 有 意 に 長 か っ た 。そ の ほ か ,
「 お か あ さ ん 」の 基 本 的 な 語 ア ク
セントが「おかあさん(網掛けが高い)」であるのにも関わらず,機嫌良の 4
例の末尾が上昇していた。これに比して機嫌悪の音声の抑揚についてみると,
一例が平坦である以外,末尾がすべて下降しているなど,機嫌良と機嫌悪の音
声 に 韻 律 的 な 相 違 が み ら れ た ( 表 6 )。
図7
表6
「 お か あ さ ん 」 音 声 の 全 長 と 各 シ ラ ブ ル の 長 さ (ms.)
♪印の左の数値は歌っていると回答した人の割合
上 位 10, 下 位 10 音 声 の 「 お 」 「 か あ 」 「 さ ん 」 の 抑 揚
H は最も高く L は最も低い音節,矢印は第 2 音節から第 3 音節への抑揚
良
1
2
3
4
5
6
7
8
9
10
お
H
かあ
HL
H
H
L
H
L
L
L
L
H
H
H
さん
↗
↘ L
↘ L
↗ H
↘ L
↗ H
↗ H
↘
↘ L
↘
悪
31
32
33
34
35
36
37
38
39
40
お
L
L
H
L
L
H
かあ
H
H
H
H
H
LH
H
L
H
さん
↘ L
↘
↘ L
↘ L
↘
↘ L
↘
↘
→ L
↘ L
図8
機嫌良 1 位(うた評価 1 位)の音声のピッチ曲線
図9
機 嫌 良 10 位 ( う た 評 価 2 位 ) の 音 声 の ピ ッ チ 曲 線
機嫌良の中にあって突出して歌っているとする人数が多く音声長の長かった
機 嫌 良 1 位 の 音 声 お よ び 機 嫌 良 10 位 の 音 声 は , い ず れ も 定 常 部 分 が 多 か っ た
(図8,図9)。なお,この 2 例のうち機嫌良・うた評価 1 位の音声(図8)
は音声長がうた評価2位よりも短いにもかかわらずうた評価が高かった理由を
分析すると,1 位の音声は第 2 音節「かあ」から最終音節「さん」へ上昇して
いることが理由として考えられる。「かあ」の間に長 4 度の下降があったのち
短 3 度 上 昇 し て お り ,こ れ は わ ら べ う た に 固 有 の 音 程 と 等 し い 。こ れ ら に よ り ,
1位の音声のうた評価が高いと考えられる。
4.2.歌唱様音声を含む音声表現の音響的特徴
本節では,前節で用いた音声の中から同一児の機嫌良,機嫌良且つうた評価
大,機嫌悪の 3 種の音声を取り上げ,これらの音声の音響的な差異の分析を試
み た [34]。
音 質 を 表 す 代 表 的 な パ ラ メ ー タ [ 3 5 ] の 中 か ら ,非 定 常 ラ ウ ド ネ ス ,非 定 常 シ ャ
ー プ ネ ス の 解 析 ( DIN45631A1 準 拠 )を お こ な っ た 。 シ ャ ー プ ネ ス 値 が 大 き い と
いうことは高い周波数成分を多く含んでいるということであり,ラウドネス値
が大きいときのシャープネス値を算出することにより,泣いている(機嫌が悪
い)かどうかの判定ができる可能性がある。
図 10 左 か ら 機 嫌 良 (3 位 ),機 嫌 良 (10 位 )・ う た 評 価 2 位 ,機 嫌 悪 (下 位 3 位 )
上 段 は 非 定 常 ラ ウ ド ネ ス の 解 析 ,下 段 は 非 定 常 ラ ウ ド ネ ス( 赤 線 )が 大 き い
時 の シ ャ ー プ ネ ス ( 青 線 )( ピ ン ク 色 の 線 が そ の 範 囲 ) の 値 を 示 し て い る
図 10 上段では,赤色部分でラウドネスが大きく,青色部分はラウドネスが小さい。機嫌
良の 2 例(左と中央)では,上段赤色部分の周波数が比較的一定に継続しているが,機嫌
悪の音声は周波数成分が一定でなく,また高い周波数の 4000Hz 以上の声がでている特徴が
見て取れる。
引き続き,同児の同じ 3 種の音声をラウドネスとシャープネスの時間変化で比較した(図
10 下段)。赤い線がラウドネス,青い線がシャープネスである。機嫌良の 2 例(左と中央)
では,ラウドネス値(sone)が大きい時のシャープネス値(acum)が 2.0 (図中ピンク色部分)
を上回ることはないが,機嫌悪では一部 2.0 を超える結果となった。
分析の結果から,機嫌悪の音声は機嫌良の音声と比較して,①スペクトル変化が顕著で
ある([34]参照),②高い周波数成分が比較的多く含まれている,③周波数成分が重層的
に現れている,また④シャープネスがラウドネス増大時に相対的に高いという特徴を持っ
ていることが明らかになった。
うた評価の高い歌唱様音声は機嫌悪の音声とは全く異なる音響的特徴を有していた。今
後共鳴の多い周波数帯域の違い等を詳細に分析することで,歌唱様音声の音響的実態を解
明することができると考える。
5.おわりに
第 2 章での 2 種類の音声の聴取調査に基づく研究によって,「うた」は「ことば」と比
較して,音声長が長い(定常に延ばされている)また,末尾が上がることが多いという結
論を得た。第 3 章で喃語の 3 音音声を分類し聴取テストによってうた度の上位下位を比較
した結果,第 2 章の結論と同様,うた度評価の高い音声は有意に長く,また末尾の高いも
のが多かった。第 4 章の「おかあさん」音声を用いた聴取テストの分析においても,うた
評価の高い音声は相対的に短い機嫌良の範疇にありながら長い音声であり,「おかあさん」
の語アクセントが下降しているにも関わらず,末尾の上昇傾向を含んでいた。これらによ
り,本研究において,歌うことと引き延ばし,末尾の上昇は関わりが大きいことを明らか
にすることができた。末尾の上昇に関しては,日本のわらべうたの長 2 度音程の旋律が必
ず高い方の音で終わる[29]ことと結びついていると考えている。
加えて歌唱様音声を含む感情性の音響的分析により,われわれが聞き分けている感情の
音響的な差異を示した。分析結果から,話せるようになって間もない子どもが非常に多様
な音声を使い分けていることがわかる。音韻上は同じ「おかあさん」であっても,どれほ
ど子どもは微妙な音声表現をおこなっているか,子どもたちが声にのせて届けようとして
いる感情の実態を垣間見ることができた。
ランダムに聞こえる子どもたちのつくりうた(わらべうた)は,喃語音声からの変化過
程の延長線上にあり,日本語の音声的特徴を生かして生き生きと歌われている[36,37]。大人
は次々に既成の曲を子どもに提供し,子どもの歌唱を矯正することもあるが,第 2 章であ
げたように乳幼児の音声にはことばかうたか判断し難いものもあり,幼い子ともに音程や
長さの正確さを強いることは適切でない。我々は子どもがどのような声を出し,どのよう
に歌いたいのかを知っていなければならない。子どもの音声表現を良く理解し,子どもの
自発的な表現を損なわない音楽教育・保育が重要である。
本稿は,子どもたちの自然な音声表現を生かした教育・保育の創成を目的とし,科学研
究費(課題番号:22530891,25381104)を得ておこなってきた研究の成果を抜粋,加筆し
たものである。本研究の応用を志し,並行して試みている実践的研究(課題番号:25381279,
研究代表者:岡林典子)とともにさらに継続して取り組みたい。
謝辞
歌唱様音声の研究に関する先駆者であり,継続して共同研究をおこなって下さっている
埼玉大学の志村洋子先生に心から感謝申し上げます。音声抽出や聴取テストに関しては京
都女子大学の岡林典子先生に,図 5,図 6 の作成については理化学研究所山根直人氏,4 章
2 節の音響分析はキャテック(株)天津成美氏にご協力いただきました。
本研究は,日本学術振興会の以下の科学研究費助成を受けている。
基盤研究 C「保育士・教員養成における歌唱教育に資する子どもの自発的歌唱に関する研
究」(課題番号:25381104,代表者:坂井康子)
引用文献
[1] 大伴潔:喃語から言語への移行における音声コミュニケーション発達の諸相.特殊教
育研究施設研究年報.pp.9-16.(1996)
[2] 江尻桂子:乳児における喃語発達の過程.お茶の水女子大学人間文化研究年報.第 21 号,
pp.114-122.(1997)
[3] 林安紀子:乳幼児における音声知覚の発達と言語獲得.児童心理学の進歩.金子書房,
pp.26-50.(2001)
[4] 梶川祥世:子どもの音声習得.月刊言語.31(11),pp.42-49.(2002)
[5] 市島民子:日本語における初期言語の音韻発達.コミュニケーション障害学 20,
pp.91-97.(2003)
[6] 窪薗晴夫:音韻の獲得と言語の普遍性.音声研究.第 7 巻第 2 号,pp.5-17.(2003)
[7] 梶川祥世:子どもの音声言語認知の発達.月刊言語.33(6),pp.40-48.(2004)
[8] 麦谷綾子:乳幼児の音声言語獲得.信学技法.TL2004-14,pp.13-18.(2004)
[9] 志村洋子:乳児の音声における非言語情報に関する実験的研究.風間書房.(2005)
[10] 市島民子:日本語における初期韻律と音韻の獲得.人間と科学.県立広島大学保健福祉
学部誌 9(1),pp.15-28.(2009)
[11] 正高信男:子どもはことばをからだで覚える―メロディーから意味の世界へ.中央公
論新社,pp.1-9.(2001)
[12] 坂井康子・五味克久:子どもの歌唱に関する研究について―幼児の「つくりうた」の
分析に基づく提言―. 神戸大学発達科学部研究紀要.第 10 巻第 2 号,pp.19-28.(2003)
14
[13] 坂井康子:子どもの発話の韻律とつくりうたの旋律.神戸大学発達科学部研究紀要.第
11 巻第 1 号,pp.173-180.(2003)
[14] 岡林典子・坂井康子:母子コミュニケーション場面にみられる創造的なことばのやり
とり―日本語のリズム感に注目して.表現文化研究.第 7 巻第 1 号,pp.11-26.(2007)
[15] 坂井康子・岡林典子・佐野仁美:日本語の韻律の獲得―母子間で交わされた 3 拍の唱
えことばの抑揚.表現文化研究.第 8 巻第 2 号, pp.85-97.(2008)
[16] 坂井康子:幼児の音声表現における歌唱様発声.甲南女子大学研究紀要.人間科学編.
第 44 号,pp.29-36.(2008)
[17] 岡林典子・坂井康子:日本語の獲得期にみられる 2 拍のリズミカルな音声表現―幼児
の生後 11~17 か月の観察より. 表現文化研究.第 10 巻第 2 号,pp.127-141.(2011)
[18] 岡林典子・坂井康子:乳幼児の音声表現におけるリズムの多様性―喃語期から言語習
得期にみられる 3 音音声に注目して―.関西楽理研究,ⅩⅩⅨ,pp.41-53.(2012)
[19] 坂井康子・岡林典子・山根直人・志村洋子:喃語のリズムの変化―生後 8 ヵ月,12 ヵ
月 ,17 ヵ 月 の 音 声 の 比 較 か ら ― . 甲 南 女 子 大 学 研 究 紀 要 . 人 間 科 学 編 . 第 48
号,pp.43-52.(2012)
[20] 坂井康子・岡林典子・山根直人・志村洋子:乳幼児の音声表現のリズムと抑揚.甲南
女子大学研究紀要.人間科学編.第 49 号,pp.41-48.(2013)
[21] 岡林典子・坂井康子:乳幼児の音声表現における抑揚の多様性―歌唱様音声の末尾の
上昇に着目して―. 関西楽理研究,ⅩⅩⅩ,pp.83-89.(2013)
[22] 坂井康子・志村洋子・山根直人・岡林典子:乳幼児の歌唱様音声の韻律的特徴.甲南
女子大学研究紀要.人間科学編.第 51 号,pp.67-73.(2015)
[23] 伊藤勝志:幼児初期の歌唱行動について.北海道教育大学紀要.第一部C.教育科学編
第 28 巻第 2 号,pp.157-170.(1978)
[24] 永田栄一:子どもの音楽表現の形成と学習(1).季刊音楽教育研究 No26,pp.160-167.
(1981)
[25] 永田栄一:子どもの音楽表現の形成と学習(2).季刊音楽教育研究 No27,pp.154-162.
(1981)
[26] 伊藤勝志:幼児初期の歌唱行動についてⅡ.北海道教育大学紀要.教育科学編.第 39 巻
第 1 号,pp.167-177.(1987)
[27] 志村洋子:一歳児の歌 歌唱様発声の音響分析的研究.音楽教育学の展望Ⅱ下.日本音
楽教育学会編.音楽之友社,pp.152-165.(1991)
[28] 南曜子:言語習得期の音楽的表現「即興うた」の旋律性.音楽教育学の展望Ⅱ下.日本
音楽教育学会編.音楽之友社, pp.166-175.(1991)
[29] 小島美子:旋律法.わらべうたの研究―研究編 .小泉文夫編.稲葉印刷所.(1969)
[30] 坂野信彦:七五調の謎をとく.大修館書店.(1996)
[31] 市島民子:日本語における初期音韻獲得.上智大学博士論文(言語学).(2004)
[32] 益子幸江:日本語の言語獲得過程における音声表出に関する研究.東京外国語大学論
集.No.67, pp.15-37.(2004)
[33]不破希衣子・今泉敏・志村洋子:乳幼児における音声獲得過程.日本音響学会講演論文
集 2-P-13,pp.307-308.(2000)
[34]坂井康子・天津成美:幼児の音声における「機嫌」の音響的特徴.日本音声学会第 29
回全国大会予稿集,pp.182-187.(2015)
[35] 天津成美・長松昭男:振動を測る―振動と音響の計測に関する動向―.機械の研究.第
61 巻第 1 号,p.40-48.(2009)
[36] 坂井康子:子どもの創るうた vs.子どものために作られた歌.音の万華鏡―音楽学論
叢.藤井知昭・岩井正浩編.岩田書院,pp.349-367.(2010)
15
[37]坂井康子:遊び歌の指導をめぐる諸問題 .音楽教育実践ジャーナル.vol.8,no.1,
pp.68-74.(2010)
16