携帯電話を利用したリアルタイム方言調査システム

携帯電話を利用したリアルタイム方言調査システム
鑓水 兼貴
国立国語研究所 プロジェクト非常勤研究員
1 言語地図自動作成システム
言語地図の作成には多大な労力を要する.技術革新が進むにつれて,多くの研究者が地図作成
作業の自動化に取り組んできた.コンピュータの普及にともなって,まず,地図作成部分の自動
化が行われるようになった.福嶋秩子・福嶋祐介による SEAL や,大西拓一郎による LMS は,
従来の言語地図と同等のものを PC 上で作成することができる.また,荻野綱男による GLAPS
や,高橋顕志による SUGDAS は,大量の言語地図を一度に出力することが可能であり,アンケ
ート調査のような回答形式が整理された調査に向いている.こうした地図作成作業は,GIS(地理
情報システム)の登場によって,技術的な問題はほぼ解決し,方言研究でも普及しつつある.
インターネットの普及によって,データ収集部分の自動化の試みも行われるようになった.林・
日高(2008)は WEB を用いたアンケートシステムを作成し,データ収集から地図表示までの,言
語地図作成の全工程を自動化した.また,大西他(2011)による「方言メール調査」のシステムで
は,電子メールで回答を収集し,自動的にデータベース化を行っている.
本発表では,携帯電話を利用したリアルタイム方言調査システム RMS(Real-time Mobile
Survey system)について紹介する.RMS は,国立国語研究所共同研究プロジェクト(萌芽・発掘
型)「首都圏の言語の実態と動向に関する研究」(プロジェクトリーダー:三井はるみ)で開発・
実験中の方言調査システムである.大学の授業で PC のない教室での利用を想定しており,学生
に対してアンケート調査を実施し,その場で言語地図を表示することができる.
2 携帯メールの活用
電子メールや WEB を用いたアンケート調査は,特に珍しいものではない.従来の質問紙によ
る調査で必要な電子データ化の手間が不要となるため,分析までの時間も短縮できる.表 1 は,
アンケート調査の媒体別特徴を,紙,WEB,携帯メールについてまとめたものである.電子メー
ルについては PC での利用や WEB での利用もあるが,重複点が多いので省略した.
WEB による調査は欠点が少ない.紙に近い複雑な調査も可能であり,回答欄の整合性も自動的
にチェックできるため,入力ミスが減って効率がよい.調査会社でも広く使用されている.
しかし,WEB の利用は PC が中心であり,PC のない場所での調査が難しい.スマートフォン
の普及により,携帯電話からの WEB 利用も増加しているが,回答者側の料金的負担が大きくな
る.参加者全員を対象とした調査では,PC 教室でない限り,WEB の利用は難しいと思われる.
携帯メールの有利な点は,ほぼ全員が携帯電話を常時所持しており,所有者以外の利用がほと
んどないことである.メールアドレスから回答者を特定できるため,同一人物に対して複数回調
査を行う場合に,個人 ID の発行やログイン処理などをすることなく,データを蓄積できる.また,
携帯電話の所持者は,ほぼ全員がメール機能を利用しているため,料金的負担の意識も低く,回
答者に対してメール送信を依頼しやすい.また,現代の若年層は携帯電話での文字入力に慣れて
おり,授業中に調査を実施しても,短時間で終了することができる.
以上から,携帯メールは,調査規模には制約があるが,逆に少ない質問を繰り返し実施する調
査に適している.授業中に気軽に質問するような調査でも威力を発揮すると思われる.
調査媒体
紙
WEB
携帯メール
○
○
×
回答によって質問が分岐する 調査の流れをプログラムでコン 最大1通20問が限度。複雑な
ような場合には、わかりにくく トロールできる。
質問は難しい。
なる。
質問数
○
△
○
どこでも可能。ただしその場で WEB利用環境が必要。携帯か 携帯メールが使用できれば、
実施しない場合、回収率が下 らのWEB利用であればどこでも どこでも可能。
がるおそれがある。
可能。
調査場所
○
料金的負担
△
×
速報性
○
データ入力に時間がかかる。
△
複数回調査
△
全くかからない。逆に調査者側 PC教室で行う場合は負担が 携帯メールは日常的に使用す
に印刷費や郵送費などの負担 ない。携帯でのWEB利用は人 る人が多く、料金的負担が気
によっては料金的負担が大き にならない人が多い。
が発生する。
くなる。
○
最初から電子データとしてデータが得られるため、サーバー側
のプログラムを用いることで自動集計が可能。
△
○
回答者が前回と同一人物であることを確かめるため、IDの発
行等が必要となる。大学であれば学籍番号が使いやすい。
携帯電話は個人と結び付いて
いるため。メールアドレスで同
一人物か判断可能。
表 1・アンケート調査の媒体別特徴
3 調査システム概要
図 1 に RMS の概要を示す.システムの詳細な説明は鑓水(2011)で行っている.また,現時点
(2012 年 7 月)で実装されていない機能もある.システムは,①調査管理(調査票や調査者情報
を管理する)
,②回答処理(電子メールのデータを解析する),③結果表示(回答の整理や地図表
示を行う)の3つの部分にわかれる.これらのデータはすべてデータベースに格納される.
調査者管理
参加者管理
回答者管理
CGI
調査管理
調査文管理
メール入力
調査票管理
調査者
調査名管理
データベース
回答者
属性情報
Email
ウェブ入力
着信時
実行
回答処理
CGI
結果表示
(生育地→緯度経度変換)
回答情報
結果集計
地図表示
その場でフィードバック
図1・RMS の概要
回答処理は属性情報と回答情報に分けられる.RMS では,質問番号がアルファベットの場合に
属性情報,数字の場合に回答情報とみなされる.
図 2,図 3 は,に回答者が送信する携帯メールの作成例である.指定された宛先に送信するこ
とで,データベースに自動登録される.件名には調査者が指定した調査名を入力する.調査名は,
あらかじめ調査名管理で設定しておく必要がある.
図 2 は属性情報のメールの例である.a,b,c は回答者の生育地に関する質問であるが,あらかじ
め調査文管理で a を都道府県,b を市区町村,c を町丁目と指定しておくと,この電子メールをサ
ーバーが受信する際に,東京大学空間情報科学研究センターの「シンプルジオコーディング実験」
を利用して自動的に緯度経度に変換される.こうしてメールアドレスと位置情報が結び付けられ
る.なお,メールアドレスと生育地を収集するため,個人情報の取り扱いに十分注意する必要が
ある.RMS での位置情報の詳細度は,個人情報と研究のバランスを考えて,町丁目単位とした.
図 3 は回答情報のメールの例である.1∼3 は選択式で,4・5 は記述式となっている.選択式
の場合は回答の整理の必要がないため,すぐに地図出力が可能である.
メール作成(新規)
宛先 [email protected]
件名 kaito
本文
a 東京都
b 立川市
c 緑町
d男
e 1993
f 東京都立川市
図 2・属性情報のメール例
メール作成(新規)
宛先 [email protected]
件名 kaito
本文
1a
2b
3 a;b
4 ヤナサッテ
5 かわいい感じ
図 3・回答情報のメール例
4 RMS の利用例
図 4・図 5 に RMS の利用例を示す.それぞれ首都圏の 7 大学で 1000 人余りの学生を対象とし
ている.調査票登録時に,質問の共有設定をしておくと,地図表示時に他の調査結果も重ね合わ
せることができるため,地点密度の高い地図を短期間で作成することができる.
質問の選択肢は,
「a 使用する」
「b 聞いたことがある」
「c 知らない」で,言語地図の出力時に,
それぞれ「a:■」
「b:□」
「c:−」の記号を割り当てた.地図記号は生育地にポイントされるが,
生育地の質問文は「5∼15 歳までに最も長く居住した場所」となっている.なお,図 4・図 5 の地
図は,回答者の転居歴を考慮せずに全て表示している.また,首都圏の大学生を対象としている
ため,回答者が関東地方周辺に偏っている.そのためここでは東京周辺部を拡大した地図を示す.
図 4 は,
「燃やす」の意味で「モス」を用いるかどうかについてたずねたものである.分布では,
都心部に「聞かない」,その周辺に「聞いたことがある」,その外側の関東周辺部に「言う」が広
がっているようにみえる.従来「モス」は関東全域で使用されていたことから,都心から徐々に
衰退していったことがうかがえる.同じ首都圏の大学に通っている人どうしでも,大きな違いが
あることを示すことができた,よい事例である.
つづいて図 5 は,「ツマグロオオヨコバイ」という虫について,「バナナムシ」という呼称を用
いるかどうかについてたずねたものである.地図をみると,ほぼ東京都中央部に使用者が固まっ
ており,明確な分布を示している.東京西部での使用が報告されたため,急遽行った調査であっ
たが,短期間で高密度の地図が得られたため,
「バナナムシ」の分布範囲を知ることができた.
また,図 4・図 5 ともに,東京都の山の手から多摩東部の地域は一様な分布になっている.こ
の地域は「標準語」使用地域であることが予想され,他の項目の分布とあわせて分析を進めてい
くことで,若年層の言語使用状況を把握することができると思われる.
■:言う □:聞いたことがある -:聞かない
図 4・「モス」(燃やす)
■:知っている □:聞いたことがある -:知らない
図 5・「バナナムシ」(ツマグロオオヨコバイ)
5 まとめ
以上,携帯メールを用いた調査の意義と,リアルタイム調査システム RMS の紹介を行った.
コンピュータの進化や,インターネットの普及にともなって,調査・分析の方法も大きく変化し
ている.従来の質問紙によるアンケートは,今後も重要であり続けると思われるが,同時に新し
い,より言語実態を反映することができる調査手法の開発も,今後の方言研究の発展に必要であ
ろう.今後も RMS を改良・活用して,多様な言語状況の解明に役立てていきたい.
参考文献
大西拓一郎・鑓水兼貴・三井はるみ・吉田雅子(2011)『方言の形成過程解明のための全国方言調査―方
言メール調査報告書―』 国立国語研究所共同研究報告 10-2
東京大学空間情報科学研究センター「シンプルジオコーディング実験」
http://newspat.csis.u-tokyo.ac.jp/geocode/modules/geocode/
林良雄・日高水穂(2008)「Google Maps を用いたことばのアンケートシステム」秋田大学教育文化学部研
究紀要(自然科学)63
鑓水兼貴(2011)「携帯電話を利用した首都圏若年層の言語調査」第 92 回人文科学とコンピュータ研究会
(連絡先:[email protected]