Twitter 上のメッセージによる国のイメージ測定

Department of Social Systems and Management
Discussion Paper Series
No.1294
Twitter 上のメッセージ による 国のイメージ測定
—内容分析とテ キストマイニン グによる分析
(The Measurement of Nation Images Based on Content Analysis and
Text-Mining of Twitter Messages)
by
石井 健一
(Kenichi ISHII)
June 2012
UNIVERSITY OF TSUKUBA
Tsukuba, Ibaraki 305-8573
JAPAN
Twitter 上のメッセージによる国のイメージ測定
―内容分析とテキストマイニングによる分析i
石井健一
要約
本報告は、国のイメージの測定に向けて行なったいくつかの試行的な測定結果を報
告するものである。API を通じて収集した Twitter のメッセージを内容分析とテキストマイ
ニングで分析し、さらにブログ検索のヒット件数で国と文化キーワードとの距離を計算し
た。いくつかの結果は、中国のイメージがきわめて悪いことを示していた。ただし、イン
ターネット上のテキストを用いて国のイメージを測定することについて、方法論的な問題
がなお残されていることも確認された。
研究の背景と目的
最近 SNS の利用率が急速に増加している。SNS で最も利用度が高いといわれる Twitter
は API を公開しており、メッセージをプログラムから得ることが可能であるii。Twitter は
日本人利用者の場合、身近な友だちとのものが比較的多いとみられ、日本人の本音の会話
に近いものが多く含まれていると予想される(石井 2011a)。本研究は、Twitter のメッセー
ジを利用し、日本人の対外イメージを分析することを目的とする。
本報告書は、科学研究費補助金基盤(B)『日中の相互国家イメージと「国家ブランディ
ング」の可能性―中国と日本での実証研究』
(代表石井健一)において実施したいくつかの分
析結果を報告するものである。本研究では、Twitter から得られたメッセージに対して二種
類の分析を行なう。一つは評定者が内容を読んでコーディングする内容分析である。もう
一つは、テキストマイニングによる分析である。また、これらとは別にブログの検索数を
用いて国のイメージを測定した結果も報告する。
方法
(1)Twitter メッセージの内容分析
API のプログラムをつくり 2011 年 9 月 14 日から 10 月 27 日にかけて Twitter で「中国」
「台湾」「香港」「韓国」「シンガポール」「マレーシア」「インド」「アメリカ」「イタリア」
「ドイツ」「フランス」「ロシア」を含むメッセージを収集した。
ただし、「中国」は日本の「中国地方」の意味でも使われているので、中国関係のメッセ
ージは一名のコーダーがすべてのメッセージをチェックして、国名としての意味以外で使
われている場合はデータから削除した。その結果、分析に用いたメッセージの総件数は、
1
44,024 件である(ただし、一つのメッセージが複数の国のデータに入っている重複も少数
だがある)。
そのうち、3,057 件のメッセージを無作為に抽出し、二人のコーダーで分担して、どうい
う側面のメッセージか(経済・技術等、政治・軍事、国民性、その国の道徳、対日感情)をコ
ーディングしたうえで、その国の日本に対する総合的な評価を(1)肯定的、(2)否定的、(3)
どちらでもないの三段階で評価してもらった(この場合の「肯定的」とは、日本や日本人に
とって肯定的という意味である)。ただし、メッセージを読んでその国と全く関係のない話
題の場合はデータから除外したところ(たとえば「フランスパン」についてのメッセージな
ど)、国のメッセージとして評価対象となったのは 2,560 件であった。
なお、3,057 件のうち、1,686 件については二名の評定者が独立に評定し、1371 件につい
ては、一名の評定者が単独で評価した。二人の評定者の一致度をスピアマンの順位相関係
数で測定したところ r=0.328 (p<.001)であった。二人の評定が一致しない場合は、どちらか
の評定をランダムに選んだ。
(2) Twitter メッセージのテキストマイニング
上記の 44,024 件のメッセージを対象として R という統計ソフト上で MeCab というプロ
グラムを用いて形態素解析を行い分析した(石田 2008)。
表 1 ブログ検索にもちいたキーワード
日本語
(3)
英語
日本語
英語
1 日本
Japan
13 ブラジル
Brazil
2 アメリカ
US
14 オーストラリア
Australia
3 中国
China
15 音楽
Music
4 韓国
South Korea
16 芸術
Art
5 台湾
Taiwan
17 ファッション
Fashion
6 イタリア
Italy
18 観光
Tour
7 フランス
France
19 グルメ
gourmet
8 ドイツ
Germany
20 スポーツ
Sports
9 イギリス
UK
21 歌手
Singer
10 インド
India
22 アニメ
Animation
11 ロシア
Russia
23 映画
Movie
12 インドネシア
Indonesia
24 文学
Literature
ブログ検索を用いた国のイメージ測定
グーグルには「ブログ検索」というサービスがあり、ブログの中から特定のキーワード
をもつブログ数を表示することができるiii。表 1 のキーワードを用いてそれらを二つずつ組
み合わせた場合のヒット件数を測定した。測定は、日本語と英語について別々に行なった。
2
このヒット件数に基づいて、キーワード i とキーワード j の距離行列 Dij を以下のように定
義した(Fi はキーワード j の単独でのヒット件数であり、Fij はキーワード i と j を組み合わ
せた時のヒット件数である)。
Dij
= Fij/(Fi
Fj)
なお、表 1 のキーワードは、1-­14 が主要国の国名、15-­24 が文化関係の単語となってい
る。
結果
(1)内容分析による分析結果
評定者によるメッセージの評価の結果は、表 1 のようになった。ここでは、ポジティブ・
ネガティブのいずれにしろ評価のあるメッセージの比率を「関心度」
、評価のあるメッセー
ジのうちポジティブなメッセージの比率を「好意度」として各国の値を計算した。
その結果、好意度が最も低いのが中国であり、次いでアメリカ、ロシア、韓国といった
国が低かった。中国については、各種の世論調査の結果にそう結果であるが、アメリカは
一般には最も日本人が高い好意度をもっているとされている国の一つであり、意外な結果
といえる。韓国はネガティブなメッセージが二番目に多いが、ポジティブなメッセージも
多い点が注目される。中国は好意度は最も低いが、関心度は平均くらいであまり高いとは
言えない。
上で定義した「好意度」と内閣府が毎年調査している「外交に関する調査」の「親しみ
を感じる」%の値とのスピアマンの順位相関係数を求めたところ、値は 0.04 ときわめて低
かった。この原因としてアメリカに対する評価が「外交に関する調査」ではきわめてよい
のに対して、Twitter 上のメッセージでは好意度が中国に次いで低かったことある。
メッセージ内容を(1)経済・技術、(2)政治・軍事、(3)国民性やその国の道徳性に関するも
のの三つに分類した結果が表 2 である(これ以外のメッセージは「それ以外」とむなる)。こ
こで注目されるのは、韓国に関しては国民性や道徳に関するメッセージがきわめて多いと
いうことである。
3
表 2 各国のメッセージの内容分析の結果
ポジティブ
ネガティブ
総件数
なメッセー
なメッセー
(T)
ジの件数
ジの件数
(A)
(B)
ポジティブな
評価のある
外交に関
メッセージの
メッセージ
する世論
比率(好意
の比率(関
調査「親し
度)
心度)
みを感じ
A/(A+B)
(A+B)/T
る」%iv
中国
229
1
27
3.6
12.2
台湾
215
51
1
98.1
24.2
香港
231
24
5
82.8
12.6
韓国
204
27
42
39.1
33.8
62
シンガポール
222
17
5
77.3
9.9
51
マレーシア
227
13
3
81.3
7.0
51
インド
191
11
12
47.8
12.0
41
アメリカ
186
14
50
21.9
34.4
82
イタリア
208
20
7
74.1
13.0
64
ドイツ
258
6
2
75.0
3.1
64
フランス
206
17
8
68.0
12.1
64
ロシア
183
5
14
26.3
10.4
13
表3
26
各国に関するメッセージの内容ジャンル(件数)
(1)経済・技術
(2)政治・軍事の
(3)国民性、その国の道
等の側面
側面
徳、対日感情の側面
(3)の%
中国
18
28
12
21
台湾
2
52
16
23
香港
3
29
29
48
韓国
6
69
148
66
シンガポール
4
22
7
21
マレーシア
3
16
11
37
インド
10
23
5
13
アメリカ
10
64
22
23
イタリア
17
27
8
15
ドイツ
9
8
5
23
フランス
12
25
6
14
ロシア
4
19
27
54
98
382
296
38
計
4
図 1 メッセージにおける各国の好意度と関心度
5
(2) テキストマイニングによる分析結果
次に Twitter で抽出したメッセージをテキストマイニングで分析した結果を報告する。
本分析では、12 カ国の国名で検索した結果得られた総計 44024 件のメッセージを分析対象
とする。
表 4 テキストマイニングで対象としたメッセージの件数
国
件数
国
件数
中国
3567
インド
3254
台湾
3867
アメリカ
3854
香港
3882
イタリア
3619
韓国
4022
ドイツ
3771
シンガポール
3649
フランス
3718
マレーシア
3599
ロシア
3222
次にこれらの国名がどのような名詞と形容詞と結びつきやすいのかをχ2 値を用いて調
べてみた。なお、まず出現頻度が合計で 10 回以上という条件で少数回しか登場しない単語
は省いた。まずχ2 の大きな単語をとりだし、各単語について最も頻度が多いものをその国
の「特徴語」とした。
名詞
表 5 には、χ2 値と頻度が 10 以上という基準にあう各国のメッセージの特徴語の上位を
リストにしたものである。上位に入っているリストをみると、台湾で「義捐金」、韓国で「民
主党」「慰安婦」「竹島」
、ドイツで「原発」「福島」と言った時事ニュースに関連する単語が
いくつか入っていることがわかる。また、中国で「烏龍茶」、韓国で「キムチ」、インドで
「カレー」、イタリアで「パスタ」、ドイツで「ビール」、フランスで「パン」など有名な食
品名は上位に登場している。
形容詞
表 6 にはχ2 が 3 以上のものを掲載したが名詞に比べてχ2 の値は大きくない。概して特
徴的な形容詞はあまりないと言えそうである。中国の「青い」は、これを含むメッセージ
が何回かリツイートされていたためである。また、これらは関係するメッセージの中に出
現したというだけであり、必ずしも当該国を修飾する用語として使われていたわけではな
いことにも注意が必要である。
6
表5
中国
米
国
漢
政府
経済
米国
中国人
署名
茶
北京
産経
式
アリ
産
会長
国家
MSN
軍
ババ
烏龍茶
佛
チベット
不動産
技術
省
春
買収
お願い
関心
開発
可能
上
事件
SMAP
ロイター
員
パンダ
非常
各国の特徴語(名詞のみ。数値はχ2 値)
5639
3304
2067
2054
1502
1363
1081
1049
997
815
651
651
585
578
521
515
488
477
458
415
391
355
326
316
310
310
300
294
291
285
283
246
230
227
225
213
212
207
台湾
義援金 9391
日本人 8161
7034
一
6456
億
5718
拡散
5463
希望
4894
報道
4774
動画
4523
親日
4087
地震
3981
さ
メディア 3908
3674
たち
3527
九
3435
半年
3401
ダントツ
3401
思い
3390
突破
3337
分の
3333
州
3296
比べ
3272
収入
3160
ネット
2927
人達
2750
これ
1869
私
1673
Po
1671
Pon
marumaro1476
1439
観光
1411
公式
ちゃん 1240
1083
麻生
1035
素敵
Taiwan 950
901
杯
大学生 798
798
支援
764
制作
Beautiful 763
753
女子
香港
発
海外
円
旅行
中
万
欠航
予約
ジョブズ
今日
月
SIM
ツアー
学生
着
映画
空港
日間
年
上海
行
投資
iPhone
格安
版
追悼
氏
ロゴ
フリー
デザイン
国際
現在
東京
評判
マカオ
出発
行き
w
権
7567
5951
5259
3426
2899
2763
2401
2326
2151
2088
2040
2038
1866
1799
1596
1591
1576
1569
1532
1476
1462
1344
1312
1295
1203
1173
1074
984
964
934
856
818
744
698
685
647
635
619
535
韓国
110766
@
85082
日本
27865
人
7285
韓
3619
ー
2985
者
民主党 2400
1683
笑
1495
♪
1449
女性
1309
問題
1182
流
1121
在日
1056
ドラマ
905
兆
826
朝鮮
778
gt
669
T
649
慰安
645
婦
638
竹島
フジテレビ597
577
好き
アイドル 527
475
野田
408
神
392
ファン
381
勉強
379
禁止
372
気
お祝い 367
346
抗議
キムチ 345
334
通貨
スワップ 330
ソウル 328
322
北
318
反日
313
発売
310
ウォン
297
外国
7
シンガポール
アジア 6685
1387
調達
1128
日経
749
移転
724
航空
701
到着
ホテル 683
483
市場
466
取引
455
先物
418
物流
406
パナソニック
406
本部
394
所
321
カジノ
267
進出
261
早め
245
戦略
232
開催
221
明日
218
平均
205
先
188
広島
180
kotarotamura
162
便
154
あと
147
新卒
143
来年
Record 128
126
機能
バンコク 123
120
枚
セミナー 119
117
政策
115
studySingapore
112
就職
111
友達
109
SGX
108
人材
105
前日
103
削減
100
移住
チャンギ 98
マレーシア
ニュース 16376
13813
KL
QUOTE 13499
10857
位
6842
タイ
ベトナム 3137
2280
企業
1782
参加
1740
インドネシア
961
戦
956
輸出
944
クアラルンプール
742
力
709
チリ
697
選手
672
等
671
r
フィリピン 631
593
blog
ブルネイ 577
563
シモンチェリ
560
工場
547
雇用
490
加盟
MotoGP 464
424
GP
405
生産
403
現地
391
仕事
362
事業
トレイン 351
ブルー 345
339
オーストラリア
ペルー 332
332
ウォールストリートジャーナル
296
関税
282
お供
272
開始
270
調査
266
崩壊
258
続き
表 5 の続き
インド
11106
カレー
3798
世界
3403
F
2475
GP
タブレット 2313
973
店
972
何
807
台
594
安
542
率
541
ドル
484
成長
445
sasakitoshinao
415
RNM
363
屋
344
農民
340
自由
遺伝子 322
モンサント311
282
自殺
266
数
264
建築
253
千
すべて 239
239
News
231
社
210
系
206
普及
192
生徒
190
価格
185
必要
181
ワタ
172
音楽
163
種
152
携帯
152
ビザ
150
端末
148
配付
ガンジー 147
145
精神
143
製造
131
mp
129
公開
128
ヶ月
アメリカ
86801
RT
26967
の
15686
こと
13178
ん
11296
TPP
2989
デモ
2851
的
2394
よう
2311
ため
2079
金
1735
手
1487
今
1405
それ
1267
事
1198
基準
1153
そう
1099
もの
1069
Bq
1066
TPP
957
時
909
家
828
無料
676
保険
634
購入
623
英語
579
自分
537
政治
532
マン
みたい 487
481
男性
461
歳
458
社会
キャプテン457
444
化
431
医療
400
交渉
392
手当
362
話
カダフィ 358
344
代
332
層
326
歴史
315
反対
262
戦争
257
昨日
イタリア
10874
日
スペイン 6262
4540
教育
3951
料理
格下げ 3749
パスタ 3664
1641
電車
ユーロ 1624
ギリシャ 1413
ヨーロッパ1228
1074
国債
1067
銀行
ローマ 969
930
段階
866
危機
760
債務
格付け 709
680
遺産
617
機
614
懸念
561
展
560
意味
Wikipedia 481
437
ピザ
431
ワイン
414
ムーディーズ
395
雨
373
定刻
355
南
277
代表
276
終了
266
波及
251
送料
236
空気
217
ミラノ
190
速報
見通し 189
178
伊
177
不安
気持ち 174
167
悪化
166
物
163
身
159
起源
157
名前
151
名
ドイツ
64726
語
12050
原発
4300
衛星
4160
福島
サッカー 3107
2357
落下
ビール 2098
1564
人工
923
ZDF
876
労働
テレビ 851
813
実態
日本語 673
リーグ 653
616
番組
575
aya
546
製
466
横浜
453
NHK
450
独
445
出場
432
会社
センター 406
ビジネス 343
323
市議
300
人々
298
学校
297
量
293
輸入
292
午前
285
市民
放射能 282
270
字幕
259
香川
252
監督
247
子供
244
チェルノブイリ
238
値
237
犯罪
234
市長
231
地球
221
今度
218
確率
213
放送
211
エネルギー
207
作業
200
城
8
フランス
10136
パン
5112
さん
3106
事故
1785
仏
放射線 1522
1490
パリ
1266
国民
1252
IRSN
1221
性
原子力 1194
1175
欧州
イギリス 1055
1022
東電
ベクレル 956
フランス語872
751
発表
688
水
669
安全
セシウム 636
630
食品
621
放射
602
販売
592
派
587
倍
研究所 562
530
君
488
防護
469
過去
469
いち
460
最大
452
京
448
核
447
S
monjukun441
おもらし 441
438
割
428
革命
417
冷却
391
海
350
施設
338
ラ
337
朝
327
俺
ロシア
2367
金髪
2164
東欧
大統領 2159
2055
秘密
2049
PC
2001
本気
サービス 1886
1844
娘
1571
分
プーチン 1213
北方領土 1139
839
via
tubemani 637
625
ステキ
565
TNp
565
Wjl
522
nhk
515
首相
499
news
492
健康
466
領
465
mig
425
ヨ
403
政権
400
後
394
汚染
北朝鮮 365
332
ソ連
モスクワ 305
290
雪男
269
宇宙
248
新潟
235
笑顔
220
廃墟
219
除
カラパイア216
205
美女
表 6 各国の形容詞の特徴語(χ2>3)
中国
青い
珍しい
面白い
やすい
永い
危ない
上手い
弱い
小さい
こわい
激しい
怪しい
148.0
73.8
64.9
58.9
24.6
15.4
14.6
14.1
10.6
5.1
4.7
3.2
インド
327.9
良い
164.3
無い
142.3
悪い
94.2
欲しい
89.5
ほしい
54.3
嬉しい
53.7
酷い
32.1
辛い
16.9
遠い
16.7
ぽい
15.5
痛い
13.9
やばい
10.4
詳しい
うらやましい 6.2
極まりない 5.1
4.2
さむい
4.1
さみしい
3.5
寂しい
3.4
仲良い
台湾
かわいい 190.8
134.1
っぽい
おいしい 108.1
おかしい 103.2
65.6
ひどい
47.2
うまい
ものすごい 21.9
21.7
もの凄い
15.3
宜しい
10.6
速い
8.4
白い
7.7
ずるい
6.1
生々しい
5.5
くい
5.2
情けない
4.9
にくい
3.2
でかい
香港
韓国
23.4 楽しい
甘い
かっこいい 13.7 早い
13.2 暑い
黒い
3.6 新しい
よろしい
かっこよい 3.4 遅い
ふさわしい 3.2 深い
懐かしい
涼しい
熱い
軽い
有り難い
アメリカ
安い
高い
恐ろしい
忙しい
悔しい
イタリア
おそい
怖い
若い
親しい
暗い
近い
541.5
379.5
20.5
18.6
4.4
1113.7
168.3
85.2
24.2
22.5
21.6
ドイツ
厳しい
偉い
眠い
おもしろい
羨ましい
難しい
赤い
めざましい
イイ
短い
193.1
190.4
72.7
39.1
28.6
17.8
12.5
7.9
6.1
4.3
4.0
67.8
48.7
37.2
26.1
23.6
23.1
11.3
10.9
7.4
4.7
シンガポール
153.0
低い
130.9
凄い
49.4
明るい
44.4
貧しい
27.4
望ましい
9.0
美味い
8.2
濃い
7.6
温かい
7.1
興味深い
5.7
すい
3.2
ええ
めんどくさい 3.1
マレーシア
美味しい
蒸し暑い
美しい
優しい
重い
うれしい
難い
フランス
8856.9
ない
3192.3
悲しい
3177.3
大きい
ひもじい 405.4
356.0
可愛い
160.3
寒い
恥ずかしい 70.1
4.7
暖かい
3.9
古い
3.4
うい
ロシア
2938.1
いい
456.8
多い
283.7
よい
171.1
広い
133.2
すごい
素晴らしい 127.6
85.8
少ない
72.6
強い
38.2
長い
24.7
正しい
9.3
カッコイイ
3.7
厚い
266.3
70.0
41.4
20.3
18.1
7.0
3.6
(3) ブログ検索による分析結果
ブログ検索で得られた距離行列を用いて R の計量多次元尺度分析を行なった。2 次元ま
での解を求めた結果が表 7 である。
日本語と英語ともに第一軸で「中国」の値が突出して高くなっている。一方、負の値に
は日本語・英語ともに文化関係の単語が集まっている(音楽、映画など)。これは、中国を語
るブログがこうした文化関係のことを語らないことを示すものといえる。
第二軸は、日本語では「日本」の値が最も低く、「ファッション」の値が最も高くなって
9
いる。英語では、「イタリア」「インドネシア」の値が低く、
「イギリス」や「音楽」の値が
高くなっている。第二軸の解釈は困難である。
表 7 ブログ検索から得られた結果の多次元尺度分析の結果
日本語
第1軸
英語
第2軸
第1軸
第2軸
日本
0.0
-2.2
0.8
-0.1
アメリカ
0.4
-0.2
0.0
-1.1
中国
2.7
-0.1
7.6
0.0
韓国
0.5
-0.2
-0.3
-0.3
台湾
0.1
0.8
-0.4
0.2
イタリア
0.1
0.0
1.4
-2.6
フランス
0.1
0.0
0.7
-0.2
ドイツ
0.1
0.0
0.9
-1.2
イギリス
0.1
-0.1
3.9
3.7
インド
0.1
-0.1
2.6
-0.6
ロシア
0.0
-0.1
-0.4
-0.8
インドネシア
0.1
-0.1
1.6
-2.6
ブラジル
0.1
-0.2
-0.1
-0.8
オーストラリア
0.1
-0.1
1.3
-0.2
音楽
-1.7
0.0
-0.9
2.0
芸術
0.0
0.1
-0.9
1.7
ファッション
0.1
1.8
-1.3
0.5
観光
0.2
0.2
-2.3
0.4
グルメ
0.2
0.5
-1.3
1.0
スポーツ
0.2
-0.2
-0.6
1.2
歌手
-0.5
0.5
-0.9
-1.0
アニメ
-1.1
0.0
-0.9
1.0
映画
-1.9
-0.1
-9.9
-0.3
文学
0.0
-0.1
-0.6
0.1
次にブログ検索で得られた距離行列を用いて、各国と文化に関する単語との距離の和を
計算してみた。その結果が表 8 である。日本語ブログの場合は、ロシア、イタリア、イン
ドネシアといった国との距離が短くなっていて、これらの国について Twitter で語る場合は
文化に関する話題が多いことを示唆している。英語ブログの場合は、台湾、韓国、ロシア、
10
ブラジルという順に距離が短くなっている。また、日本語・英語いずれの場合も、中国と
の距離が最も遠くなっていて、中国がブログで語られる時は、こうした文化に関するキー
ワードが使われない傾向があることを示している。
表 8 文化キーワードとの距離
日本語ブログ
英語ブログ
日本
17.6
27.8
アメリカ
12.3
39.3
中国
22.4
50.4
韓国
10.9
20.7
台湾
6.3
18.1
イタリア
5.1
36.7
フランス
6.3
30.2
ドイツ
6.0
37.2
イギリス
5.1
58.6
インド
5.4
41.5
ロシア
4.4
23.9
インドネシア
5.6
48.7
ブラジル
6.2
23.9
オーストラリア
6.0
35.3
結論
本分析は方法論を含めて試行的なものである。Twitter 上のメッセージを分析した結果は、
以下のような問題点が明らかになった。第一は、すべてのメッセージが当該国に対してポ
ジティブまたはネガティブな態度を明確にしているわけではないことである。Twitter のメ
ッセージの多くは個人的なやりとりであり、国について論じる内容は必ずしも頻度として
は多くはない。したがって、内容分析にせよ、テキストマイニングにせよ、この規模での
メッセージの分析から明確に態度の方向性を見出すことは難しいようである。
また、いくつかの Twitter メッセージはリツイートされて複数回データの中に出現してい
た。リツイートには短いコメントなどが書き込まれることもあり、リツイートが同一のメ
ッセージとは言えないが、このように繰り返して引用されるメッセージの比重が高くなっ
てしまうことは否定できない。
ブログ検索の方法はさらに試行的なものである。しかし、ブログという大きな単位でキ
ーワードが共起することが二つのキーワードの類似性を必ずしも意味しないかもしれない。
11
今回、分析で得られた結果の多くも解釈が困難であった。また、Google が表示するヒット
件数についてもどのようなアルゴリズムによるものなのかが分からないという問題もある。
ブログ検索による測定は、簡易で便利な方法ではあるが、方法論的な問題が残されている
といえよう。
参考文献
石田基広 (2008) R によるテキストマイニング入門、森北出版
石井健一 (2011a) マイクロブログ Twitter における日本人利用者の特徴 Department of
Social Systems and Management Discussion Paper Series, no.1277
石井健一 (2011b) Facebook と Twitter の発言における特徴語の比較 Department of Social
Systems and Management Discussion Paper Series, no.1279
本調査は平成 23 年度科学研究費補助金基盤(B)『日中の相互国家イメージと「国家ブラ
ンディング」の可能性―中国と日本での実証研究』(代表石井健一)による。
ii ただし、全てのメッセージのデータが得られるわけではない。
iii http://www.google.co.jp/blogsearch?hl=ja (日本語)
http://www.google.com/blogsearch?hl=en (英語)である。
iv 平成 23 年に実施された内閣府の「外交に関する調査」の「親近感を感じる」(全体)の%。
ただし、イタリア、フランス、ドイツは「ヨーロッパ諸国」、シンガポールとマレーシアは
「東南アジア諸国」に対する親近感の値を用いている。
http://www8.cao.go.jp/survey/h23/h23-­gaiko/index.html
i
12