コーパスの(消極的)利用:語法・文法・構文研究のために 滝 沢 直 宏(立命館大学) [email protected] 1. なぜコーパスを使うのか ・コーパスを用いるのは、コーパスが言語研究で用いうる道具の一つであるから。 ・コーパスは、道具に過ぎないのでも、道具様であらせられるのでもなく、道具であってそれ以上で もそれ以下でもない。 Chomsky (1965, Aspects): ..., the actual data of linguistic performance will provide much evidence for determining the correctness of hypotheses about underlying linguistic structure, along with introspective reports (by the native speaker, or the linguist who has learned the language). 梶田 (1974) 『文法論 II』: ・・・文というのは抽象物であるから、これを直接に認知することはでき ない。その認知は、言語に関係のあるさまざまな資料(data)から間接的に行うほかない。この目的に役 立つ資料としては、(1)言語運用の観察、とくに、読み書き聞き話すなど、意味に注意を払って行われ る実際の場面での自然な(狭義の)言語運用の観察、(2)言語についての内省とその報告(たとえば、 与えられた文がどの程度自然に受け入れられるかという容認可能性(acceptability)に関する内省や二つ 以上の文の間の同義関係に関する内省など)、(3)言語に関する各種の実験(たとえば、種々の文の記憶 や理解の容易さの測定)、その他がある。 (a) 読書 / 観察 (b) 内省 / 直観 (Introspection / Native Judgment), Elicitation (c) 誤用データ(母語話者・学習者) (d) 非侵襲的な脳観測 (e) 刺激に対する反応時間 (f) コ ー パ ス ( 電 子 的 に 処 理 で き る 巨 大 な 言 語 資 料 ) 他にもあるかもしれない。 ・コーパスの利用は(今となっては)特別なことではない。但し、道具(資料)には長所・短所があ る。内省/直観は強力だが、(だからこそ)鵜呑みは危険。できるだけ多くの資料を使った検証が望ま しい。相互に矛盾したらどうするか・・・。Cf. 刑事訴訟における証拠:目撃証言、自白、物証、アリ バイ・・・。 ・研究テーマ:(1)言語の慣習的な側面(コロケーションなど)の解明、(2)周辺的言語現象の記述(と 説明)。これらの研究にコーパスは不可欠な役割を果たすので、利用している。 ・いわゆる「コーパス言語学」は存在するか。 2. どのようなコーパスをどのように使っているのか ・コーパス(最も広義に解釈「電子的に処理可能な巨大な言語資料」)を UNIX マシン上にテキスト ファイルとして保存して利用。BNC の他、Linguistic Data Consortium から入手可能な新聞記事データベ ース、Project Gutenberg で公開されている文学テキストなど。(加えて WordbanksOnline(6 億語+)や BYU の COHA、COCA、TIME Corpus も、ブラックボックスではあるが利用。) ・読書・観察に基づく自作の英文データベース(約 35,000 文)も併用。自作だと文脈が分かり易い。 ・コーパスの代表性は考慮していない。利用可能な全電子テキストから条件に合う文字列を抽出した 後に、出典に偏り(地域・時代・文体など)があるかどうかを吟味。 ・BNC XML Edition は、s-unit が 1 行になるように整形して使っている。行単位になっていれば grep で何とかなる。 ・コーパス分析に特化したツールを用いず、UNIX のコマンドと簡単な Perl のスクリプトで処理。最 もよく使うのは:grep -Poi "正規表現" FILE | sort | uniq -c | sort -rn。 正規表現にマッチした箇所を抽出し大雑把に見る。その上で重要だと思われる表現を目で見付け、そ れが使われている文を grep で抽出して吟味する。抽出箇所のみを見るのは危険。 ・汎用ツールの組み合わせで処理すれば、小回りのきいた処理ができる。団体旅行 vs. 個人旅行。 (KWIC や ngram も、UNIX/Perl の組み合わせで作成可能。) 1 ・特に、先行文献で不可とされているパターンを正規表現で記述し、電子テキストを検索する。反例 が見付かったら、それが真の反例か否かを見極める。真の反例の場合には、既存の仮説の微修正で済 むのか、それとも全く新しい仮説を提示する必要があるのかを考察する。記述研究は理論研究の出発 点でもある。 ・zigzag/criss-cross vs. *zagzig/*cross-criss: \b([a-z]+)[ao]([a-z]+)-?\1i\2 ・ wend *(one's way (PP)) : \bwend(s|ed|ing)? (?!(my|our|your|his|her|its|their) way\b) 3. コーパスの威力と限界 ・他の道具の欠点の補完:内省/直観の限界。母語話者は、特に慣習的・周辺的事例において、自らの 言語知識を意識化できるとは限らない。この観点からは、コーパスは「母語話者の内在化された言語 知識が無意識に発動された結果物(=実際の発話)を大量に集めた資料」と定義できる。「無意識の 知識のあぶり出し」のためのコーパス利用。 ・大抵の具体的な表現であれば、読書で(何とか)研究可能かもしれないが、ある条件を満たすパタ ーンの(特定資料内での)網羅的抽出にはコーパスの利用は不可欠。 例:副詞+形容詞。頻度のみならず統計処理も可能。"very long" vs. "grammatically well-formed "。 例:特殊な one's way 構文:He was making his bleary-eyed way into the kitchen. \b(?![io]n\b)\S+ (my|our|your|his|her|its|their)( \S+){1,2} way\b ・読書ではなかなか見付けられない周辺的な現象の実例を多数収集できる。周辺的現象は、頻度が低 く(=読書による例文収集の限界)、また母語話者の判断も揺れ易い(=母語話者の内省判断の限界) ので、コーパスの利用以外に妥当な研究方法は考えられない。コーパスのお蔭で、研究不可能だった 対象が研究可能な対象に質的変容を遂げる。Cf. 田野村 (2004)。 ・ 「2年の読書で何とかなるなら、2年かけましょう。20年かかるなら諦めてコーパスを使いましょ う。」(コーパス関連の勉強が、本業を圧迫しないように注意している。) ・限界:(i) どんなに巨大でも可能な言語表現を網羅していない。(ii) 否定的証拠の欠如。しかし、 間接否定証拠は得られるかもしれない。 ・コーパスは便利かもしれないが、不都合な道具とも言える。どんな仮説を立てても反例が見付かっ てしまう。その意味では、コーパスを使うと、論文が書きにくくなる。 4. コーパスを使う際に注意していること ・言語学的に興味深い周辺的な事例では、POS タグが間違っている可能性がある。できるだけ依拠せ ず、プレーンテキストを検索対象にする。 ・出典の吟味:同じ数の用例が検索されても、出典に偏りがある場合とない場合では、その数のもつ 意味が異なる。 ・コーパス検索の手順を記録に残す。特に、利用した正規表現を明示することは、他者による検証を 可能にするために重要。実験方法の明示化。ブラックボックス的な利用は避ける。Cf. 大名 (2012)。 ・英文法や言語学の用語に直接対応した検索は、ほとんどの場合、不可能。正規表現を使って明示す れば、一義に検索対象を規定できる。例えば、「現在進行形(疑問文は除く)」の文のみを網羅的に抽 出することは不可能。 「あなたにとっての現在進行形(疑問文は除く)は、(a)ですか(b)ですか、それとも?」 (a) \b(am|are|is) [a-z]+ing\b (b) \b(ain't|am (not)?|(are|is)(n't| not)?|'(m|re|s)( not)?) [a-z]+in(g\b|') (b)を使っても、He is now reading a book.は漏れるが、それでも良いか。be と Ving の間に介在しうる語 は何語と考えるのか。少なすぎると漏れが生じ、多すぎるとゴミが混入する。ほとんどの例が取れれ ば良いのか、網羅的に抽出する必要があるのかは、研究目的次第。 参考文献 Chomsky, N. 1965. Aspects of the Theory of Syntax. MIT Press. 梶田優. 1974.「変形文法」『文法論 II』(英語学体系第 4 巻)大修館書店. 大名力. 2012.『言語研究のための正規表現によるコーパス検索』ひつじ書房. 滝沢直宏. 2010.「周辺部を記述するための大規模コーパスの利用:その方法と留意点」『英語語法文法 研究』17: 23-37. 田野村忠温. 2004.「周辺性・例外性と言語資料の性格 --- その相関の考察 ---」『日本語文法』4,2: 24-37. 2 理論に求める切り口 深 谷 輝 彦(椙山女学園大学) [email protected] 1. どのようなコーパスをどのように使っているのか <形式から意味へ> 英語文法の分析実例(石川, 2012: 201f) :will/ be going to, must/ have to, can/ be able to <意味から形式へ> 文 法 的 メ タ フ ァ ー (grammatical metaphor): 「文法的メタファーというのは、上から下をみたときに生じ てくる概念である。 「上から下をみる」というのは、 「意味の面から、語形、あるいは文構造をみる」と いうことである。」(安井, 2008: 165) 【整合形 (congruent form)】 The soldiers invaded the town//and they destroyed the buildings// and stole many precious artifacts. 【非整合形 (noncongruent form】 The soldiers’ invasion of the town caused the destruction of the buildings and the theft of many precious artifacts. cf. [Reasons] preventions of important or critical information from falling into the wrong hands was definitely a competent move on the Federal government’s part. <使用するコーパスと調査対象> ●JEFLL(Japanese EFL Learner) Corpus(約 70 万語 中学 1 年∼高校三年英作文 ) ●調査対象:i) 評価形容詞 important の主語にみられる文法メタファー ii) of を含む名詞化表現 2. コーパスの威力と限界 i) important の主語にみられる文法メタファー 高校三年生 1. it 2. to eat breakfast 3. it 4. it 5. eating breakfast every morning 6. all things which is around me 7. Information of the disaster [Total] 中学三年生 8. I can play baseball 9, It 10. To have a breakfast 11 it 12. So it 13. taking breakfast [Total] that we know safety of … is (not) (very) important for me to play with them to buy a new CD is very important is one of the most important to survive the disaster thing 1 1 7 11 4 4 1 29 very important that we have breakfast is (not) (very) important 3 for me to eat breakfast! to bring out my cards (for us) 2 1 4 2 5 7 21 < Nouniness Squish (Ross 1973: 351)> that> for to > Q > Acc Ing> Poss Ing > Action Nominal > Derived Nominal > Noun ii) of を含む名詞化表現 Semantic shift 1. quality 2. process Class shift adjective > noun verb > noun i) process + range Example safe > safety iv) 'relating' process rid > get rid of celebration > celebration know > knowledge lack > lacking verb > noun finish > end ii) 'doing' process iii) 'sensing' process 3. phase of process (time) [total] 高三頻度 9 21 4 中三頻度 2 7 6 9 1 5 0 3 0 11 2 41 11 3. コーパスを使う際に注意していること Early childhood (6-8 y): ‘commonsense’ knowledge expressed in a congruent grammar (e.g.) personal response Late childhood-early adolescence (9-12 y): ‘commonsense’ knowledge’ is elaborated with grammatical metaphor emerging. (e.g.) review Mid-adolescence (13-15y): ‘uncommonsense’ knowledge & extended grammatical resources (e.g.) character analysis Late adolescence (16-18y): “uncommonsense” knowledge expressed in a noncongruent grammar (e.g.) thematic interpretation (Christie and Derewianka, 2008: 59, 218) 4. なぜコーパスを使うのか ◆様々な切り口を見つけられる ◆時間軸で言葉を追跡できる ◆研究に応じたジャンル設計ができる ◆意味体系、語彙・文法体系の構築に貢献できる 参考文献 Christie, Frances (2012) Language Education Throughout the School Years: A Functional Perspective. Wiley-Blackwell. Christie, Frances and Beverly Derewianka (2008) School Discourse. Continuum. 石川慎一郎(2012)『ベーシックコーパス言語学』ひつじ書房. Ross, John Robert. (2004) “Nouniness” in Bas. Aarts, David Denison, Evelien Keizer and Gergana Popova (eds.) Fuzzy Grammar. Oxford University Press, pp. 351-422. 安井稔(2008)『英語学の見える風景』開拓社. 4 コーパスシステム構築から見える英語学研究と英語教育 岡 田 毅(東北大学) [email protected] 1. なぜコーパスを使うのか 1.1 「まえおき」 研究履歴と過去・現在の研究課題 1.2 英語学研究と英語教育への応用 1.2.1 コーパスを利用しての英語研究 ² 英語学研究(文法・語法・文体 etc): 【例】軽動詞としての give の軽さ, Dickens 作品の発話文・地の 文の対照,TIME の通時的語法変遷, 映画シナリオの発話者別の表現比較, etc ² 英語学研究(変種・Englishes): 【例】L1 の相違と spelling error 傾向,日本人研究者の RV 使用傾向, etc ² 英語教育・学習支援:【例】日本人大学生にとっての readability 測定,協働型英文読解力養成支援シス テム,科学技術英語論文執筆支援テンプレート,英作文中の日本人固有の過誤, etc 1.2.2 コーパスシステム構築研究 ² コーパスそのものの「収集・蓄積・分析・利用」手法の研究 ² コーパスに付与し得る情報の研究 (文字を中心とした人間知識蓄積機構の探求,英語 CALL 教育現場 での協働型 annotation, etc) 2. どのようなコーパスをどのように使っているのか 2.1 既存コーパス ² BNC, BYU(COCA, TIME, Soap Operas), TOEFL 2000 SWAL Corpus, BAWE Corpus, Perc Corpus, ICCI, ICE-GB, LOB, SEC, SUSANNE, Penn Treebank, Wmatrix, CHILDES, LDC, Corpora ML, etc à 軽動詞 give の命令文中の用法,NS による学術論文中の RV の用法, 動詞活用形と genre, etc à BYU corpora での corpus community 運営法・クエリ記述支援法,ユーザー認証と使用制限, personal query 共有の可能性と限界 (à独自コーパスシステム構築へのヒント) 2.2 自作コーパス SAMANTHA, ATSUO/HENRY 等の error corpus(spelling error 分析),Materials Science corpus(JPN-made RV 傾 向),Linc English Reading corpus(readability 研究,読解用教材作成),TAM scenario corpus(リスニング教材作 成),Great Expectations/Tale of Two Cities corpus(文体研究),TIME corpus(通時的語法研究), etc 2.3 コーパス利用方法 ² 通常使用法: 【例】 SCN BNC à csv, txtà 加工 à Excel 等による統計処理 à AntConc 等のコンコーダンサ ² やや複雑な処理: 一次処理結果à 加工à UNIX tools (wc, cat, grep, sort, uniq, sed, etc) 一次処理結果à AWK, Perl 等のスクリプトによるフィルタ処理 ² 自作コーパス整備: RDBMS 上でのコーパスセット管理(情報系研究者との共同) 3. コーパスの威力と限界 3.1 ネット時代の電子テキストが持つ意味と意義 AI-based approach と corpus-based approach 3.1.1 ネット時代以前でも 1950-1960 年代: 言語データのコンピュータ処理研究,1 ビットでも削るプログラミング 5 汎用的コーパス システムの必要性 3.1.2 データの不整合さに対する寛容さ ハードウェアの処理能力,HTML ブラウザの能力 3.2 「高汎用性コーパスシステム」の再認識 質的保証・再利用可能性・持続可能性 3.2.1 共有・協働・拡張性の重要さ 【例】representativeness の問題,共有(sharing)と検証可能性(verifiability), etc 3.2.2 汎用的コーパス処理システム データ取り込み,任意属性付与,循環性と協働性(ユーザー参画型) à ppt スライド数枚 【例】コーパスセットの選択組み合わせと genre 研究,ARE による属性管理,corpus community としての 学習・教育支援環境,対面式 CALL 授業の中核: CHAPEL (ß CATMA と共通する user annotation) 3.3 「汎用性」をめぐって 機械可読性と電子性,テキストファイル,annotation / markup とは何か,TEI の試みと SGML の苦闘,XML と RDB: ARE の概念 4. コーパスを使う際に注意していること 4.1 著作権問題 歴史的にも,研究用コーパス利用時,教育用コーパス利用時(原典に対するユーザーの関わり),許諾を受 けた教材用素材の二次加工とユーザーグループとしての学習者群・教員群 4.2 システム管理・運用に伴う個人情報 ARE 機能を利用する各属性付与者管理,使い易さと機能選択の柔軟性(GUI) 参考文献 Garside, Roger, Geoffrey Leech and Anthony McEnery. (eds.) (1997) Corpus Annotation: Linguistic Information from Computer Text Corpora. Longman. Lüdeling, Anke, and Merja Kytö. (eds.) (2008) Corpus Linguistics: An International Handbook (2 vols). Walter de Gruyter. Mitton, Roger. (1996) English Spelling and the Computer. Longman. Okada, Takeshi. (2002) Conjugational Patterns and Text Categories in the LOB Corpus. In Saito, Toshio, Junsaku Nakamura, and Shunji Yamazaki. (eds.) (2002) English Corpus Linguistics in Japan, pp.43-62. Rodopi. Okada, Takeshi. (2005) Spelling Errors Made by Japanese EFL Writers: With Reference to Errors Occurring at the Word-initial and the Word-final Position. In Cook, Vivian, and Benedetta Bassetti. (eds.) (2005) Second Language Writing System, pp.164-183. Multilingual Matters. Okada, Takeshi and Yasunobu Sakamoto. (2010) A New RDBMS and Flexible POS Tagging for EFL Learners and Researchers: Designing a Corpus Analysis System Based on the Three-tier Model. CAHE Journal of Higher Education 5. Tohoku University: pp.43-52. 藤野玄大・坂本泰伸・岡田毅 (2012) 「ユーザ間の情報共有に立脚した英語教育および学習支援—協働を保証する高 汎用性コーパスシステムを用いて」 『e-Learning 教育研究』7. e-Learning 教育学会: pp.11-22. 言語処理学会 (編) (2010) 『デジタル言語処理学事典』 共立出版. 永崎研宣 (2012) 「人文学資料へのアノテーション—Text Encoding Initiative の挑戦」国立情報学研究所テキストアノ テーションワークショップ予稿 岡田毅 (1995) 『実践「コンピュータ英語学」テキストデータベースの構築と分析』音羽書房鶴見書店. 岡田毅 (2011) 「汎用的コーパスシステムにおけるユーザーの概念—RDBMS を中心に据えて」 『e-Learning 教育研 究』6. e-Learning 教育学会: pp. 11-24. 齊藤俊雄・中村純作・赤野一郎 (編) (2005)『英語コーパス言語学—基礎と実践』改定新版. 研究社. 鈴木聡・鈴木宏昭 (2011) 「マーキング・感情タグの付与を活用したライティング活動における問題構築的読解」 『日 本教育工学会論文誌』34 (4). 日本教育工学会: pp.331-341. 6 英語史研究とコーパス利用 家 入 葉 子(京都大学) [email protected] 1.なぜコーパスを使うのか (1) 英語史研究にとって、コーパス言語学への移行は自然な流れ 文献資料の形態が電子化しただけ 他の分野でも、たとえば The use of text corpora in American linguistics actually dates back to the early part of this century, when anthropologists such as Boas and Sapir collected corpora of folk-tales from Native American languages as databases for subsequent linguistic analysis, and this tradition continues to the present among anthropological linguists and social dialectologists who study corpora of tape-recorded speech. (Biber 1990: 257) (2) データ処理の正確さ 速さよりも正確さに魅力 ただし、速さが増すことで量の分析が可能になることは大きなメリット 2. コーパスを使う際に注意していること (1) できるだけ生のテキストのみを使用し、タグはあまり利用しない 文法化は徐々に起こる wherof I jnformyd Herry Boteler to tell my old lady of Suffolk, be cawse he is of her cowncell … (John Paston I) Cf. Personally, when I get hold of new corpus resources, I use the data files and discard or ignore any software that comes with them. However good the software might be, it will be designed to allow users to answer some fixed range of questions which the designer anticipates that people will want to ask. (Geoffrey Sampson in Viana et al. (2011: 202)) (2) 英語史研究に特有のヴァリエーション(特に綴り)に最大の注意を払う Eue biheold o then uorbodene eppele. (Ancrene Riwle, from the OED) This fatherlie prouision maketh the al myghtie and most mercifull Lorde al waies to helpe the~ that be hys. (1548 Philip Nicolls, The Copie of a Letter Sente to One Maister Chrispyne Chanon of Exceter) (3) 複雑な検索式を使わず、データベースに取り込んでから複雑な分析を行う 正確さを重視し、速度を犠牲にする (cf. 1.(2)) 3. どのようなコーパスをどのように使っているのか (1) 現代英語のコーパスは必ず利用(LOB, Brown, BNC, COCA, etc.) 現代英語との連続性は常に意識している コーパス言語学の特徴の一つでもあるヴァリエーションの考え方は変化への意識につながる (2) 史的コーパスでは、やはり Helsinki Corpus からスタート (3) 特定ジャンルのコーパス(The Bible in English, Corpus of English Dialogues 1560-1760) Balanced corpora から one-genre, one-register corpora への流れ The pioneer in the field of historical corpora is the Helsinki Corpus, a multipurpose, multigenre corpus, compiled in the 1980s by a research team at the University of Helsinki. It has been a useful tool to indicate new lines of research, but its text selection and sample size have proved too concise for some more specific research questions raised by pilot studies. The new direction in historical corpus compilation is towards one-genre, one-register corpora like the Corpus of Early English Correspondence … and the one presented in this article. (Taavitsainen 2001: 186) 7 (4) 史的変化の分析にはある程度の量が必要 電子化された資料を利用(The Oxford Dictionary on CD-ROM, EMEPS = Early Modern English Prose Selections) コーパスに収められたテキストを選択的に利用(ICAMET = Innsbruck Computer Archive of Machine-Readable English Texts) 4. コーパスの威力と限界(自身の研究との関連で) (1) ジャンルの定義の難しさ In the 16th century, the language of science was still Latin, and the so-called scientific writing that was produced in English in that period resembled more our modern textbooks for schools than our scientific writing. It was only during the latter half of the 17th century, with the foundation of the Royal Society, that scientific writing in English in the modern sense of the term was introduced. (Raumolin-Brunberg 1988:150) (2) 著作権 著作権の問題が起こらない代替資料を見つけることが容易ではない場合が多い Cf. It is available, however, to search and access the corpus via a web-based interface that allows for an extremely wide range of queries. KWIC displays are limited to more or less what one sees on Google or in Google Books - the node word(s) surrounded by 40-60 words. U.S. copyright law does allow for the use of copyrighted material, as long as (among other conditions) the end user does not have access to more than a certain percentage of the original text, and cannot ‘re-create’ the original text by stringing together different pieces of the text. (Mark Davies in Viena et al. (2011:76)) (3) 代表性の限界(これは威力でもある)(cf. 3.(3)) 中英語は方言の時代(代表性よりも個別性への関心) 初期近代英語期でも識字率が低い1(残された文献の多くは、特別な人たちが書いた個性の強い 文献資料) (4) 「コーパス言語学」が終わるとき(やはり威力でもある) (cf. 1.(1)) The time has perhaps returned to the pre-computer age where researchers selected materials to investigate in their own way, but now one sees a renewed form where researchers are able to select materials to investigate in their own way from electronic sources. The building of corpora has again become the work of individual scholars as well as that of institutions. (Iyeiri 2011: 135) I began by saying that “Corpus Linguistics” is not a special branch of linguistics. I would hope that its future is simply to fade away as a concept, because all concerned will take corpora for granted as one important set of tools in any linguist's toolbox. Some linguists will work with corpora most of the time, others more sporadically, and no doubt some will specialize in areas where corpora have little or no relevance. But it seems to me that it will be quite a failure if in forty years’ time the phrase “Corpus Linguistics” continues to be an established collocation. (Geoffrey Sampson in Viana et al. (2011: 204)) 参考文献 Biber, Douglas. (1990) Methodological Issues Regarding Corpus-Based Analyses of Linguistic Variation. Literary and Linguistic Computing 5(4): 257-269. Iyeiri, Yoko. (2011) Early Modern English Prose Selections: Directions in Historical Corpus Linguistics. Memoirs of the Faculty of Letters, Kyoto University 50: 133-199. Nicolson, Adam. (2011) When God Spoke English: The Making of the King James Bible. London: Harper Press. Raumolin-Brunberg, Helena. (1988) Variation and Historical Linguistics: A Survey of Methods and Concepts. Neuphilologische Mitteilungen 89: 136-154. Viana, Vander et al. (eds.) Perspectives on Corpus Linguistics. Amsterdam: John Benjamins. Taavitsainen, Irma. (2001) Language History and the Scientific Register. In Hans-Jürgen Diller and Manfred Görlach (eds.), Towards a History of English as a History of Genres, pp. 185-202. Heidelberg: Carl Winter 1 Nicolson (2011: 122) は、識字率が階級によって異なることを指摘し、労働者階級では、17 世紀の半ば になっても 95%の人が文字を読むことができなかった可能性に言及。 8 私のコーパス利用:研究・創作・趣味 投 野 由 紀 夫(東京外国語大学) [email protected] 1. なぜコーパスを使うのか 私は学士論文・修士論文は英語学習における辞書使用の効果や辞書スキルに関する実証的研究をしてい ました。1987 年,修士論文を完成させた時,COBUILD が刊行され,辞書の内容を革命的に変える「コ ーパス」というものに出会いました。1990 年前後はちょうど,辞書編纂がドイツを中心としたテキス ト言語学的な辞書学理論構築が進んでいて,辞書学という分野の構築という抽象化に対して Sinclair が 「辞書はテキスト(言語使用データ)に忠実に使用の実態を記述すべきだ」という経験論的なアンチテ ーゼを出し (Moon 2007),私は言語学習とコーパス,語彙学習と辞書などの接点から深く自分の研究の 進むべき方向について模索していた時期だったのです。 そして結論は,今後爆発的に増大するコーパス・データとその分析手法を深く学び,それを自分の研 究分野の辞書学,第 2 言語語彙習得研究,英語教材作成,シラバス開発等に多面的に応用していくこと でした。そのために 1990 年代後半に渡英して 3 年間ランカスター大学大学院博士課程で研究し,集中 的にコーパス言語学を学ぶという道を選びました。コーパスはそういう意味で自分の「研究の革命的道 具」,どうしても学ばなければならなかったものだったと言えましょう。 2. どのようなコーパスをどのように使っているのか コーパスは大別すると,①自分の研究用,②論文執筆用,③趣味の収集用,という感じです。①はさら に大別して,(a) 辞書編纂用に用意しているコーパス群,(b) 英語教材作成用に用意しているコーパス 群,(c) 第 2 言語習得・学習者言語研究用のコーパス群,(d) CEFR などの言語シラバス構築用のコーパ ス群,となっています。用途に応じて,中心に使うコーパスを決め,そのコーパスにさまざまな分析の 変数を加えてデータ加工します。たとえば,辞書・英語教材作成用には Sketch Engine の enTenTen の ような 100 億語規模のデータから切り出したコロケーション・データを用意,それに JEFLL などの学 習者コーパスからのコロケーション情報を対比できるように付与し,かつ共起語の語彙レベルを CEFR などの独自の語彙表から切り出して貼っておくなどの加工をして,参照データとして用意しておきます。 こうすると,単なる1つのコーパスからのデータだけではなく,複数のコーパスからの総合指標のよう な情報を持ち合わせたコロケーション DB 的なものを独自の視点で作ることができます。私の場合は辞 書を使うユーザーのターゲット,英語力レベルなどを勘案してネイティブのデータに学習的観点を入れ て加工したデータをいろいろ作るということを,プロジェクトごとに繰り返しています。 また研究データとしては,目的を明確にした自作コーパスを増やすことを心がけており,JEFLL, NICT JLE, ICCI など大型の研究プロジェクトを立ち上げて構築してきました。また近年はコーパス分析の手 法を,文科省の中高英語力テスト・データ,Benesse の GTEC の作文データ, NHK 基礎英語の歴代のス 9 キット・データなどに応用するプロジェクトを立ち上げて総合的に言語教育環境をコーパスで改善する 試みも行っています。 ②は研究論文を書くための表現を検索するために,Sketch Engine にコーパスや関連分野の論文をコ ーパスとして入れて辞書代わりに引くことが多いです。最近は Google Scholar でほぼ同じことができる ようになりましたが,KWIC で見られるのが何よりの利点です。 ③は単なる趣味ですが,新しいコーパスの公開案内などを見ると,できるだけ手元におけるものはす べてダウンロードして,言語,レジスター,アノテーションなどの種類ごとに分類して補完しておきま す。時間があればどんな中身かいじるようにしています。 3. コーパスの威力と限界 威力は圧倒的な量の実例をコンピューター処理することで,言語使用の確率的な側面を浮き彫りにす ること,人間の気づかない使用パターンなどの発見といった新しい知見が得られることだと思います。 これを「英語力のコアは何か?」 「ある単語の用法をどこまで学ぶべきか?」 「学習者はどのように語彙・ 文法を学んでいくのか?」といった,私が知りたかった英語教育の本質的な問いにからめていくことで, 有効な研究方法が見えてきます。 限界はいろいろあると思いますが,大きく分ければ 2 点あります。1つは「アウトプット(産出 production といってもよい)しか見えないこと」です。言語使用の受容(reception)の側面は別の方法 で研究しないといけません。もう1つは Garbage in, garbage out ということ。適切なコーパスの選択(作 成),適切なデータ抽出方法が肝要です。 4. コーパスを使う際に注意していること 最も注意しているのは,言語特徴の頻度データを出した後の「意味づけ」の部分です。最近ではさまざ まな機械学習や統計の手法を駆使するようにしています。自然言語処理の技術とコーパス言語学は表裏 一体です。両面に明るい方が絶対によい。言語習得・学習に対する専門的な知見・洞察力とデータ処理 の高度な技術が相俟って,誰も予想しなかったような発見をする,その筋道を過たないようにプロとし て研鑽を積む。地道なデータ加工と失敗を何度も重ねる実験的データ処理。それが私のコーパス利用の 態度です。 参考文献 Moon, R. (2007). Sinclair, lexicography, and the Cobuild Project: The application of theory. International Journal of Corpus Linguistics 12 (2): 159-181. 10 シノニム・語法研究と辞書編集のためのコーパス活用 井 上 永 幸(広島大学) [email protected] 1. なぜコーパスを使うのか (1) 母語話者が発信のために自然に発した言語を分析対象とするため。 2. どのようなコーパスをどのように使っているのか (2) シノニム・語法研究:WordbanksOnline, BNC〔その他,Sketch Engine から利用できるもの〕,COCA 〔その他,CORPUS.BYU.EDU から利用できるもの〕,独自に集めたテクストなど;KWIC 表示や各種 統計値を利用。 (3) 辞書編集:出版社提供のバランストコーパスを中心に,その他コーパスを確認用に用いる;KWIC 表 示や各種統計値を利用。 (4) 教育:専門の授業で WordbanksOnline, BNC;教養教育の授業で「用例コーパス」 〔http://wdme1.dual-d. net/corpusmainnewhin.cgi〕を使った小テスト作成。 3. コーパスの威力と限界 (5) 井上 (2010), p. 18. まず,共起する名詞については,quiet は,場所,期間,事,感情・態度,人など,多様な名詞と用い られるのに対して,silent は,行為,映画,人,期間,場所などを表す名詞と用いられる。silent は, 通常は言語や音声を伴うものを無言あるいは無音で行う場合,もともと無言あるいは無音で行われる ものでも対照的に強意で付加される場合に好まれる。共起する副詞についても,quiet は多様な副詞と 用いられるが silent はもともと強意のため,一部の極大詞や,あまりの静けさに疑問を感じたり恐ろ しさを感じることを表す副詞,主語の強い意志を暗示する副詞と相性がよい。共起する動詞について は,quiet と silent で共通して用いられる共起する動詞も多いが,対照的な文脈で強意を表すものは場 合,silent が好まれる。静かさを表す語として無標の quiet に対して,無音や無言をことさら強調する silent ということになる。〔下線は発表者〕 (6) 井上 (2010), pp. 19–20. 30 31 32 33 34 35 36 37 38 39 40 41 42 free on November 3, 1922, in a ceremony that he kept hrough the jungle to get there and were warned to be face down and open across her thigh. He tried to be ere they got it from, we've done our best to keep it d but that's irrelevant. Lake wanted everything kept to restrict her salt intake, and to rest and remain to restrict her salt intake, and to rest and remain ing" because most of the equipment is designed to be y Pressing her hand hard against her mouth, she kept XP, Microsoft recommended that a computer "should be r I is seen from the nose and mouth, keep the animal the light from windows and space in which to teach. ill For the sake of everyone it is better to keep it as as as as as as as as as as as As as quiet quiet quiet quiet quiet quiet quiet quiet quiet quiet quiet quiet quiet as as as as as as as as as as as as as possible, Brecht married the five months' possible. But Lucy found the thought of c possible, but she mumbled, seeming to sen possible, but they made a circus of it." possible. He was due for retirement in tw possible. Hospital admission is essential possible. Hospital admission is essential possible. However, when a submarine is ca possible so as not to disturb her sleepin possible so that it is welcome in the kit possible until help arrives or until it i possible, using soundproofing to stop sou possible. We must wait for the referee's (7) 井上 (2010), p. 21. なぜ,as quiet as possible が見られて,as silent as possible が見られないのかは, 〔途中略〕silent の段階 性の低さに関係すると思われる。通常の段階性を有する quiet が原級比較と生起し,極限に近い強さ を表す silent が原級比較と生起しにくいことに矛盾はない。 4. コーパスを使う際に注意していること (8) コーパスを単なる用例集としてではなく,また,既存の辞書・参考書・論文等の記述の検証用として だけでなく分析対象として用い,日本人英語学習者に必要な情報を抽出し一般化を目指す。 (9) コーパスソースの独自性に分析結果を左右されないようにすること。 →目的に応じてコーパスソースに気を配る必要がある。 11 (10) 井上 (1998), pp. 82–83. a. occur の MI-score リスト word freq MI-sco word freq MI-sco . 3 8.60591 re . 3 6.31022 re 1 linz 1 lubrication 3 2 8 epidemics 7 5 2 dendritic 4 8.48036 1 3 6.28375 3 8 9 pregnancies 2 6 3 implantatio 6 8.15840 2 8 6.27069 3 0 7 4 n fertilization 10 8 7.94426 2 erection 9 5 6.03534 3 2 1 8 5 menarche 4 7.89534 2 reflexes 4 5.98826 3 7 2 7 9 6 ovulation 17 7.55651 2 combustion 3 5.89514 4 2 3 hallucinations 8 0 7 deforestatio 4 7.39279 2 3 5.89514 4 n 7 4 commonly 8 1 8 equinox 4 6.98836 2 25 5.89274 4 6 5 arousal 5 2 9 breakthroug 5 6.96925 2 10 5.88317 4 6 3 1 hs ejaculation 15 6 6.66597 2 outbreaks 4 4 5.83624 4 0 9 7 9 4 1 backache 3 6.57328 2 breakdowns 3 5.81713 4 1 8 8 8 5 1 nio 3 6.54157 2 reactive 3 5.79827 4 2 6 9 7 6 1 correlations 3 6.51054 3 distancing 3 5.72520 4 3 eclipses 6 0 uterus 6 7 1 3 6.45041 3 6 5.71632 4 4 9 1 misunderstandi 7 8 1 erikson 4 6.41407 3 3 5.69001 4 5 2 9 1 menstruatio 3 3 6.39269 3 ngs naturally 64 3 5.67918 5 6 n 7 3 9 0 1 leakage 3 6.33719 3 extramarital 4 5.63459 7 7 4 5 Data drawn from the Bank of English corpus created by COBUILD at the University of Birmingham. word precipitatio n cancers spontaneous ly notification vaginal defect orgasm schizophren ia orgasms delusions flare incident radioactive diffusion infections revolutions freq . 3 7 5 4 7 5 10 4 4 3 6 61 10 4 10 3 MI-sco re 5.60561 3 5.53923 7 5.48006 9 5.45769 9 5.44821 7 5.43567 1 5.41397 3 5.40324 6 5.36111 6 5.35077 3 5.31682 3 5.30488 1 5.30213 4 5.30014 2 5.28627 8 5.25765 5 ※網掛け部分は人名または地名(の一部)。 b. occur と commonly のコロケーション Q. Name your most commonly occurring dream/nightmare. <p> A. That I'm a superhu Q. Name your most commonly occurring dream/nightmare. <p> A. Swimming in a warm Q. Name your most commonly occurring dream or nightmare. <p> A. The dream is th c. occur と naturally/spontaneously のコロケーション > It is in fact a mineral that does occur naturally in the form of cubic, or mor us ever since the earth was formed, occurring naturally in our surroundings. Onl start off with an atom of naturally-occurring uranium the isotope of uranium whi adults; they have few spontaneously occurring sexual fantasies; and they do not more authentic and meaningful if it occurs spontaneously, which precludes anythi d. Summers (1997) (s.v. OCCUR, p. 339)〔下線は発表者〕 FORMAL to happen – use this especially about changes, chemical reactions, and other things that happen naturally: Major earthquakes like this occur very rarely. | The metal becomes liquid if heated, and this occurs at temperatures of over 300 °C. | Death occurred at approximately 12.30. e. 辞書編集とコーパス活用 いくらコンピュータの進歩によって大量のデータが短時間のうちに処理できるようになったとし ても,コーパスの構成によって得られる結果は当然違ってくるであろうし,コーパスからどのよ うな結果を採用し,採用した情報をどのように辞書の紙面に反映させるかはあくまで人間である。 集めたデータを生かすも殺すも,執筆者や編集者の知識や経験,そして勘によるところが大きい ことは今も変わっていない。Summers (1996, pp. 261–62) も指摘するように, 「コーパスに縛られる (corpus-bound)」のではなく,あくまで「コーパスに基づく(corpus-based)」といった態度が必要 であろう。 参考文献 Church, K.W. & P. Hanks (1990) “Word Association Norms, Mutual Information and Lexicography,” Computational Linguistics 16, 1: 22-9. 井上永幸 (1998)「学習英和辞典における語法情報とコロケーション情報 ―コーパスで何ができるか―」, 『英語教育と英 語研究』第 15 号(島根大学教育学部英語科教育研究室),pp. 71–85. —— (2001)「コーパスに基づくシノニム研究 ―happen と take place の場合―」 『英語語法文法研究』第 8 号(英語語法文 法学会),pp. 37–53. —— (2010)「コーパスを活用した英語シノニム・語法研究 ―quiet と silent―」 『人間科学研究(広島大学大学院総合科学 研究科紀要 I)』第 5 巻,pp. 1–23.〔平成 20 年度∼平成 24 年度科学研究費補助金(基盤研究(C),20520442) 「コー パスを活用した英語シノニム・語法研究」に基づく〕 ——・赤野一郎編 (2013)『ウィズダム英和辞典』第 3 版.三省堂. http://dictionary.sanseido-publ.co.jp/dicts/english/wisdom_ej3/ Summers, D. (1996) “Computer Lexicography: the Importance of Representativeness in Relation to Frequency,” in Thomas and Short (1996), pp. 260–66. —— (ed.) (1997) Longman Essential Activator. Harlow: Longman. Thomas, J. and M. Short (eds. ) (1996) Using Corpora for Language Research. Harlow: Longman. 12 マイニングとテクスト研究 田 畑 智 司(大阪大学) [email protected] 1. なぜコーパスを使うのか 筆者の興味の対象は英語のスタイルです。特に,19 世紀ヴィクトリア朝を代表する作家 Charles Dickens の stylistic/textual features に関心があります。テクスト間やテクストの構成要素間には重層的かつ複雑な 関係性があり,精読と手作業だけでデータの処理・分析を行うのには限界があります。また,依拠する 理論・仮説(ドグマ)やドクサにとらわれて,事実を歪曲して捉えてしまったり,重要な情報を看過し てしまう危険性もあります。 筆者は,統計学的マイニングの方法論を応用することで,コーパスデータを「探索的」に解析し,テ クスト間,構成要素間,さらにはテクストと構成要素との間に通底するパターンを視覚化することに努 めてきました。このアプローチによって,直感や精読だけでは発見が困難な,著者・語り手の文体的特 徴を反映する様々なパターンを掘り起こし,それにコンコーダンスラインの sensitive reading を組み合わ せたテクスト分析を実践しようと試みています。 2. どのようなコーパスをどのように使っているのか 史的観点から文体研究を行うために筆者が編纂した Osaka Reference Corpus for HIstorical/ Diachronic Stylistics (ORCHIDS)を主に活用しています。ORCHIDS は以下の 3 つのサブコーパスより成ります。 Dickens component: 24 files; 4,842,337 tokens; 55,554 types 処女作の Sketches by Boz から遺作 The Mystery of Edwin Drood(未完)に至る Dickens の作 品 24 点を収録。Fiction, sketches, history などの作品ジャンルを含む。 th 18 Century component: 24 files; 4,493,348 tokens; 64,282 types Defoe, Fielding, Goldsmith, Richardson, Smollett, Stern, Swift など 18 世紀の代表的作家の散文 作品 24 点を収録。 th 19 Century component: 31 files; 5,292,795 tokens; 59,457 types Austen, Brontë 姉妹,Collins, G. Eliot, Gaskell, Thackeray, Trollope など 19 世紀の散文作品 31 点を収録。 Total: 79 files; 14,628,480 tokens; 113,827 types このコーパスは Dickens に関しては小説全作品を収録しており,母集団全体の調査を行うことが可能で す。つまり,Dickens サブコーパスが研究対象そのものであるという点で,標本としてのコーパスを解 析し,目に見えない母集団の言語態を推定する一般的なコーパス言語学と事情が異なるかもしれません。 しかし,Dickens の特徴を特定するためには,常に他の参照コーパスとの比較が不可欠です。参照コー パスは母集団を代表すべく抽出した標本の集合ですから,Dickens と参照コーパスとの比較には推測統 計学の考えが当てはまる点で,実はコーパス言語学一般の問題と変わりありません。 また,ORCHIDS から得られた知見や仮説を検証したり,現代英語のデータと比較参照するのに, BNCweb や COHA,GoogleBooks Corpus が役立っています。 筆者は,コーパス分析の主たるツールとして,Mac OS X 用の高性能コンコーダンサーCasualConc(英 語コーパス学会 Newsletter 70 号 Forum 記事参照)と統計解析言語 R を用いています。CasualConc は XML 形式のファイルにも対応しているのに加え,多彩なコーパスファイル情報抽出機能を備えており,多変 13 量解析のデータとなる語彙頻度プロファイル作成に役立ちます。他方,R はテクスト処理のプログラミ ングの他,一連の統計解析を効率良く実行するのに欠くことのできないツールです。特に,多変量解析 を実行し,解析結果を多次元グラフで視覚化するのに大いに活用しています。 3. コーパスの威力と限界 コーパスの威力は言うまでもなく,デジタルであることで,正確な検索結果の提示から,数量的分析に よるデータの視覚化が効果的に行えることです。上記の CasualConc や R を利用することでコーパスデ ータを瞬時に視覚化することが可能になり,分析者は解析結果の質的解釈とコンコーダンスラインの 「読み」を組み合わせた考察(本来の仕事)に専念することができるような環境が整ってきました。ま た,コーパスは,手順さえ適切であれば,知見の再現が可能です。また,往々にして分析者が依拠する 理論や仮説に反する言語現実を否応なく提示するなど,言語研究に科学的 replicability と verifiability を もたらしたと言えます。 その一方で,コーパスは「生起しない項目・現象」については何も語ってくれません。コーパスに無 い項目や現象をどのように考えるかは難問です。コーパスは分析者が正しい問いをしない限り答えを返 してくれません。現状では,コーパスが力を発揮するのは単語やコロケーション,n-gram レベルの現象 が主であり,単語レベルを超えた同義表現,アイロニーやユーモア,風刺や戯画的表現など,その理解 に広い文脈や背景的知識を要する意味的な現象を探索的に調査するのは極めて困難なことです。 4. コーパスを使う際に注意していること 適切な問いをすること,適切なリサーチデザインをすることは勿論ですが,デジタルツールにまかせる べき仕事と人間にしか出来ない仕事を明確に区分し,適切な役割分担をすることが何より重要だと考え ています。巨大なデータを縮約し視覚化するツールは,分析者の洞察を伴って初めてその真価を発揮す るものです。ツールの仕事はあくまで人間の目や手だけでは処理できない作業を,漏れなく高速に実行 することです。語句や表現形式の生起箇所の索引化や,データの整形処理,頻度計算,統計量の算出な ど分析者を支援する作業は電子ツールにまかせるべき仕事です。対照的に,データの解析結果を質的に 解釈し,テクストや作家の文体的特徴を特定の視点や原理に基づいて記述し説明することは人間にしか できない,人間が専念すべき仕事だと常に心に銘記するようにしています。 参考文献 Burrows, J. F. (1987) Computation into Criticism: A study of Jane Austen's novels and an experiment in method. Oxford: Clarendon Press. Hoey, M. (2005) Lexical Priming: A new theory of words and language. London: Routledge. Hori, M. (2004) Investigating Dickens' Style: A Collocational Analysis. New York: Palgrave Macmillan Mahlberg, M. (2007) Clusters, key clusters and local textual functions in Dickens, Corpora, 2/1: 1–31. 田畑 智司 (2012)「第 4 章 文体とコロケーション」堀 正広(編) 『これからのコロケーション研究』ひつじ 書房. アプリケーション 今尾 康裕 (2013) CasualConc. Version 1.9.6. [Mac OS X application]. Retrieved 26 March 2013. https://sites.google.com/site/casualconc/ The R Foundation for Statistical Computing (2013) R. Version 2.15.3. Retrieved 30 March 2013. http://www.r-project.org 14 3 つ の 柱 「 テ ク ス ト の 読 み 、 言 語 理 論 、 コ ー パ ス 利 用 」 堀 正 広(熊本学園大学) [email protected] 1. な ぜ コ ー パ ス を 使 う の か ・ コ ー パ ス を 使 う 前 は “Cards, cards, cards.” ・ 電 子 テ キ ス ト の 登 場 ( 1994 年 Dr. Fred Levit よ り Dickens 作 品 の e-texts を 購 入 ) ・ Conc for Mac か ら AntConc へ 2. ど の よ う な コ ー パ ス を ど の よ う に 使 っ て い る の か ・ G u t e n b e r g の 電 子 テ キ ス ト を 利 用 ( 自 作 コ ー パ ス )、 B N C , G o o g l e B o o k s ・ 参 照 コ ー パ ス ( Chadwyck-Healey 社 の 18・ 19 世 紀 の フ ィ ク シ ョ ン の コ ー パ ス ) ・検索・頻度・コロケーション・クラスター 3. コ ー パ ス の 威 力 と 限 界 コーパスの威力 ・コンコーダンスの威力と読み ・ 機 能 語 の コ ロ ケ ー シ ョ ン 、 機 能 語 を 含 む lexical bundles ・ Reference Corpus に よ る 裏 付 け コーパスの限界 ・ 頻 度 の 持 つ 意 味 と 頻 度 ゼ ロ の 意 味 : fat salary( 2例 、 BNC) と stout book( 1例 、 BNC) ・ 頻 度 の 示 す 意 味 と 限 界 ( コ ー パ ス に よ っ て 得 ら れ た デ ー タ ー は 何 も 語 ら な い 。) 表 1 D i c k e n s と A u s t e n の 作 品 中 の h a n d , h e a d , e y e の 頻 度 A Tale of Two Cities Dickens Corpus Austen’s works (13,7000 words) (4,380,000 words) (781,000 words) Word Freq. /10,000words Freq. /10,000words Freq. /10,000words hand(s) 370 27 8,912 20 380 5 head(s) 219 16 6,144 14 253 3 eye(s) 200 15 5,884 13 477 6 15 4. コ ー パ ス を 使 う 際 に 注 意 し て い る こ と :3 つ の 柱 ( 1 ) テ キ ス ト の 読 み ・ こ と ば と 文 脈 と 時 代 背 景 ・ 共 時 的 な 視 点 と 通 時 的 な 視 点 ( 2 ) 言 語 理 論 ・ 文 体 論 ( レ ジ ス タ ー ・ 地 の 文 と 会 話 ・ 人 物 描 写 ・ 個 人 語 ・ 語 り ・ 変 化 な ど ) ・ コ ロ ケ ー シ ョ ン ( 語 彙 的 ・ 文 法 的 ・ 意 味 的 コ ロ ケ ー シ ョ ン ) ( 3 ) コ ー パ ス の 利 用 ・ 読 み の 立 証 ・ 新 た な 発 見 最 後 に ・ 主 体 的 に コ ー パ ス を 使 う ・ 共 同 研 究 の 勧 め D i g i t a l D i c k e n s L e x i c o n ( 仮 称 )( 総 勢 2 4 名 ) 代表:黒瀬保(西南大学名誉教授) 顧 問 : 伊 藤 弘 之 ( 熊 本 大 学 名 誉 教 授 )、 田 中 逸 郎 ( 広 島 大 学 名 誉 教 授 ) 実行委員長:堀正広(熊本学園大学) 実 行 委 員 : 地 村 彰 之 ( 広 島 大 学 )、 今 林 修 ( 広 島 大 学 )、 田 畑 智 司 ( 大 阪 大 学 ) 委 員 : 中 川 憲 ( 安 田 女 子 大 学 )、 脇 本 恭 子 ( 岡 山 大 学 )、 水 野 和 穂 ( 広 島 修 道 大 学 )、 福 元 広 二 ( 広 島 修 道 大 学 )、 大 野 英 志 ( 倉 敷 芸 術 科 学 大 学 )、 澤 田 真 由 美 ( 愛 知 学 院 大 学 )、西 尾 美 由 紀( 近 畿 大 学 )、舩 田 佐 央 子( イ ン デ ィ ア ナ 大 学 客 員 研 究 員 )、隈 元 貞 広 ( 熊 本 大 学 )、 高 口 圭 轉 ( 安 田 女 子 大 学 )、 竹 下 裕 俊 ( 尚 絅 大 学 )、 加 茂 淳 一 ( 元 九 州 ル ー テ ル 大 学 )、 村 田 和 穂 ( 有 明 高 専 )、 村 田 倫 子 ( 熊 本 学 園 大 学 非 常 勤 講 師 )、 永 崎 研 宣 ( 人 文 情 報 学 研 究 所 )、 池 田 裕 子 ( 熊 本 大 学 非 常 勤 講 師 )、 三 宅 真 紀 ( 大 阪 大 学 )( 順 不 同 、 平 成 2 5 年 4 月 現 在 ) 参考文献 Hori, Masahiro (2004) Investigating Dickens' Style: A Collocational Analysis. Basingstoke: Palgrave Macmillan. 堀 正 広 ( 2 0 0 9 )『 英 語 コ ロ ケ ー シ ョ ン 研 究 入 門 』 研 究 社 . Mahlberg, Michaela (2013) Corpus Stylistics and Dickens’s Fiction. New York: Routledge. 16
© Copyright 2025 Paperzz