1 フランスの特徴的なコーパス研究:語彙研究と政治ディスコース研究

フランスの特徴的なコーパス研究:語彙研究と政治ディスコース研究
藤村逸子
In France, corpus is a collection of entire texts on a particular research subject. The
major tasks of linguists of French corpus studies are the construction of the corpus
and the interpretation of it. In this paper, two characteristic corpus studies in French
tradition will be examined: lexicology, especially lexicostatistics on the one hand,
and political discourse analysis on the other. Corpus linguistics is a study of the
“norms” of various genres by analyzing appropriate corpus. This approach
contributes to general linguistics by narrowing the gap between a linguistic system
and usage.
0. は じ め に
フ ラ ン ス 語 の Corpus は 、
「 資 料 体 」と い う 意 味 で 、人 文 科 学 、社 会 科 学 、哲 学 、
法学などの分野で用いられてきた伝統的な用語である。現代の言語科学におい
ても、コーパスには必ずしも電子化された巨大なデータというイメージが伴う
わけでないこと、またコーパスの構築・選択、およびコーパスから得られたデ
ータの解釈に重大な関心が払われることは、この伝統に由来している。本稿で
は、英語のコーパス研究と対照させる意図のもとに、フランスにおけるコーパ
ス研究の特徴と、代表的な二つのコーパス研究である語彙研究と政治ディスコ
ース研究を、その歴史を踏まえて紹介し、最後にフランスにおけるようなコー
パスの扱い方が言語学一般にもたらす貢献についてまとめる。研究史を一覧す
るために、末尾には年表を掲げた。
1.
フランスにおけるコーパス研究の特徴
フランスにおけるコーパス研究の特徴を、英語圏で行われているものと対比し
て強調するならば、次の4点を挙げることができる。第一に「コーパス」の定
義の違い、第二に意味の問題への傾斜、第三に語彙の計量研究が伝統的に盛ん
であること、第四にテキストやディスクール研究との親和性である。フランス
1
ではこれら以外にも、さまざまなコーパスを用いた研究が行われているし、フ
ランス語の研究はフランス以外に、ベルギー・カナダ・スイス・ドイツ・北欧
などで盛んに行われている。したがって、以上の4点がフランス語のコーパス
研究において真に特徴的であるとは限らないが、本シンポジウムの趣旨に沿っ
て、英語との違いを強調する意味で、これらに注目したい。
1.1. コ ー パ ス の 定 義
フ ラ ン ス の コ ー パ ス 言 語 学 に お い て 、 Corpus [kɔʁpys] と い う 語 は 、 今 も な お 、
「特定の研究目的のために、ジャンルなどを考慮して構築されたテクストの集
合」という伝統的意味で用いられている
(Habert et al. 1997, Rastier 2002,
Condamines 2005)。こ の 定 義 は 、英 語 に お い て も 伝 統 的 定 義 と し て 存 在 す る が 、
英語では今では、
「 大 規 模 で あ る こ と 」と「 電 子 化 さ れ て お り コ ン ピ ュ ー タ で 分
析 で き る こ と 」が 、現 代 的 意 味 で の Corpus の 定 義 と し て 認 知 さ れ て い る の と は
異なっている。フランスにおいてコーパスはテキストの集合であって、語の集
合ではない。テキストとは完結したものでなければならない。よって、コーパ
スにはテキストの全体が含まれなければならず、テキストの一部の集合ではあ
りえない。たとえば、テキストの一部に外国語からの引用があったとしても、
完 結 性 が 損 な わ れ る の で 、 そ れ を 削 除 し て は な ら な い 。 Rastier (2002)は 、 BNC
( = British National Corpus)は コ ー パ ス で は な い と い う 。BNC は テ キ ス ト の サ ン
プ ル の 集 合 だ か ら で あ る 。 同 様 に 、 Rastier (2002)に よ る と 、 フ ラ ン ス で 最 大 規
模 の 電 子 化 さ れ た 言 語 資 料 で あ る Frantext は コ ー パ ス で は な く 、 ア ー カ イ ブ
(archives)で あ る 。な ぜ な ら 、Frantext は 特 定 の 研 究 目 的 の た め に 集 成 さ れ て い
る わ け で は な く 、任 意 に 選 択 さ れ た テ キ ス ト の 保 管 庫 だ か ら で あ る 。使 用 者 は 、
Frantext か ら 自 分 の 目 的 に 合 わ せ て テ キ ス ト を 選 び 、
「 コ ー パ ス 」を 構 築 す る こ
とが可能であるが、それでもなおコーパスの厳密な定義からは外れる。なぜな
ら 、 Frantext で は 技 術 的 ・ 法 的 理 由 に よ り 、 一 つ 一 つ の テ キ ス ト の 全 体 に ア ク
セスできないからである。フランスのコーパス研究で重要視されているのは、
コーパスを構成するテキストの選択であり、コーパスから得られたデータの解
釈である。コーパスの構成によって研究結果に差異が生じるという問題には敏
感であり、
「 あ る 言 語 を 代 表 す る コ ー パ ス を 構 築 し 、そ れ に 基 づ い て 言 語 を 客 観
2
的に記述する」という考え方には懐疑的である。
1.2. 意 味 論 へ の 傾 倒
コーパスを用いた研究の主目的が意味の生成への関心であるということも、フ
ランスの言語科学におけるコーパス研究の特徴である。フランスの言語学一般
の伝統として、統語論や形態論など言語の表現に関する研究に比べて、言語の
内 容 で あ る 意 味 へ の 関 心 が 高 い と い う こ と が あ る 。 語 の siginification( = 辞 書
的 意 味 )は langue に お い て 規 定 さ れ る が 、sens( = 意 味 )と valeur (= 価 値 )は
テキストとコンテキストから生成されると考えられているので、意味の研究の
対象はテキストの集合、すなわちコーパスということになる。テキストは言語
学の最小単位であり、一つずつのテキストに対してコーパスはコンテキストと
なる。コーパスはテキストの単なる寄せ集めであってはならず、テキスト間の
関係が重視される。
1.3.
語 彙 計 量 学 (lexicométrie): 情 報 工 学 と の 近 接 性
フ ラ ン ス は 、 語 彙 の 計 量 的 研 究 が 盛 ん で あ る 。 そ れ は 、 1950-60 年 代 に 欧 米 ・
ロシア・日本において始まった機械翻訳の研究にさかのぼり、言語学と情報工
学の親密な関係が当初から今日に至るまで続いている。この点は、とくにアメ
リ カ に お け る 状 況 と 異 な っ て い る と Léon(2001)は い う 。 1950-60 年 代 の ア メ リ
カには機械翻訳に興味を持つ言語学者は存在せず、経験的・統計学的研究方法
は好まれなかった。また、当時のアメリカの言語学では二言語間の翻訳研究と
いう観点が希薄であったため、言語分析の単位として、単一の言語の中で形式
的に確定可能な「形態素」が選ばれ、2 言語間の辞書の編纂において必須の単
位となる「語」には注意が払われなかった。一方フランスでは、当初より多く
の 著 名 な 言 語 学 者( Cohen、Culioli、Benveniste、Gougenheim な ど )が 言 語 の 自
動処理の研究に多かれ少なかれ参加した。フランスで盛んだったのは、英国や
アメリカとは異なり、語彙表の自動生成であり、語彙研究の機械化であった。
それに伴い、分析の単位としての「語」が議論され、イディオムなど、語の認
定に関する研究が始まった。同時に、統計学を文体論、文献学、方言学、言語
教育に応用する研究も行われた。
3
1.4.
ディスクール分析との関係
フ ラ ン ス の コ ー パ ス 研 究 は さ ら に デ ィ ス ク ー ル 分 析 ( Analyse du discours)と の
繋がりがある。上に述べたように「コーパス」はテキストの集合と定義される
のでこの連携に不思議はないが、フランスのディスクール分析がイデオロギー
とコンピュータ解析とに強い親和性がある点は注目すべきである。フランスの
「 デ ィ ス ク ー ル 分 析 」 の 創 始 者 と い わ れ る ペ シ ュ ー ( M. Pêcheux)は 1969 年 に
Analyse automatique du discours [デ ィ ス ク ー ル の 自 動 分 析 ]を 発 表 し た 。 彼 の デ
ィスクール論は、ディスクールはイデオロギーの具体化であるという、マルク
ス主義者であったアルチュセールの流れを引いでいる。ディスクールの分析に
あたり、ペシューは、分析方法自体がもつイデオロギー性を排除するためには
経験論的・実証的方法が必要であるとして、情報工学・数学の専門家の協力の
も と に コ ン ピ ュ ー タ を 使 っ た 分 析 方 法 を 提 案 し た 1 。そ れ が「 デ ィ ス ク ー ル の 自
動分析」である。今も、フランスのコーパス研究には、ペシューの創始したデ
ィスコース分析の方法論が影響を及ぼしている。また、コーパス研究と政治と
の強いつながりもここに起源がある。
2.二つの代表的な研究
以下では、フランスで行われている代表的なコーパス研究である語彙研究と政
治ディスコース研究を、その歴史とともに紹介する。この二つの研究のジャン
ルは対照的ではあるが、意味に関心の中心がおかれたものであるという点は共
通している。
2.1. 語 彙 論 ・ 語 彙 意 味 論
フ ラ ン ス の 語 彙 研 究 の 最 も 重 要 な 成 果 は 、 辞 書 Trésor de la langue française (フ
ラ ン ス 語 宝 典 2 、以 下 TLF と 略 記 )と 、そ の 編 纂 の た め の デ ー タ ベ ー ス の Frantext
で あ る 。ま た 、重 要 な 役 割 を 果 た し て き た の は 、語 彙 計 量 学( lexicométrie)で あ
る。既述のとおり、フランスの言語学の関心の中心は常に意味の問題であった
が、語彙論はかつて意味論と同義であった。すなわち、意味論とは語彙の研究
であり、語彙論とは語の意味の研究であった。
4
2.1.1 Frantext と TLF
TLF 編 纂 の プ ロ ジ ェ ク ト が 始 ま っ た の は 1957 年 の こ と で あ る 。 Lexicologie et
lexicographie française et romanes : orientations et exigences actuelles [フ ラ ン ス 語
とロマンス諸語の語彙論と語彙記述:現代の動向と課題] という名の会議がス
ト ラ ス ブ ー ル で 開 か れ 、Oxford English Dictionary に 匹 敵 す る よ う な 辞 書 を 、新
しいテクノロジーを使った国家プロジェクトとして編纂することが決議され
た ( cf. Antoine, G. & B. Cerquiglini, 2000: 969)。 こ の 時 期 は コ ー パ ス 研 究 の 歴
史 に お い て き わ め て 重 要 な 時 期 で あ る 。 年 表 に 掲 げ た よ う に 、 1950-60 年 代 に
は 、 今 も 積 極 的 な 活 動 を 続 け る 研 究 所 、 雑 誌 、 学 会 が 続 々 と 設 立 さ れ た 。 TLF
の た め の 研 究 所 は 1960 年 に ナ ン シ ー に 作 ら れ 、 1963 年 に は 大 型 コ ン ピ ュ ー タ
が 稼 動 を 始 め て 、 の ち に Frantext と な る テ キ ス ト デ ー タ ベ ー ス が 執 筆 者 の た め
に 整 備 さ れ た 。 紙 媒 体 に よ る 出 版 は 1971 年 か ら ア ル フ ァ ベ ッ ト 順 に 始 ま り 、
1994 年 に 完 成 し た 。 そ の 後 、 電 子 版 の Trésor de la langue française informatisé
( TLFi)が 2001 年 に イ ン タ ー ネ ッ ト 上 に 全 面 無 料 公 開 さ れ た 。Frantext は 1992
年以来、大学や研究機関を対象に有料で公開されており、言語研究をはじめと
するさまざまな研究のために利用されている。
2.1.1.1. Frantext
http://atilf.atilf.fr/frantext.htm
Frantext は 、 16 世 紀 か ら 20 世 紀 の 間 の 4000 件 以 上 の 作 品 か ら な る 巨 大 な デ ー
タ ベ ー ス で あ る 3 。テ キ ス ト は 適 宜 追 加 さ れ 、規 模 は 拡 大 し 続 け て い る 。総 語 数
は 2 億 1000 万 語 を 越 え る 。コ ー パ ス は 使 用 者 が 研 究 目 的 に 合 わ せ て 自 分 で 構 成
することになっているので、コーパス言語学でいう「代表性」は考慮されてい
な い 。文 学 作 品 が 80% 、学 術 書 が 20% と い う 編 成 か ら わ か る よ う に 、フ ラ ン ス
を「代表する」評価の高い書かれたテキストのみからなり、メディアのテキス
ト や 商 業 的 印 刷 物 、 話 し 言 葉 は 含 ま れ て い な い 。 Frantext に は 二 つ の バ ー ジ ョ
ン が あ る 。 一 つ は 品 詞 解 析 が 施 さ れ た テ キ ス ト の 集 合 で 、 19 世 紀 か ら 20 世 紀
の 1940 作 品 か ら な る 。も う 一 つ は 品 詞 解 析 さ れ て い な い も の で 、Frantext の 全
体 に 対 応 す る 。 ア ク セ ス は ブ ラ ウ ザ 経 由 で 行 い 、 検 索 は Frantext 独 自 の 検 索 プ
ロ グ ラ ム に よ る 。 検 索 結 果 は 文 脈 ( 400 字 ) を 含 め て 一 括 し て ブ ラ ウ ザ か ら ダ
5
ウンロード可能である。
2.1.1.2. TLFi
TLF は 19-20 世 紀 の フ ラ ン ス 語 の 辞 書 で あ り 、 16 巻 と 補 遺 1 巻 か ら な る 。 見 出
し 語 は 10 万 語 、27 万 件 の 語 義 、43 万 の 例 文( Frantext か ら の 引 用 が ほ と ん ど )
か ら な る 。 単 語 の 語 義 分 析 、 語 源 、 歴 史 、 Frantext で の 頻 度 な ど が 充 実 し て い
て、それぞれの単語に関して通時的にも共時的にも十分な情報を得ることがで
き る 。語 の 意 味 の 構 造 的 部 分 (signification)と そ こ か ら 派 生 す る 多 様 性 (sens)の バ
ラ ン ス が 考 慮 さ れ て い る と い わ れ る 。TLFi は TLF の 電 子 版 で あ り 、360 万 個 の
XML タ グ が 施 さ れ 、辞 書 に 記 載 さ れ た 情 報 に 関 し て さ ま ざ ま な タ イ プ の 検 索 が
可能なように工夫されている。素晴らしい点は、ハイパーリンクによって、
Frantext や ア カ デ ミ ー フ ラ ン セ ー ズ の 辞 書 な ど の 外 部 の デ ー タ に 、 直 接 リ ン ク
していることである。ハイパーリンクをたどることによって、多くの例とその
コンテキストにシームレスでアクセスが可能である。
2.1.1.3.
語彙研究のための組織
フ ラ ン ス の 研 究 所 の 多 く は 文 系・理 系 を 問 わ ず 全 て の 分 野 に わ た っ て 、CNRS(=
フ ラ ン ス 国 立 科 学 研 究 セ ン タ ー )が 束 ね る 国 立 の 組 織 で あ る 。研 究 所 間 の 関 係 は
競争的ではなく協力的である。
z
Analyse et Traitement Informatique de la Langue Française – Computer
Processing and analysis of the French Language, http://www.atilf.fr
「 TLF の た め の 研 究 セ ン タ ー 」は 、
「 国 立 フ ラ ン ス 語 研 究 所 」を 経 て「 フ ラ ン ス
語の分析と情報処理研究所」と名前を変えたが、フランス語の語彙研究の中心
的存在として、種々の研究を行っている。
z
Centre National de Ressources Textuelles et Lexicales, http://www.cnrtl.fr/
Frantext の う ち 著 作 権 が 消 滅 し て い る 500 の テ キ ス ト( 18-20 世 紀 )を こ の サ イ
トからダウンロード可能である。また、それ以外のリンクも充実している。
z
Lexique 3, http://lexique.org/
135000 語 に 関 し て Frantext に お け る 頻 度 が 調 査 さ れ て い る 。
6
2.1.1.4.
Frantext を 使 っ た 言 語 研 究
Frantext は 現 代 フ ラ ン ス 語 の 共 時 的 研 究 を 行 う た め の 理 想 的 な コ ー パ ス で は な
いのは明らかである。直近の時代区分のテキストが少ないこと、ジャンルが文
学に偏っていることは欠点である。しかし、通辞的な研究のためのコーパスと
しては理想的といってよい。以下に二つの研究をあげる。
z
Schenedecker C. (2007) “fichu, foutu et maudit, dammé : de drôles d’adjectifs !”
Colloque « Adjectifs » 悪 態 語 が 形 容 詞 と し て 用 い ら れ て い く 通 時 的 過 程
( 19-20 世 紀 )と 、現 代 に お け る 語 の 意 味 お よ び 形 態 統 語 的 共 時 的 価 値 の 対
応 を 検 証 し た も の 。Frantext は 、第 1 に 用 例 検 索 の た め の ア ー カ イ ブ 、第 2
に 19・ 20 世 紀 の 変 化 を 見 る た め の コ ー パ ス と し て 用 い ら れ て い る 。
z
Fujimura, I, M.Uchida, & H.Nakao (2004) “De vs des devant les noms précédés
d'épithète en français : le problème de petit” Le Poids des mots vol 1, Presses
Universitaires de Louvain, p.456-467. 複 数 形 容 詞 + 複 数 名 詞 の 前 の 複 数 不 定
冠 詞 の des と de の 交 代 の 問 題 を 扱 う 。Frantext か ら 、ジ ャ ン ル 別( 学 術 書 、
小 説 )、時 代 別 の コ ー パ ス を 構 成 し 、ジ ャ ン ル と 時 代 に 関 わ ら ず 、同 一 の 原
理による選択が行われていることを計量的に示した。
2.1.2. Lexicométrie 語 彙 計 量 学
TLF の プ ロ ジ ェ ク ト が 開 始 し た 1950-60 年 代 は 、 フ ラ ン ス の 語 彙 計 量 学 の 開 始
の時代である。この当時に考案され、今なお世界のコーパス研究において用い
られている二つの計量的方法を以下に挙げる。
ま ず 、Guiraud Index 4 で あ る 。Guiraud Index は テ キ ス ト の 語 彙 の 多 様 性 を 計 る 指
標 の 一 つ で あ る が 、 TTR と 比 べ て 、 テ キ ス ト の サ イ ズ に よ る ぶ れ が 少 な い と い
う点が評価され、今、注目されている。
Guiraud Index : Type ÷( Token の 平 方 根 ) (cf. TTR : Type ÷ Token)
ギローはフランスの著名な言語学者であり、その著作は、クセジュ文庫のシリ
ー ズ の 中 に 『 意 味 論 』、『 文 法 』、『 フ ラ ン ス 詩 法 』、『 記 号 学 : 意 味 作 用 と コ ミ ュ
ニケイション』などとして日本に紹介されているが、最も重要な二つの業績は
知 ら れ て い な い 。一 つ は 上 記 の 言 語 統 計 学 の 業 績 で あ り 、Guiraud (1954)に お い
て 発 表 さ れ た 。も う ひ と つ は 、1978 年 に 初 版 が 発 行 さ れ た Dictionnaire érotique
7
[エ ロ テ ィ ッ ク な 辞 書 ]で あ る 。こ れ は 中 世 か ら 現 代 ま で の 7000 の 性 的 な 語 と 表
現 の 辞 書 で あ り 、 600 ペ ー ジ を 超 え る 大 著 で あ る 。 ま さ に 語 彙 研 究 の 成 果 で あ
るといえる。
フランスに起源のある語彙計量学の貢献として忘れてならないもう一つの業績
は 、Benzécri の 対 応 分 析( コ レ ス ポ ン デ ン ス 分 析 )で あ る 。対 応 分 析 も Guiraud
Index と 同 時 代 の 1962 年 ご ろ に 生 ま れ た 。フ ラ ン ス で は よ く 使 わ れ て き た 方 法
である。
2.2.
政治的ディスクール研究:言語学の一分野
フランスに特徴的な2番目のコーパス研究として、政治ディスクールの研究を
挙 げ る 5 。 フ ラ ン ス の デ ィ ス コ ー ス 分 析 の 創 始 者 の ペ シ ュ ー は 1967 に 研 究 所
Lexicométrie et textes politiques[ 語 彙 計 量 学 と 政 治 的 テ キ ス ト ] を ENS
Fontenay/Saint-Cloud( 高 等 師 範 学 校 フ ォ ン ト ネ ー ・ サ ン ク ル ー 校 ) に 設 立 し 、
以来、ここがフランスの政治的ディスクール分析の中心となる。計量的方法と
政治性がフランスのディスクール分析一般の特徴であるといわれている。
第 一 人 者 で あ る マ ン グ ノ ー ( Mangueneau) は 次 の よ う に 、 コ ー パ ス と コ ン ピ ュ
ータを使った計量的方法の、フランスにおける意味を語っている。
In France, discourse analysis has always been in a symbiotic relationship with
information technology.
Today, discourse analysts dispose of a whole array of
programs in order to scan corpuses, test hypotheses or construct new ones.
The
constant growth of all sorts (data, bibliographies, software) on the Internet
considerably changes the way research is done.
clam exhaustiveness.
Those working on archives can
Thus, notions like “representative sample” get profoundly
transformed, and discourse analysis participates in the remarkable development of
“corpus linguistics”, which investigates enormous masses of data.
(Mangueneau, D.
& J. Angermüler (2007))
政治的ディスクールの研究は典型的なコーパス研究である。なぜなら、政治的
ディスクール分析の研究対象は完結したテキストの集合としてのコーパスだか
らである。しかし、ディスクールは実際の社会の中に存在して初めて意味をも
8
つので、現実の社会もコンテキストして分析の対象に入る。したがって、政治
ディスクールの分析は、言語学と社会科学の交差する場所に位置する応用科学
である。
政治と日常の乖離が少ないフランスの社会においては、一般の人々は政治的デ
ィスコースの分析に関心がある。インターネット上には、政治家のディスクー
ル を 論 じ た サ イ ト が 山 の よ う に あ り 6 、 2007 年 5 月 の 大 統 領 選 挙 中 に は 、 サ ル
コジ候補とロワイヤル候補のディスクールが種々の分析の対象となった。たと
え ば 、 サ ル コ ジ は identité (= identity), ロ ワ イ ヤ ル は sécurité (=security)が キ ー
ワ ー ド で あ り 、 3-gram と し て は 、 サ ル コ ジ は “je veux que (I want that)”, “je veux
être (I want to be)” , “parce que je (because I)”,
“je veux dire (I want to say)”が 多
く 、 ロ ワ イ ヤ ル は “une France qui (France which)”, “la lutte contre (the fight
against)”, “je vous propose (I propose you)”が 多 か っ た 7 。 自 己 ア ピ ー ル の 強 さ に
おいて、二人の間に差があったことがわかる。
以下ではこの分野の研究活動や成果を挙げる。
z
学 術 誌 Mots: les langages du politique
[語 : 政 治 的 な 種 々 の 言 語 活 動 ]は 、
1980 年 に 政 治 的 語 彙 の 計 量 的 研 究 の た め に 創 刊 さ れ た 雑 誌 。
z
雑 誌 の 特 集 号 Corpus No4, 2005 , 特 集 Les corpus politiques : objet, méthode
et contenu, [政 治 コ ー パ ス : 対 象 、 方 法 、 内 容 ]
http://corpus.revues.org/document292.html。
z
書 籍 Le discours gouvernemental. Canada, Québec, France (1945-2000) [政 府 の
デ ィ ス ク ー ル 。 カ ナ ダ 、 ケ ベ ッ ク 、 フ ラ ン ス ( 1945-2000)]. Labbé, D.& D.
Monière. (2003). Paris :Champion.
カナダ政府、ケベック州政府、フランス政府による所信表明演説の計量的
比 較 分 析 。 55 年 間 の 演 説 が 対 象 と な っ て い る 。
z
書 籍
Paroles de président. Jacques Chirac (1995-2003) et le discours
présidentiel sous la V e République [ 大 統 領 の こ と ば : ジ ャ ッ ク ・ シ ラ ク
(1995-2003)と 第 五 共 和 制 大 統 領 の デ ィ ス ク ー ル ], Mayaffre, D. 2004. Paris :
Champion.
z
ウ ェ ブ サ イ ト PoliText : Base de données de discours politiques française
9
(1789-2002) [ 政 治 テ キ ス ト : フ ラ ン ス の 政 治 デ ィ ス ク ー ル デ ー タ ベ ー ス
(1789-2002) ]
http://www.unice.fr/ILF-CNRS/politext/. 政 治 家 の デ ィ ス ク ー
ル の デ ー タ ベ ー ス 。約 200 万 語 、600 件 か ら な り 、議 会 で の 演 説 、テ レ ビ や
ラジオのインタビュー、講演、雑誌でのインタビュー記事などを含む。
z
書籍
Encrevé, P., La liaison avec et sans enchaînement, Seuil, 1988.
Encrevé は シ ラ ク や ミ ッ テ ラ ン な ど の 政 治 家 の 演 説 を 音 声 面 か ら 研 究 し て 、
ア ン シ ェ ヌ マ ン 抜 き の リ エ ゾ ン と い う 現 象 の 政 治 的 意 味 を 分 析 し た 8。
3.
ラングの言語学とパロールの言語学を結ぶものとしてのコーパスの価値
フランスにおけるコーパス研究の特徴を再度まとめると以下のようになる。
1.
コ ー パ ス 言 語 学 ( linguistique de corpus) と は 、 テ キ ス ト の 集 合
と し て の コ ー パ ス の 言 語 的 研 究 で あ る と い う こ と 。「 言 語 的 」 と い う 語
は 広 く と ら え ら れ 、デ ィ ス コ ー ス 分 析 や 文 学 研 究 も 含 ま れ る 。コ ー パ ス
はツールではなく、コーパスそれ自体が研究対象である。
2.
意味論研究が中心にあること。テキストやディスクールの意味
がどのようにして生成するかという問題が言語学の関心の中心であり、
テキストの構成単位である語の意味とテキストにおける分布が研究さ
れてきた。
3.
計量的・機械的研究方法に対するアレルギーの不在とフランス
的 難 解 さ の 融 和 。人 文 系 の 研 究 者 に 自 然 科 学 的 方 法 に 対 す る 不 信 感 が 少
ないことは注目すべきである。ペシューの『ディスクールの自動分析』
に お い て 、言 語 学 者 の 仕 事 は 、第 一 に コ ー パ ス の 構 築 、第 二 に 結 果 の 解
釈であるとされている。この二つの間にデータの処理と解析があるが、
そ れ は 言 語 学 者 の 仕 事 で は な く 、自 然 科 学 者 の 仕 事 で あ る 。言 語 学 者 自
身 が 情 報 工 学 や 統 計 学 の 知 識 を 持 つ こ と は 少 な く 、分 業 体 制 に な っ て い
る 。デ ー タ の 解 析 の み に は 価 値 が 認 め ら れ ず 、準 備 と 解 釈 を 入 念 を 行 わ
ね ば な ら な い と い う 点 は 見 習 う べ き で あ ろ う 。一 方 で 、解 釈 が 飛 躍 に つ
ながる場合もあり、それは問題点である。
最後に、これまでに述べてきたフランス的文脈において、コーパス研究は一般
10
言 語 学 に 対 し て ど の よ う な 貢 献 が で き る と 考 え ら れ る か を Rastier (2002)か ら
引用しつつ検討する。
Rastier に よ る と 、 コ ー パ ス は ラ ン グ と パ ロ ー ル を つ な ぐ も の と し て の 規 範
(Norms)の 観 察 を 可 能 に す る 9 。 コ ー パ ス 研 究 は 実 際 の 言 語 使 用 を デ ー タ と す る
ので、パロールが研究の対象とする。しかし、パロールは無限で雑多なもので
あり、パロールをいくら多量に集めて分析しても、ラングとはどのようなもの
か、また、個別の言語はどのような言語かということに解答を与えることはで
きない。一方で、ラングとパロールの区別は、理論的には十分に認知されてい
るにせよ、その二つがどのように接合するのかという問題は理論的にも実証的
にも未解決のままである。ソシュールのラングとパロールの対立は、アリスト
テレスの可能態と現実態、フンボルトのエネルゲィアとエルゴン、チョムスキ
ー の competence と performance に 対 応 す る と 考 え ら れ る が 、 ど の よ う に 言 い 換
えたところで未解決である点に変わりはない。
コ ー パ ス 言 語 学 は 、 体 系 ( ラ ン グ に 相 当 ) と パ ロ ー ル の 中 間 に コ セ リ ウ ( E.
Coseriu) が 設 定 し た 、規 範 を 対 象 に す る 言 語 学 で あ る と Rastier は い う 。規 範 の
言語学は、ラングの言語学とパロールの言語学の間にあり、規範の領域は、以
下 の 図 の よ う に ラ ン グ と パ ロ ー ル の 軸 の 狭 間 に あ る ( Rastier 2002)。 規 範 は ラ
ングによって定められるのではなく、テキストの属する分野やジャンルごとに
定められている。したがって、規範は社会的な存在である。たとえば、文学テ
キストと法学のテキストの規範は異なるし、同じ文学テキストでも、小説と演
劇の規範は同じでない。また、紀行文と推理小説の規範も同じではない。しか
し、ラングは規範と無関係であるわけはない。ラングの規則は規範が凝結した
も の だ か ら で あ る 。ま た 、パ ロ ー ル の 実 践 に 規 範 性 が あ る こ と は 明 ら か で あ る 。
パロールは、ラングの規則と、社会的規範に順応して実践される。
11
規範の領域
langue の 軸
(範列)
デイスクールやジャンル
のタイプ
parole の 軸( 連 辞 )
図 :「 規 範 」 の 言 語 学 の 領 域 1 0
Rastier は 、書 か れ た テ キ ス ト だ け を 取 り 上 げ て い る が 、テ キ ス ト ジ ャ ン ル に 代
えて地理的方言や社会的方言、時間軸などを規範の領域に置き、それぞれの規
範を研究対象とする学問としてコーパス言語学をとらえるなら、コーパス言語
学 を 一 般 言 語 学 の 全 体 的 な 枠 組 み の 中 に 位 置 づ け る の が 容 易 に な る 。そ の と き 、
「規範」は「規則性」ということばで言い換えることも可能と思われる。
【参考文献】
コ セ リ ウ 、エ ウ ジ ェ ニ オ
(1981)『 う つ り ゆ く こ そ こ と ば な れ:サ ン ク ロ ニ ー ・
ディアクロニー・ヒストリア』クロノス社.
藤 村 逸 子 ・ 内 田 充 美 (2003)「 情 報 フ ァ イ ル : オ ン ラ イ ン デ ー タ ベ ー ス -Frantext,
WordbanksOnline, TLFi-」『 フ ラ ン ス 語 学 研 究 』 37: pp.87-93.
(URL : http://www.gsid.nagoya-u.ac.jp/fujimura/gyoseki/johofile.pdf)
Antoine, G. & B. Cerquiglini, (2000) Histoire de la langue française, : 1945-2000,
CNRS Éditions.
Benzécri, J. & F. Benzécri (1981) Pratique de l’analyse des données. Paris : Dunod.
Condamines, A. (dir.) (2005) Sémantique et corpus. Paris : Lavoisier.
Fujimura, I, M.Uchida & H. Nakao (2004) “De vs des devant les noms précédés
d'épithète en français : le problème de petit” Le Poids des mots vol 1,
Louvain : Presses Universitaires de Louvain. pp. 456-467.
12
Guiraud, P. (1954) Les caractères statistiques du vocabulaire. Paris : P.U.F.
Guiraud,
P.(1978)
Dictionnaire
érotique
(Dictionnaire
historique,
stylistique,
rhétorique, étymologique, de la littérature érotique). Paris : Payot.
Habert, B., A. Nazarenko & A. Salem (1997) Les linguistiques de corpus. Paris :
Almand Colin.
Hak, T. & N. Helsloot (eds) (1995) Michel Pêcheux. Automatic Discourse Analysis.
Amsterdam : Rodopi.
Léon, J. (2001)
“Conceptions du ‘mot’ et débuts de la traduction automatique,”,
Histoire Épistémologie. Langage 23-1; 81-105.
Mangueneau, D. & J. Angermüler (2007)
"Discourse Analysis in France.
A
Conversation." Forum qualitative Sozialforschung/ Forum : Qualitative Social
Research, 8(2)Art.21, [Online].
URL: http://www.qualitative-research.net/fqs-texte/2-07/07-2-21-e.htm.
Rastier, F. (2002) Enjeux épistémologiques de la linguistique de corpus, in G.
Williams (éd.) (2005) La linguistique de corpus. Rennes : PUR, pp. 31-45. [En
ligne
sur
Texto
!
(URL :
http://www.revue-texto.net/Inedits
/Rastier/
Rastier_Enjeux.html)].
【年表】
1954: 機 械 を 使 っ た 語 彙 研 究 、 自 動 翻 訳 研 究 の 開 始 。 ア メ リ カ 、 イ ギ リ ス よ
り 10 年 ほ ど 遅 れ る 。
1954: Guiraud P. Les caractères statistiques du vocabulaire
[ギ ロ ー 、『 語 彙 の
統 計 的 特 徴 』 ]の 出 版 。
1957: 会 議 Lexicologie et lexicographie française et romanes : orientations et
exigences actuelles [フ ラ ン ス 語 と ロ マ ン ス 諸 語 の 語 彙 論 と 語 彙 記 述:現 代
の動向と課題] の開催。
1959: 雑 誌 Cahiers de lexicologie
[語 彙 論 ノ ー ト ]の 創 刊 。
1959: 研 究 所 Laboratoire d’analyse lexicologique [語 彙 分 析 研 究 所 ] が ブ ザ ン
ソン大学に創設され、語彙の計量研究の中心地となる。
1959 : 学 会 Association pour l’étude et le développement de la Traduction
13
Automatique et de la Linguistique Appliquée
( ATALA) [自 動 翻 訳 と 応 用
言 語 学 の 研 究 と 開 発 の た め の 学 会 ]の 設 立 。
1960: 研 究 所 Centre de recherche pour un Trésor de la Langue Française [TLF の
ための研究センター] がナンシーに設立。
1960:雑 誌 TAL( Traitement automatique des langues) [言 語 の 自 動 処 理 ]の 創 刊 。
1962: 雑 誌 Etudes de Linguistique Appliquée [応 用 言 語 学 研 究 ]創 刊 。
1963: ナ ン シ ー の 研 究 所 に お い て コ ン ピ ュ ー タ Gamma 60 Bull の 使 用 開 始 。
Trésor de la langue française 編 纂 の た め の デ ー タ ベ ー ス の 構 築 と 処 理 の 開
始。
1964:会 議 Statistique et analyse linguistique
[統 計 学 と 言 語 分 析 ]。 多 数 の 重
要な言語学者が参加。
1967: 研 究 所 Lexicométrie et textes politiques [語 彙 計 量 学 と 政 治 的 テ キ ス ト ]
の創設。
1969: Pêcheux, M., Analyse automatique du discours, Dunod [ペ シ ュ ー 、『 デ ィ
ス ク ー ル の 自 動 分 析 』 ]の 出 版 。
1969:Faucault, M., L’Archéologie du savoir, [フ ー コ ー『 知 の 考 古 学 』]の 出 版 。
1971-1993: Trésor de la langue française の 紙 媒 体 に よ る 出 版 。
1977: Nancy の 研 究 所 が 改 名 Institut national de la langue française [国 立 フ ラ
ン ス 語 研 究 所 ]。
1996: デ ー タ ベ ー ス Frantext が イ ン タ ー ネ ッ ト 上 で 有 料 公 開 開 始 。
2001: オ ン ラ イ ン 辞 書 Trésor de la langue française informatisé の 完 成 。 イ ン
ターネット上で無料公開。
2001: Nancy の 研 究 所 が 再 び 改 名 : Analyse et traitement informatique de la
langue française
[フ ラ ン ス 語 の 分 析 と 情 報 処 理 ]
2005: 研 究 所 Centre National de Ressources Textuelles et Lexicales[テ キ ス ト と
語 彙 デ ー タ 国 立 研 究 所 ]の 創 設 。 Frantext の う ち 著 作 権 が 消 滅 し た テ キ ス
ト 500 を 無 料 公 開 。
現在:中世フランス語の電子辞書のプロジェクトなど
14
1
Harris, Z. (1952) “Discourse analysis”, Language, 28, 1-30 か ら 大 き な 影 響 を 受
け た と い わ れ て い る 。Hak, T. & N. Helsloot (eds) (1995)に お い て 英 訳 を 読 む こ と
ができる。
2
こ の 名 称 は 17 世 紀 の フ ラ ン ス 語 辞 書 : Trésor de la langue francoyse, tant anc
iennne que moderne, Jean Nicot (1606) が 起 源 で あ る 。
3
Frantext の 詳 細 に つ い て は 、 藤 村 、 内 田 ( 2003)を 参 照 さ れ た い 。 最 近 で は 、
個人単位のパスワード方式の利用も可能である。
4
Guiraud Index と い う の は 後 に な っ て 付 け ら れ た 名 称 で あ り 、 本 人 が そ の よ
うに呼んだわけではない。
5
デ ィ ス ク ー ル ( = discours)と い う 語 の フ ラ ン ス 語 に お け る 基 本 的 意 味 は 「 演
説 、ス ピ ー チ 」で あ る 。デ ィ ス ク ー ル に は 、英 語 の discourse に 対 応 す る 言 語 学
の用語としての意味も存在し、ディスクール分析は「演説分析」に限られると
いうわけでは決してないが、
「 デ イ ス ク ー ル 」と「 政 治 」の 深 い 関 係 は 語 源 に さ
かのぼると思われる。
6
た と え ば パ リ 第 3 大 学 の TAL の サ イ ト を 参 照 の こ と 。
http://tal.univ-paris3.fr/blogtal/
7
http://members.unine.ch/jacques.savy/Papers/Royal-Sarkozy.html
8
ア ン シ ェ ヌ マ ン の な い リ エ ゾ ン と は 、例 え ば Il faut en être (そ う で な け れ ば な
ら な い ) の 場 合 に 、 faut の 語 末 子 音 を 発 音 す る に も 関 わ ら ず 次 の 母 音 と の 間 に
ア ン シ ェ ヌ マ ン が 起 こ ら ず [ilfotʔəãnɛtʁ]の よ う に 声 門 閉 鎖 が 挿 入 さ れ る こ と を
い う 。 Encrevé は Chomsky & Halle の The Sound Pattern of English を 仏 訳 し た 音
韻論学者である。
9
コ セ リ ウ ( 1981)参 照 。
10
Rastier (2002)よ り 。
15